ITの世界は難しい!? - バグ/障害はどうして起きるのか
昨日やっと障害から完全に復旧したと思っていたら、本日は思わぬところから二次災害。
障害はどうして起こるのか!?
ITの世界ではバグや障害が常につきもの。1つ1つを取り上げると、「どうしてチェックしていなかったのか」「どうしてそんな簡単なことに気がつけなかったのか?」と感じられるようなことがたくさんある。
が、それでもパソコンも、ソフトウェアも、スマホもスマホアプリも色々とバグは発生する。
どうして、バグを未然に防ぐのが難しいのかを考えてみた。
- 人間の頭で「当たり前」と思っていることを正確に書き下すのは、実際にはすごく大変(たくさんのパターン/組み合わせを考慮する必要がある)
- 昔と異なり1社が全ての技術を提供する訳ではなく製品同士を組み合わせる形のために、組み合わせのパターンがたくさんある/検証が追いつかない
- 色々なところにトレードオフの関係がある(ログは詳細に取りたい/詳細に取り過ぎると容量を逼迫する・重くなる)がそのバランスが崩れる箇所が発生する
大きくは「場合分け/パターン/組み合わせのボリュームが多すぎて全てを考慮しきれない」というのと「トレードオフ関係がそこかしこで発生しており、どちらかに針が触れすぎてしまう」というのがありそう。
それにしても個別の事象を取り上げると、素人が聞いても「なんでそんなことが出来てないの?」と感じることがたくさんあるので、いつもユーザさんからはどえらく怒られたりする。
なかなかにIT業界は苦労も多い業界だなぁ、と。(その分やり甲斐もあるんですが!)