うーん、ほんとに理由がわかったんだろうか??
なんとなく不安??
ここのニュース
OS初期化、遅れた決断 検証・NTTのIP電話障害
http://www.asahi.com/business/topics/TKY200611260076.html
では、9月におきたNTT東、10月におきたNTT西のIP電話障害の話をまとめているんだけど(11月になって ^^;)
この記事では、(以下斜体は上記記事より引用)
最終的に完全復旧できた決め手は、サーバーの基本ソフト(OS)の初期化だった。パソコンに例えるならウインドウズOSを入れ直すようなものだ。そこまでやろうという判断が遅れた。
って書いてあって、まるで、OSの初期化が決め手みたいな記事になっているけど。。
ふつう、OSの初期化って、理由がわかんないから、とりあえずやってみる処理で(スラッシングがおきたり、メモリリークで資源が食いつぶされたとき、ページングやファイルシステムがおかしくなって、ファイルの管理領域を上書きしちゃったときなど)、それで戻ればラッキーっていう感じのものでしかないと思うけど。。
これ、一般のネットワーク管理者が、ルーターのスイッチを入れなおして初期化すると直るから、これが、決定打のように思う人がいるかもしれないけど、この場合、本当になにが原因で、どーなったのかは管理者はわかってないで、初期化してる場合がおおい(っていうか、わかれ!っていうほうがむりだ。自分がそのルーター作ってるわけじゃないから ^^;)
だからこそ、その後のNTT西の障害では
OS初期化を初日から始めた。全面復旧まで3日かかったが
というように、初期化でも結局ダメで、
NTT西の障害は、電話番号をもとにサーバーを特定する「電話帳」のような役割の「呼処理サーバー」で起きていた。
ってことになったときに
森下俊三社長は10月27日の謝罪会見で「予想がつかないことが起きた。人知を超えることだと考えている」と語った。
んだとおもうよ。。
うーん、でも、「初期化が決定打」なんて朝日にかかれちゃって。。。
そんなんで、大丈夫なのかああ??
P.S そもそも、ソフトが原因って、決め付けてるけど、これって、ネットワークトポロジーの問題ってことはないの?呼処理サーバーの負荷が、ある状況で高くなるような構成になっているとか。。
あと、ひょっとして、東のほうは、スラッシングだとしたら、なんか、優先順位とか、パケットの出方が、想定と違うっていう話で、これも一概にソフトと言えないし。。
ソフトって決め付けちゃうのは、これだけの情報だと、危険な気もするけどなあ。。
