約2か月前(2015/05)、弊社が納めたサーバ機にて致命的な不具合が発生した経験を記載します。
お客様固有のトラブルかと思っていたのですが、特定ハードウェア利用時におけるWindowsUpdate不具合とわかりましたので、同じ困難に直面するかもしれない誰かのために記録させていただきます。
おそらく、Windows Server2012 R2 Update (KB2919355) が含む問題です。
----
1.環境
障害発生日時:2015/05/25
機体:
DELL製サーバ専用機 PowerEdge T110 II(2)
・RAIDボードに「Dell H200 PERC コントローラー」を搭載
・HDD 4個でRAID-10を構成
OS:Windows Server 2012 R2
機体納品:2015/01/04
2.障害状況
2015年4月分及び5月分の月例WindowsUpdateを手動で実施。
適用完了の画面にて[再起動]をしたところ、下記画面表示がでて、再起動を繰り返すようになった。
「問題が発生したため、PCを再起動する必要があります。
エラー情報を収集しています。再起動できます(・・%完了)
詳細については、次のエラーを後からオンラインで検索してください:INACCESSIBLE_BOOT_DEVICE」
3.当時の対応
いろいろなサイト等を調べました。
ハード故障を疑いハードの自己診断を行っても問題なし。
DELLプロサポートに電話で支援を依頼しても、何の情報もなし。
WindowsUpdateでBUGのあるパッチの適用を疑い、インストール媒体からのCDブートし、システム修復でコマンドプロンプトを開き、DISMコマンドを色々試すも改善無し。
参考サイト:DISM を使ってパッケージをオフラインで追加または削除する
絶望感に頭をかきむしりました。
幸か不幸か、 Acronis Backup Version 11.5で、毎日の自動バックアップを行っています。
(完全バックアップ(4/18)、以後は増分バックアップ30日分設定)
リカバリに3時間かけて2日前に戻してみる。
・・・だめ! 同現象が発生!
仕方ない!
約一か月前(4/18)の完全バックアップ時点に戻しだ!
・・・またもリカバリに3時間、
・・・起動成功!
ふーーー
怖いけど、やらないわけにはいかないWindowsUpdate。
1時間ほどかけて実施。
どきどきしながら再起動!
・・・起動成功!
ふぅーーー
念のため、もう一度再起動!!
よし!
幸い、ユーザデータの損失は軽微。
ウィルスバスターコーポレートエディションVer.11.0が動作異常。
これは多分、Trendmicroサーバとの更新の同期で新旧の矛盾が生じたのかもしれない。
時間に余裕ができたら、ウィルスバスターコーポレートエディションの再インストールで対応の予定。
4.終わりに。
今回のトラブル、要点をまとめるなら、
WindowsUpdateで一部製品のSASデバイスドライバがおかしくなるから、
KB2919355を適用する前に、KB2919442とKB2966870を必ず適用してください。
です。
WindowsUpdateにまかせるのも危険とは参ったもんです。
補足として、KB2919355は以後のWindowsUpdateの為に必須のくせに、手動適用をする際には、関連パッチを含め下記手順で適用が必要なようです。
clearcompressionflag.exe
KB2919355
KB2932046
KB2959977
KB2937592
KB2938439
KB2934018
・
・
めんどいですね。
・
・
本記事ではあえて、苦労日記として紹介しておりますが、正式な対処情報を求める方は、下記サイトが参考になると思います。
Rem System Co.,Ltd.
Windows Update後に2012 R2 が再起動を繰り返す不具合の原因と対応
Microsoftサポート
Windows 8.1 または Windows Server 2012 R2 2919355 の更新プログラム ロールアップのインストール後に再起動の問題を修正します。
日立サポートサイト Windows Server® 2012 R2を購入する前に
中段あたり「Windows Server2012 R2 Update(KB2919355)について」の記事
今回の現象、発生してしまったら簡単な解決法はありません!
「運任せ」もしくは「あきらめて再セットアップ」という最悪のケースを覚悟して下さい。
WindowsUpdate前もしくは正常に起動終了ができるタイミングで、OS含めリカバリーできるバックアップ環境を構築していないと、かなり悲しいことになりますよ。