私の思いと技術的覚え書き

歴史小説、映画、乗り物系全般、事故の分析好きのエンジニアの放言ブログです。

世界中で発生、Windows「画面が真っ青」の原因、850万台に及ぶ過去最大のシステム障害はなぜ起きたか

2024-07-23 | コラム
世界中で発生、Windows「画面が真っ青」の原因、850万台に及ぶ過去最大のシステム障害はなぜ起きたか
7/22(月) 18:01配信 東洋経済オンライン

飛行機のフライトが中断され、ユニバーサル・スタジオ・ジャパンも窓口でのチケットの販売を一時中止するなど広範囲に影響が及んでいる世界規模のコンピューター障害。なぜこのような大問題が発生したのだろうか。

7月19日、世界中の、主に業務システムに使われているWindowsコンピューターで画面が真っ青になるエラーが発生し、世の中を大混乱に陥れた。この問題は、コンピューターの歴史において過去最大と言われるまでに影響範囲が拡大している。

■まだ回復できていないサービスも

世界中のコンピューターで最も多く使用されている基本ソフトウェア(オペレーティングシステム。OSと略される)であるWindowsは、OSとしての機能続行ができないほどの障害が発生したときに、青い背景に白字でエラーに関する情報を表示するBSoDとよばれる画面を表示して、機能を停止するようになっている。

BSoDは「Blue Screen of Death」の頭文字を取った略称で、直訳すると「死の青画面」となる。日本では単に「ブルースクリーン」と呼ばれることが多いこの画面の本来の役割は、開発者に対し、発生した不具合に関する情報を表示することだ。

今回、世界中で発生したBSoDの問題は非常に広範囲に及んでおり、空港を含む各種交通機関や医療機関、金融機関、スターバックスなどの飲食店、さらに、日本国内ではテーマパークのユニバーサル・スタジオ・ジャパンなどもその影響を受けた。BSoDが発生した企業や組織は一時的にサービス提供や各種業務を中断せざるをえない状況になり、記事執筆時点(7月21日)においても、まだ問題から回復できていないシステムやサービスもあるようだ。

■コンピューターウイルスではない

コンピューターに障害が起きる原因は多々あるが、そのひとつには、コンピューターウイルスなど不正プログラムの侵入が挙げられる。最近では、悪意ある者がコンピューターの脆弱性を突いて企業や各種機関に不正プログラムを侵入させ、その組織内のコンピューターを一斉に暗号化、ロックがかかった状態にしてしてしまい、困り果てたターゲット企業に解除キーを購入させようとする、ランサムウェア(身代金要求ソフトウェア)の被害が拡大している。

しかし、7月19日に世界中で一斉に業務システムにBSoDを引き起こしたのはランサムウェアではなく、問題を引き起こすコンピューターウイルスなどの侵入を防止するために導入されている、企業向けのセキュリティソフトウェアで発生した不具合が原因であることがわかっている。

問題となったのはクラウドストライク(CrowdStrike)社のセキュリティ対策ソフトウェア『Falcon プラットフォーム』のWindows版だ。このソフトは「Falcon Sensor」と称するプログラムを用いて、組織内のネットワークに接続されているコンピューター端末の状態を収集・監視し、ウイルスやサイバー攻撃とみられる不審な挙動を検知したときに、管理下にあるコンピューターを保護する機能を提供する。

コンピューターウイルスは、日々新しいものが作り出されており、人々に知られていない未知の脆弱性を突いてシステムに侵入を試みることが多い。そのため、セキュリティ対策ソフトウェアも定期的にウイルスなどの情報を更新して提供することで、つねに最善の対策環境を維持する。ところが、7月19日の朝(日本時間)にクラウドストライクが配信したアップデートファイルには「Falcon Sensor」に関する重大な欠陥が含まれており、これを適用したシステムが実行不可能になる不具合を引き起こした結果、人々が呆然とBSoDを眺める状況を作り出した。

インターネット上の各種サービスの稼働状況を伝えるウェブサイトDowndetector.comでは、日本時間19日午前8時40分前後から、Microsoft Storeや業務向けのMicrosoft 365サービスについての問題が報告され始めた。また、その約1時間後にはマイクロソフトもこの問題を認識していることをX (旧Twitter)で報告した。

また、マイクロソフトのステータスページでは、業務用クラウドサービスであるMicrosoft Azureが影響を受けているとし「クラウドストライク Falconエージェントを実行しているWindowsクライアントおよびWindows Serverを実行中の仮想マシンに影響する問題が確認されており、バグチェック画面(BSoD)が発生し、再起動中の状態でシステムが停止してしまう可能性がある」と記載されていた。

■クラウドストライクの説明は?

クラウドストライクのジョージ・カーツCEOは、日本時間7月19日午後6時45分に、この問題に関して「これはセキュリティに関する問題やサイバー攻撃ではない。すでに問題は特定・分離され、修正プログラムを配布している」とXを通じて発表した。

また、同社のブログにもより詳しい情報を提供しつつ、ユーザー企業に対し「悪意のある人たちがこのような事象を悪用しようとする」可能性があるため警戒を怠らず、クラウドストライクの「正規の担当者」と連絡を取り合うよう呼びかけた。

これは、問題がクラウドストライクのソフトウェアによるものだとの報道が報じられるなかで、顧客企業に対してクラウドストライクのスタッフになりすました人物から電話がかかってきたり、セキュリティの専門家を自称する人物が、サイバー攻撃に狙われている証拠があると主張してコンタクトを取ってくる事例が報告されるようになってきたからだ。

中には、今回発生した問題を自動的に修復するスクリプト(プログラムコードの一種)を有償で提供すると持ちかけるものさえあるとのことだ。もちろん、そんな出所不明のスクリプトを適用して、その結果コンピューターウイルスやランサムウェアを仕込まれたりすれば、目も当てられない惨事になりかねないので、うかつに信用してはいけない。

一方、Windowsを提供するマイクロソフトのサティア・ナデラCEOも、日本時間7月20日午前1時ごろに「我々はこの問題を認識しており、クラウドストライクおよび業界全体と緊密に協力し、顧客のシステムを安全にオンラインに戻すための技術的なガイダンスとサポートを提供している」と述べた。

■シェアの高さが仇に

クラウドストライクFalcon SensorにはMac版やLinux版もあるが、今回の問題はWindows版に提供されたアップデートファイルに問題が含まれていたことで発生した。本来なら、コンピューターウイルスなどの悪意あるソフトウェアがシステムに侵入することで引き起こす不具合を、その対策ソフトウェアが引き起こしてしまったというのは皮肉な話だ。

これほどまでに広範囲に影響が及んだのは、クラウドストライクがこの分野で最も人気の高いソフトウェアだったからでもある。IT専門の調査会社IDCが2023年2月に発表したレポートによれば、コンピューターシステム端末用セキュリティ対策ソフトウェアの市場シェアは、クラウドストライクが17.7%を占めている。これは、マイクロソフトが自社で提供するソリューションの16.4%を抑える、首位の成績だ。

すでに問題を修正しシステムを再び正常に戻す方法は公開されており、今後この問題は終息に向かうはずだ。また、クラウドストライクは問題に遭遇した顧客に対し、システムを修復するための対策ガイダンスなどを提供する情報ハブとなるページを新たに作成、同社ウェブサイト上に公開した。

マイクロソフトは、約850万台のWindowsコンピューターがクラウドストライクの障害により影響を受けたと発表した。この数字は全世界で稼働するWindowsコンピューターの約1%未満だとされている。マイクロソフトのエンタープライズおよびOSセキュリティ担当副社長デビッド・ウェストン氏は「(影響を受けたデバイスの)割合こそ小さいものの、多くの重要なサービスを運営する企業がクラウドストライクを使用していることが、広範囲にわたる経済的、社会的影響を反映した」と述べた。

では、企業や組織の情報システム管理者の立場から、このようなシステム障害が再び起こるのを避けるにはどうすればいいだろうか。

考えられる方法としては、定期的なソフトウェアのアップデートを段階的に適用することが挙げられる。この方法はまず最初に、一部の影響の少ない端末にのみアップデートを導入し、たとえば24時間なり、ある程度様子を見る時間を経てから、他の端末にもアップデート作業を展開するやり方だ。

この方法が適用可能か、また妥当か否かは個々のシステムで事情が異なるはずなので前もって検討が必要だが、これならアップデートに欠陥があったとしても被害は最小限に抑えられるだろう。もちろん、セキュリティ対策ソフトウェアのメーカーが緊急性を訴えている場合などに速やかな対応が可能な体制も必要となる。

■6月のイベントで語っていたこと

クラウドストライクのプライバシーおよびサイバー ポリシー担当副社長兼顧問のドリュー・バグリー氏は、6月に開催されたサイバーセキュリティに関するワシントン・ポスト主催のイベントで「デジタルリスク」に対し回復力のあるITシステムを構築する必要性を語っていた。

同氏はこのイベントにおける講演で「我々は安全な方法でコードを開発し、その成果物を検証しなければならない」とし、「デジタルエコシステムにおけるリスクを増やすのではなく減らすような、回復力のある方法でソフトウェアを展開することが、非常に重要だ」と述べていた。いま、その言葉をしみじみとかみしめているのは、クラウドストライクの人々かもしれない。タニグチ ムネノリ : ウェブライター

#850万台に及ぶ過去最大のシステム障害はなぜ起きたか


最新の画像もっと見る

コメントを投稿

ブログ作成者から承認されるまでコメントは反映されません。