○ 2018年に経済産業省が警鐘を鳴らした「2025年の崖」に対応する時間もあとわずか。堅牢で、柔軟性・拡張性の高いITインフラを運用することは多くの企業にとって喫緊の課題だ。
しかし、最適な運用フロー、かけるべきコストの算出、運用を行う人材の確保などの最適解がわからず、不安を抱えるIT担当者も多い。各社のリソースが不足する現在、ITインフラの運用管理をできる限り自動化し、人手をかけない仕組みづくりが重要だ。
そんななか、物理・仮想インフラを容易に一元管理できる“ある方法”が注目を集めている。サーバ、ストレージ、スイッチなどを1つの画面で統合管理し、画面上でインフラの状況や異常を一目で把握。オンプレミスをクラウドライクに運用管理することも可能だ。
従来は不可能だった容易かつ高精度なインフラ管理を実現する方法とは?その仕組みに迫る。
自社の知見だけでは難しい? ハイブリッドIT環境の再構築には高いハードルが。
企業にとって、柔軟で拡張性の高いIT環境の構築は喫緊の課題だ。基幹システムや社外に持ち出せないデータを扱うシステムをオンプレミス(またはプライベートクラウド)で運用し、業務システムをパブリッククラウドなどで運用する「ハイブリッドIT」を採用する企業も増えている。クラウドとの親和性が高く、拡張性と運用性に優れたHCI(ハイパーコンバージドインフラストラクチャー)をオンプレミスに置き、パブリッククラウドと連携させるケースが多くなっているのだ。ハイブリッドITであれば、要件に合わせて柔軟な組み合わせが可能。適材適所にコストをかけることができ、新規事業などで必要な機能をパブリッククラウドですぐに使え、システムにかかる負荷・リスクを分散できるなど、メリットは大きい。
「ハイブリッドITを実現するためには、一気に移行させるのではなく、段階的な導入を進めることが重要です」と富士通の矢中克幸氏は話す。
「まずは、オンプレミスのデータのバックアップや業務継続性のためのDR(災害復旧)対策としてクラウドを活用し、どのシステムをオンプレミスにして、どのシステムをクラウドにするかを決める必要があります。インフラを最適化してデータの利活用を行うことで、DXを推進できるのです。富士通では、DXによってイノベーションや企業競争力の維持を可能にし、サステナブルな社会を実現するためのソリューションを提供。ハイブリッドITの実現に関しても、具体的なリソースのサイジングなどを提示しながら、スモールスタートで始め、拡張していくまでのアドバイスを行っています」(矢中氏)
富士通は、2021年の国内サーバ全体(出荷額および出荷台数)でシェアNo.1(※)を獲得しており、第3世代 インテル® Xeon® スケーラブル・プロセッサー・ファミリーを搭載した「FUJITSU Server PRIMERGY」をベースとしたHCI「FUJITSU Integrated System PRIMEFLEX for VMware vSAN」(以下、PRIMEFLEX)を提供している。PRIMEFLEXでは、PRIMERGYの「堅牢性」、高い拡張性を持つ「柔軟性」、独自の管理ツールによる「運用効率化」の3つを兼ね備えており、クラウドと連携して活用することができる。
手間をかけずに社内のITインフラを一括管理 革新的ソリューションとは?
一方で、矢中氏はハイブリッドITの運用管理には課題もあると説明する。「将来的なリソース量をサイジングしてスモールスタートで始められるように我々がサポートすることで、投資やコストの課題はある程度解決することができます。しかし、ハイブリッドITによってシステムの複雑性が増すことで、逆にインフラ管理の手間がかかってしまう場合があります」。
それらを解決する手段として富士通が提供しているのが、HCIの導入運用を支援するFUJITSU Software Infrastructure Manager(以下、ISM)というソフトウェアだ。
ISMは、グラフィカルでわかりやすいインタフェースで物理・仮想インフラを可視化し、インフラのトラブルを早期に発見・解決に導く。サーバ、ストレージ、スイッチなどのすべてを統合管理でき、機器の状態や異常発生時の影響範囲をひと目で把握。処理を自動化して作業時間を大幅に削減し、操作ミスを激減させる。プラグイン機能でVMware vCenter Serverと連携させることで、1つの画面でリソースを管理運用することも可能だ。
ISMで特筆すべきは、機器の不調を事前に検知して問題を未然に防ぐ「アノマリ検知」機能だ。例えば、この機能を使うと、AIがストレージへの読み書き回数と応答時間の関係を学習。読み書き回数に対して応答時間が遅くなる傾向が検出されると、アラームが通知される。別途しきい値を設定する必要もなく、運用の手間もかからない。AIについても、1つ、2つのパラメータだけで異常を判断するのではなく、複数のパラメータから誤検知などの異常を判断するため、幅広い事象について検知できるのも、富士通のISMの大きな特長だ。
I/Oリソース障害の発生箇所と影響範囲を逃さず検知。
定期的に機能の追加が行われ、進化し続けているというISM。富士通の原秀司氏は、次のように話す。「これまでのアノマリ検知は、インフラを統合して可視化し、異常状態を自動検出することでトラブルを未然に防ぐことができていました。しかし我々は、インフラ運用管理者の運用負荷軽減やより効率的な運用を目指し、障害要因や影響範囲を分析し、リソース使用率などを予測して、インフラの障害対処や拡張計画などを提案するところまでを自動化していきたいと考えています。その第一弾として、2022年9月に『I/Oリソース影響分析』という機能を追加しました。異常やスローダウンしている機器の検知だけでなく、それによるシステムへの影響範囲を抽出することで迅速な対処につなげることができると考えています」。
I/Oリソース影響分析は、機器単位だけでなく、物理ディスクなどのデバイス、仮想マシン含め横断した影響の分析が可能。仮想レイヤ・物理レイヤをまたがって機器の依存関係を自動的に分析・管理することで、障害発生時の迅速な対応が可能だ。また、グラフィカルなインタフェースで、専門知識がなくても簡単にI/Oリソース障害のシステム影響範囲が分析できることも大きな特長だ。
管理ツールの進化でゼロ運用を目指す。
I/Oリソース障害は、複数の仮想マシンに影響が波及し、通常であれば影響範囲の調査には専門性が必要なうえ、かなりの労力がかかる。しかし、ISMのI/Oリソース影響分析を利用すれば、障害が発生した物理ディスクと影響する仮想マシンを瞬時に特定でき、ユーザーに通知するなどの対処を行うことができる。
また、アノマリ検知で特定のディスクがスローダウンしていると検知された場合は、I/Oリソース影響分析を使って影響が及ぶ仮想マシンやサーバをすぐに検出し、重要な仮想マシンなどが含まれている場合は、別のディスクを使うように退避させることも可能だ。
矢中氏は、「PRIMEFLEXとISMは、インフラ運用を最適化できるソリューションです。ゼロ運用による運用負荷軽減、属人化の撤廃で人材不足の解消、空いたリソースの活用によるサービスの導入など、IT部門に革新的な変化をもたらすことができます。エンドユーザーに対しても、サービス不具合などのストレスが軽減され、よりよいサービスによる業務効率化や、本業への集中によるイノベーションの創出といったメリットがあります」と説明している。
なお、矢中氏が話す「ゼロ運用」とは、トラブル発生時の対処などを自動化して、人手による運用を極力減らすことを指している。自動化による運用効率化は、近年のIT部門にとって重要なテーマであり、運用の人材不足という社会的問題を解消する点でも期待されている。
また、最後に原氏は次のように話した。「物理環境や仮想環境が混在していく中で、インフラやシステムの管理者は、運用管理に大変な苦労をされていると思います。ISMは、それを解決できるソフトウェアとして、さらなる運用効率化に向けた機能強化を行っていこうと考えています。予測に対する対処方法の提案や、将来的なリソースの使用量も予測できるようにして、管理者の方々が増設・拡張の計画やインフラ最適化の計画をしっかり立てられるような機能も追加していくので、期待していてください」。
PRIMERGYや、HCI(FUJITSU Integrated System PRIMEFLEX for VMware vSAN)に採用されている第3世代 インテル® Xeon® スケーラブル・プロセッサー・ファミリーはクラウド・コンピューティング、リアルタイム分析、ミッション・クリティカルな業務の処理、ビッグデータのインサイトを提供します。データセンターの効率性および信頼性が向上し、あらゆるワークロードの処理に対応します。