AVGO1062.9us$ 24/1/11木BX120.07$ MCHP84.17$

米国株BX119.62us$ AVGO1065us$ MCHP84.06(24/1/10水:現在

24/11/13水11:26[154.69]潜入!石狩で動く「最新AIデータセンター」の中身 さくらの「最先端DC」でいま何が起きているのか 茶山 瞭 : 東洋経済 記者

2024-11-13 11:25:55 | 米国株

潜入!石狩で動く「最新AIデータセンター」の中身さくらの「最先端DC」でいま何が起きているのか茶山 瞭様 : 東洋経済 記者<エヌビディア製GPUを約2000基導入し、動き出した最先端のAIデータセンター。その運営を可能にしたのは、「余白の経営」だった

ゴォーッ、ゴォーッ、ゴォーッ――。

北海道・札幌の北側に隣接し、日本海沿いに位置する石狩市の郊外。東京ドームよりも広い敷地内のある棟に移動し、長々と続く中央通路に案内されると、廊下沿いの扉から重低音が漏れ聞こえる。

「耳栓 イヤーマフ着用」。そんな紙が貼られた部屋の入り口から室内に足を踏み入れると、数百はあるだろうか、大量のラックが整然と立ち並ぶ姿が目に入った。と同時に、部屋中に轟く滝のような音が耳を覆う。

ラックに近寄り、身を屈めて棚に収容されたサーバーを覗き込むと、熱気を含んだ強い風が一気に顔に吹きつけた。爆音の正体は、高熱を発するサーバーを冷やすために急回転するファン(送風機)だった。

導入したGPU2000基は即完売

ここは、クラウドサービスを手がけるさくらインターネット(大阪市)が運営している「石狩データセンター」。この一室では、さくらが調達したエヌビディア製のGPU(画像処理半導体)サーバーのみを収容し、主に生成AIの「学習」に利用されている

膨大な演算処理が必要なAI開発における計算基盤として最重視されるのがGPUで、世界でAI開発競争が進む中、AI向け半導体分野でエヌビディアの1強が続く。GPU需要は逼迫し、安定的に調達できる国内企業はさくらやソフトバンクなど一部に限られる。

石狩データセンター1、2号棟の外観(写真:さくらインターネット)

さくらは2023年以降、経済産業省の支援を受けながら、エヌビディア製GPU「H100」を今年6月までに計約2000基導入し、稼働させたばかりだ。生成AI向けGPUクラウドとしてサービス提供を始めたが、研究機関を中心に引き合い旺盛で、販売開始と同時に「2000基すべてが売れた」(田中邦裕社長)という。

生成AI向けクラウドの展開を受け、2025年3月期の売上高は290億円(前期比32.9%増)、営業利益は26億円(同2.9倍)と急成長を見込む。今後2027年末までに、最新型のGPU「B200」を中心に新たに8000基の調達も予定する。

まさに、現在進行形で活況を呈している石狩データセンター。そこで10月末に開かれた見学会に参加した記者は、国内における“AIデータセンター”の最前線を目の当たりにした。次ページから、撮影厳禁とされている内部の詳細をお届け

冒頭の場面のように、データセンターを運営するには、サーバーに生じる熱を冷やす「冷却」が必要になる。複雑な計算が求められるAI向けの学習でGPUサーバーを使うと、従来よりもはるかに多くの電力を必要とする。それに伴って高熱が生じるサーバーを冷やす風量を上げる必要もあり、電力がさらに大量消費される。

通常のサーバーであれば、1つのラックに5~6台収納できる。しかし8基のGPUから構成されているGPUサーバーは1ラックに1~2台しか収容されておらず、何も入っていない状態の空のラックも大量にあった。田中社長は「電力が足りず、全部のラックを使うことはできない」と説明する。

サーバールームのイメージ。AI向けデータセンターでは、両端に並ぶラックにGPUを搭載したサーバーが収容される(写真:さくらインターネット)

石狩データセンターでは、北海道の冷涼な気候を生かしながらサーバーを効率的に冷やす、「外気冷房」と呼ばれる冷却方式を採用してきた。ただ、1つのラックに多くのサーバーを集約させると、膨大な発熱に空冷では対応しきれないという

現在3棟を擁する石狩データセンターの受電容量は最大30メガワットで、ハイパースケーラー(巨大クラウド事業者)並みの大型データセンターに相当する。それでも容易にまかなえないほど、GPUは大量の電力を必要としている。

「コンテナ」で施設を機動的に拡張

今後さらに8000基のGPUの導入を予定するさくら。既存の施設内に収容するのが難しいため、今年1月に発表したのが、「コンテナ型データセンター」の新設だった。その名の通り、空いた敷地にコンパクトなコンテナを設置し、内部をサーバールームに設計したもの

石狩データセンターを上空からみると、現存する1~3号棟が「T字型」に建っており、「T字」の右下、左下の空いた土地に4、5号棟を作る予定だった。うち、4号棟になるはずだった場所の一部に、銀色に輝く真新しい3つのコンテナが建ち、周囲に空調機やUPS(無停電電源装置)など多数の設備が並ぶ。

コンテナ型データセンターの特徴は、短期間で設置可能で、機動性に優れている点だ。通常の建物の場合は建設に数年を要するのに対し、4カ月程度で構築できる。AI向け計算資源の需給が逼迫する中で、GPUを素早く実装するには効果的手段だ

コンテナ型データセンターでは冷却方式として、「空冷」に代わり、「水冷」を取り入れ、サーバーの収容効率を向上させることも特筆すべきポイントだ

導入した水冷方式は、冷水が通る配管を設置してサーバーを水で直接冷やすことで、空冷よりも冷却効率を高める「直接液体冷却(DLC)」という仕組みだ。DLCなどを活用して廃熱効果を高め、既存施設では空きが目立ったラックをフル活用することが可能になる。

1つのコンテナには、20程度のラックが入っている。1ラック当たりサーバー5台を収容すると仮定すれば、GPU換算で800基を実装できる。

さくらは今後約170億円を投じ、2025~2026年にコンテナ型センターを段階的に増設する。コンテナ向け発電機も構築するなどして、調達を進めるGPUを順次収納する方針だ。コンテナを今の3倍程度に増やせば、今後調達する分を収容できる計算となる。

北海道を選んだ決め手は土地の「余白」

そもそもなぜ、大阪の新興企業だったさくらが北海道という地で、AI向けデータセンターの最先端を走るに至ったのか。クラウドに最適化された日本最大級の郊外型データセンターとして石狩のセンターが開業したのは、2011年11月にさかのぼる

2000年代のデータセンターは、企業などが自社で保有、管理する設備を収容するラックなどを貸し出すビジネスが主流で、顧客側も駆けつけやすい都市圏近郊に立地していた。しかし、東京や大阪圏内では、商社や不動産会社が資本集約型でデータセンターを整備するようになり、「都市型データセンターでは勝てなくなってきた」(田中社長)。

将来的に普及が見込まれていたクラウドの事業展開を見据え、地方にデータセンターを建てる方針を決めると、約200カ所に上る候補地から場所を決めるうえで重視したのが、土地の「余白」だった。

広大な北海道内では、大規模な土地を安く一気に確保することができる。田中社長は「(新興企業だった)われわれの企業体力では一気に投資するのは無理だが、1カ所を巨大化させないと成り立たない。少しずつ投資しながら最終的に規模を大きくできる利点があった」と振り返る

この「余白の経営」が、開業から十数年後のAI時代に奏功することになった。

さくらインターネットの田中邦裕社長。自身が心がけてきた”余白の経営”がAI時代への柔軟な対応を可能にしたと振り返る。写真は2024年3月(撮影:梅谷秀司)

2022年秋のChatGPTの公開に端を発する生成AIの開発競争が起きると、AI事業を支える計算基盤の需要が急速に高まっていった。日本における計算基盤の確保は、国策上も経済安全保障の観点から重要になり、経産省は「クラウドプログラム」として大規模な助成を行うことを決めた。

ただ、AI向けに対応するデータセンターを早期に運用できる国内事業者は限られていた。イチから施設を構築するには数年を要するからだ

その点、既存施設の設計に余裕があったさくらは、社会的ニーズに応じてGPUを調達し、データセンターを柔軟に運用できる強みがあった。「余白をいかに作っておくかが、急激に増えゆく需要を受け容れるための重要な経営リソースだ」(田中社長)。2016年から機械学習向けGPUサービスを提供し、GPUを取り扱うノウハウにも長けていた。

石狩のセンターが逼迫したらどう対応?

白羽の矢が立ったさくらは2023年、2024年と、クラウドプログラムの認定を連続で受け、現時点で国内企業最多となる計最大約570億円の支援を得ることが決まった。計1万基に上るGPU調達に約1130億円の投資を見込むが、半分程度は国の助成金でまかなえる計算になる。

もっとも、GPUの導入を一気に進めれば、データセンターの「余白」は今後、急速に埋まるとみられる。さくらは2023年11月に、政府の共通基盤である「ガバメントクラウド」の提供事業者としても国内企業で初めて採用された。GPUだけでなく、需要が高まる通常のクラウド基盤の拡充も必要になる。今後、石狩のセンター自体が逼迫した場合はどう対応するのか。

田中社長は「国内のデータセンターをわれわれが作ることはもうないのではないか。今、北海道や九州などいろいろな地域にどんどんできている。ライバルが多い中、箱でいうと、外部から借りることが(財務上)健全だと思う」との認識を示す。

他事業者が運営するデータセンターの一部を借りたり、小規模な土地を入手してコンテナ型センターを設置したりする方法などが想定されるという。データセンターが急増する中で、自社で大規模設備を構築せず、必要に応じた利用が効率的というわけだ。

GPUの調達に応じた柔軟な運営がカギに

一方でGPUをめぐっては、調達先であるエヌビディアの動向に左右される不透明さも浮き彫りになっている。さくらが整備した3つのコンテナには当初、最新型のGPU「B200」を収容予定だった。

ところが納入が想定よりも遅れ、3つのうち2つ分は、前の型の「H200」を導入する方針に急きょ切り替えた。GPUの型が変わるだけで「倍くらいの値段で倍くらいの性能になる」(田中社長)といい、調達できる型や時期に応じて、その取得費用や構築できる計算能力、業績貢献は大きく異なってくる。状況に応じた柔軟な調達や施設運営も求められている。

今後は、さくら以外の企業によるAIデータセンターも本格化する。ソフトバンクやKDDI、GMOインターネットグループといった大規模事業者も経産省からの助成を受け、GPUを使った計算基盤の構築を進める。「来年、再来年以降、ライバル企業も出てくるが、3~4年後も大きく需給が逼迫すると思われる。GPUは儲かり、どんどん参入が増えるシナリオもある」(田中社長)。

コンテナの設置で少し不格好な形で拡張された石狩データセンターの姿は、胎動するAIデータセンターが置かれた過渡期の状況を象徴している。この先AIの社会実装はどこまで進んでいくのか、そしてAIを支えるインフラ基盤となるデータセンターの姿はどのように変わっていくのか。国内で最先端を突っ走るさくらインターネットの行方は、AIデータセンターの未来を占っている。有料会員限定



最新の画像もっと見る

コメントを投稿