毎年恒例の世界コンピュータ将棋選手権が
5月3日から5月5日に開催されて、
深層強化学習系の dlshogi with HEROZ
が二連覇した。
上の動画は3日目の
決勝リーグの公式実況中継で、
表彰式やインタビューも
含まれている。
決勝の結果はこちら。
2位はやねうら王
3位はW@nderRE
参加チームの情報はこちら。
各チームのアピール文書もあって興味深い。
やはり最近は DL系が強いようで、
評価関数の層を深くすることで
性能が伸びているようだ。
今回優勝した dlshogi も
前回より層を深く(30ブロック?)
したと言っていた。
ただし、深くすると
学習時間も推論時間もかかるので、
そろそろ限界ではないか
というコメントもあった。
その一方で、今回独創賞を受賞した
Ryfamate というプログラムは、
NNUE 型という浅い NN を使った評価関数と
DL型の深い NN を使った評価関数を
合議で組み合わせていて、しかも、
DL型の評価関数に、Self-Attention を
取り入れている、など、
新しいアーキテクチャを
取り入れる工夫もされているようだ。
リアルの会場は川崎市産業振興会館だが、
リモート参加が可能なので、
現地参加したチームは少なかったようだ。
大会ルールを見たが、
持ち時間は 15分から始まって
一手あたり 5秒足される方式。
マシンスペックは、
会場に持ち込む場合は
消費電力 1,000W まで、などの
制限があるのだが、
リモートのサーバを
使う場合には制限がないようだ。
やねうら王さんの情報によると、
> 昨年優勝したdlshogiチーム、
> A100×8の8,9台構成だと言うではないか。
> (つまりはA100が6,70基あるってこと)
ということなので、かなりパワフルな
リソースも使われていることがわかる。
(この情報は、上記のチーム紹介に書かれていたし、
表彰式のインタビューでは、
72基と言われていた。
HEROZ は、ネット対戦の
将棋ウォーズを運営している会社なので、
大規模なリソースを使えるのが
有利な点だ。
AI 同士でも勝負がつくのは、
アルゴリズムだけでなく
マシンスペックの差も
あるのだろう。
マシンスペックを統一すれば、
とも思うが、DL系と非DL系があるので
GPU と CPU のバランスをどうするかが
難しそうだ。※電竜戦では、ハードウェア統一戦が
行われているらしい。
表彰式の中では、
優勝モデルの公開についての質疑もあったが、
学習コストがかかっているので
なかなか難しいというコメントだった。
対戦中の推論時間を減らすために、
より大きなネットワークで序盤の定跡研究をして、
それをテーブルのような形で?組み込んでおく
ということも行われているらしい。
しかし、その定跡にも穴があって、
それを突くというような戦法もあるらしく、
dlshogi は今年は、後手番角換わりは避けた
と言われていた。
HEROZ の開発エンジニアの
加納さんによると、
角換わりに関しては、
先手必勝の疑いもあるらしい。
後手番角換わりを避けてどう指すのか
という点については、
今後、人間の将棋にも
取り入れられてゆくことが
あるのかもしれない。
AI 同士でも先手番有利で、
今回優勝した dlshogi も
後手番での負けが多かったが、
全体としてみると
圧倒的というほどの差でも
ないようなのも興味深い。
一旦優位に立ったらそれを
じわじわと拡大して勝つ藤井曲線は、
元来 AI 曲線だった、
というのも面白かったが、
それでも終盤の逆転があるというのも
また面白い。
YouTube には、他にも
面白い対局の解説動画などが
いくつかあがっている。
将棋は思いのほか
奥深いなぁ・・・
最新の画像もっと見る
最近の「将棋・ゲーム」カテゴリーもっと見る
最近の記事
カテゴリー
バックナンバー
人気記事