NTTが開発した独自の大規模言語モデル(LLM:Large Language Models)※1で、生成AI(※2)の基盤となっています。"ツヅミ"と読みます。
tsuzumiは、「軽量でありながら世界トップレベルの日本語処理性能を持つ」などの説明が付けられており、実際、以下に示すような4つの特徴を持っているようです(※3)。
■軽量であること 汎用ではなく特定の業界や専門領域の知識に限定して学習することでパラメータ数を大幅に減らしている(注:軽量版が70億、超軽量版は6億)ため、電力消費、学習コスト、推論コストなどが削減されるようです。
■日本語に強いこと 40年以上に亘る自然言語処理研究の蓄積を生かし、特に日本語処理については各種ベンチマークテストで世界トップクラスの性能を示しているようです。
■柔軟にカスタマイズできること 事前学習済みの基盤モデルに、追加学習した小型モデル(注:アダプタと呼ばれる)を組み合わせることで、利用ユーザやシーンにきめ細かく対応させることができるようです。
■マルチモーダルであること 言語以外に視覚、聴覚などのデータにも対応し、現段階で言語に視覚や聴覚を組合せたものも理解できるようです。
tsuzumiを用いた企業向けサービスは、2023年11月の発表に基づき2024年3月25日に提供開始されています。また、2024年11月20日より、米マイクロソフトがクラウド(Microsoft Azure)上で日本国内でのtsuzumiの提供を(NTTデータ経由で)開始したようです。
ChatGPTなど米国製の生成AIでは日本語学習量が極めて少ないため使用されているLLMの使い勝手が悪いようです。このことを背景に、日本国内において日本語に特化したLLMを開発する動きが広がっているようです。tsuzumi以外に、ソフトバンク、KDDI、パナソニックなどで開発中、開発予定のようです。
2023年11月の発表のニュースリリース(2023.11.1)のページは、https://group.ntt/jp/newsrelease/2023/11/01/231101a.htmlです。
2024年3月の提供開始のアナウンス(2024.3.25)のページは、https://group.ntt/jp/magazine/blog/tsuzumi20240325/です。
2024年10月のマイクロソフトの提供開始のニュースリリース(2024.11.20)のページは、https://www.nttdata.com/global/ja/news/topics/2024/112000/です。
※1 関連ブログ(”大規模言語モデル(LLM)”とは、2024.2.5)のページは、https://blog.goo.ne.jp/blspruce/e/1fa9298d38c84e6200d3d2944bf88125です。
※2 関連ブログ("生成AI"とは、2024.2.4)のページは、https://blog.goo.ne.jp/blspruce/e/9e2c00c1de0aefa38294f3486089d103です。
※3 次の文献を参照:島田明、川添雄彦著『IOWNの正体』、日経BP社、2024年12月11日第1版第2刷発行、pp.140~147。