気になるキーワードや製品のコレクション(IT編)

メルマガ、新聞、雑誌などに登場する(増田悦夫の)気になるキーワード、製品を取り上げ、ITの進展をフォローします。

"Bard(バード)(グーグル)"とは

2025-01-27 23:37:51 | AI(人工知能)・生成AI・その対策

グーグルが開発した生成AIで、初期バージョンが2023年3月21日にアメリカ合衆国とイギリスでリリースされ、さらに同年5月10日には日本語を含む複数の言語に対応して他の国へも拡大されています。

Bardが利用している大規模言語モデル(LLM)は、グーグルが開発した”PaLM2(パームツー)”で、膨大な量のテキストデータを学習することにより、文脈を理解し、それに基づいて自然な文章を生成することができるようです。

なお、2023年12月6日にはPaLM 2をベースに画像や動画、音声データなども利用した高度な大規模言語モデル”Gemini(ジェミニ)”が開発され、それを受け2024年2月8日において当該言語モデルを利用する生成AIとして「Gemini」という新しい名前に生まれ変わっているようです。


  • X
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする

"tsuzumi(NTT)"とは

2025-01-07 23:48:22 | AI(人工知能)・生成AI・その対策

NTTが開発した独自の大規模言語モデル(LLM:Large Language Models)※1で、生成AI(※2)の基盤となっています。"ツヅミ"と読みます。

tsuzumiは、「軽量でありながら世界トップレベルの日本語処理性能を持つ」などの説明が付けられており、実際、以下に示すような4つの特徴を持っているようです(※3)。

■軽量であること 汎用ではなく特定の業界や専門領域の知識に限定して学習することでパラメータ数を大幅に減らしている(注:軽量版が70億、超軽量版は6億)ため、電力消費、学習コスト、推論コストなどが削減されるようです。

■日本語に強いこと 40年以上に亘る自然言語処理研究の蓄積を生かし、特に日本語処理については各種ベンチマークテストで世界トップクラスの性能を示しているようです。

■柔軟にカスタマイズできること 事前学習済みの基盤モデルに、追加学習した小型モデル(注:アダプタと呼ばれる)を組み合わせることで、利用ユーザやシーンにきめ細かく対応させることができるようです。

■マルチモーダルであること 言語以外に視覚、聴覚などのデータにも対応し、現段階で言語に視覚や聴覚を組合せたものも理解できるようです。

tsuzumiを用いた企業向けサービスは、2023年11月の発表に基づき2024年3月25日に提供開始されています。また、2024年11月20日より、米マイクロソフトがクラウド(Microsoft Azure)上で日本国内でのtsuzumiの提供を(NTTデータ経由で)開始したようです。

ChatGPTなど米国製の生成AIでは日本語学習量が極めて少ないため使用されているLLMの使い勝手が悪いようです。このことを背景に、日本国内において日本語に特化したLLMを開発する動きが広がっているようです。tsuzumi以外に、ソフトバンク、KDDI、パナソニックなどで開発中、開発予定のようです。

2023年11月の発表のニュースリリース(2023.11.1)のページは、https://group.ntt/jp/newsrelease/2023/11/01/231101a.htmlです。

2024年3月の提供開始のアナウンス(2024.3.25)のページは、https://group.ntt/jp/magazine/blog/tsuzumi20240325/です。

2024年10月のマイクロソフトの提供開始のニュースリリース(2024.11.20)のページは、https://www.nttdata.com/global/ja/news/topics/2024/112000/です。

※1 関連ブログ(”大規模言語モデル(LLM)”とは、2024.2.5)のページは、https://blog.goo.ne.jp/blspruce/e/1fa9298d38c84e6200d3d2944bf88125です。

※2 関連ブログ("生成AI"とは、2024.2.4)のページは、https://blog.goo.ne.jp/blspruce/e/9e2c00c1de0aefa38294f3486089d103です。

※3 次の文献を参照:島田明、川添雄彦著『IOWNの正体』、日経BP社、2024年12月11日第1版第2刷発行、pp.140~147。


  • X
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする

"動画生成AIサービス"とは

2024-12-19 23:20:11 | AI(人工知能)・生成AI・その対策

大量データの学習結果を基に、人間の指示や質問によって文章や画像、音声などを出力する"生成AI(※1)"のうち、特に動画を出力できるサービスを指しています。

最近、巨大IT企業などからこの種のサービスが相次いで発表されています。以下のようなものです。

●オープンAIからの"ソラ(Sora)"  2024年2月15日に、一部の映画制作者やクリエーターなどに提供開始されていましたが、2024年12月9日に、米国や日本などで一般への提供が開始されました(※2)。

●アマゾン・ドット・コムからの"アマゾンノバ・リール(Amazon Nova Reel)"  2024年12月3日にクラウドサービスとして開発者などに向け提供開始されました(※3)。

●グーグルからの"ベオ(Veo)"  2024年5月14日より一部の映画関係者らに提供開始されました(※4)。Veoは1分超の長さの動画を生成可能です。なお、Veoに先駆け、2024年1月23日には、長さ5秒の動画を生成できる"ルミエール(Lumiere)"が発表されています。また、2024年6月には、プレゼン用動画を生成する"ビズ(Vids)"が業務用サービス「グーグルワークスペース」の一部利用者向けに提供開始されています。

●メタからの"ムービージェン(Movie Gen)"  2024年10月4日に発表されています(※5)が、提供開始時期は現状未定です。なお、これに先駆け、2023年11月には、画像生成の最初の基礎モデル"Emu” モデルを活用した"Emu Video”(注:生成される動画は4秒程度)が発表されています。

静止画などと同様、本サービスによるメリットとともに、有名人になりすますなどの偽動画や著作権や肖像権・名誉侵害の動画などの横行を食い止めるための対策も必要です。即ち、動画の真偽を見極める有効な技術の開発(注:動画の出所などを明示する「電子透かし」の搭載や生成動画にラベル付けするなどが考えられていますが安全性を担保できるかの検証も必要)や動画生成AIサービスの運用ルール、偽情報発信に対する法整備などが世界レベルで検討されている状況です。

※1 関連ブログ("生成AI"とは、2024.2.4)のサイトは、https://blog.goo.ne.jp/blspruce/e/9e2c00c1de0aefa38294f3486089d103です。

※2 ニュースリリース(2024.12.9、オープンAI)のサイトは、https://openai.com/index/sora-is-here/です。

※3 ニュース(2024.12.3、アマゾン・ドット・コム)のサイトは、https://aws.amazon.com/jp/about-aws/whats-new/2024/12/amazon-nova-foundation-models-bedrock/です。

※4 2024年5月14日開催の開発者向け会議"Google I/O 2024"の基調講演の模様の動画(YouTube、34分あたりからVeoの説明)のサイトは、https://www.youtube.com/watch?v=XEzRZ35urlkです。

※5 関連記事(ロイター、2024.10.8)のサイトは、https://www.reuters.com/technology/artificial-intelligence/meta-challenging-openai-announces-new-ai-model-that-can-generate-video-with-2024-10-04/です。


  • X
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする

"ハルシネーション(Hallucination)"とは

2024-12-01 23:11:29 | AI(人工知能)・生成AI・その対策

指示や質問に対する生成AI(※1)の回答内容に関する概念で、学習の不十分さ等(※2)から生成AIが虚偽あるいは誤解を招くような情報を回答してしまう現象を指しています。このことが「もっともらしいウソ」をつくという意味合いから、このように呼ばれるようになったようです。ちなみに、英語の"Hallucination"は、「幻覚」、「幻影」といった意味です。

上記のような意味合いでハルシネーションが使われるようになったのは2010年代後半からで、特に2022年の"ChatGPT"や2023年の"Microsoft Copilot"のようなLLM(※3)の公開によって注目度が増しているようです。

ハルシネーションは、それを減らす方向に改善したり、少なくなるような指示や質問を行うよう心掛けることはできても、完全になくすことは難しいようです。即ち、生成AIの出力の正確さや信頼性を100%担保することはできないようです。

生成AIの回答を真実の情報と思って利用したり拡散したりすると、ハルシネーションの存在により影響を受けたり与えたりする可能性があります。生成AIの利用に当たっては、ハルシネーションが存在し得ることを認識しておく必要があります。

生成AIにおけるハルシネーションという問題は、知られているもう一つ「偏向(バイアス)」がかかる問題(即ち、生成された回答が人種や性別などの社会的な偏りが反映されたデータの学習から得られた不公平なものとなり得る問題)とともに、生成AIの利用における負の(というより注意が必要な)側面であり、健全な社会の維持に向けた今後の更なる対応が求められている状況です。

※1 例えば、関連ブログ("生成AI"とは、2024.2.4、https://blog.goo.ne.jp/blspruce/e/9e2c00c1de0aefa38294f3486089d103)を参照願います。

※2 具体的には、学習データ自身の不足や間違い、学習データに関するAIの理解不足や誤認、AI自身の作りに関する問題(学習データ取り扱い方法)などです。ハルシネーションが起こり得る原因となるものです。

※3 大規模言語モデル(Large Language Models)。膨大なテキストデータから学習し文章の理解や生成を可能にします。自然言語処理(NLP)技術とディープラーニングと呼ばれる機械学習技術とを利用することで構築されます。


  • X
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする

“アップル・インテリジェンス(アップル)”とは

2024-10-01 23:17:30 | AI(人工知能)・生成AI・その対策

2024年9月20日(金)に発売された「iPhone16」シリーズ(注:4機種、2024.9.9カリフォルニア州スティーブ・ジョブズ・シアターにて発表された※1)に導入されたアップル独自の”生成AI(※2)”です。現在は英語のみで利用可能(※3)で、日本語への対応は来年以降になるようです。

報道によると、この機能を利用することにより、以下のようなことができるようです。

・気になるレストランやイベントのポスターなどにカメラを向けると、検索結果としてそれらに関連する情報が瞬時に得られたり、

・受信した長文の電子メールの本文を要約したり、返信内容を作成したり、

・オリジナルな絵文字を作成したり、などなど

です。

生成AIについてはメリットだけでなく偽情報や著作権に関する問題も想定されており、課題への対応も含め世界的に注目された技術・サービスとなっています。MM総研の調査によると、認知度は高い(75.4%)ものの、実際に利用したことのある人はまだ少ない(12.5%)ようです(※4)。

今回のアップル・インテリジェンスの導入は、このような背景もひとつにはあるかと思いますが、スマートフォン等への導入については、「アップル」が最初ではなく「サムスン電子」や「グーグル」において既に対応済みのようです。即ち、前者は2023年4月より”Galaxy S23”シリーズに導入、また後者は2023年12月より生成AIの”Gemini”が利用可能となっているようです。AIの導入で遅れを取っているアップルですが、独自のAIやその他の機能等で巻き返しが図れるか、今後の利用動向が注目されます。

※1 報道の動画は、例えば、https://www.youtube.com/watch?v=ZfRdibksoaU&t=8s(テレ東BIZ、2024,9,10公開)です。

※2 生成AIについては、例えば、関連ブログ("生成AI"とは、2024.2.4)の以下のページを参照願います。https://blog.goo.ne.jp/blspruce/e/9e2c00c1de0aefa38294f3486089d103

※3 iPhone16の全4機種およびiPhone15の上位2機種(Pro、ProMax)において最新OSの搭載を条件に利用できるようです。

※4 MM総研のプレスリリース(2024.8.21)のサイトは、https://www.m2ri.jp/release/detail.html?id=639です。


  • X
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする

"大規模言語モデル(LLM)"とは

2024-02-05 23:29:48 | AI(人工知能)・生成AI・その対策

「LLM」は”Large Language Model”の略で、膨大なテキストデータを学習して次に来る単語の確率を予測し、文章の作成や要約、質問への回答といった処理をします。自然言語処理(NLP)技術とディープラーニングと呼ばれる機械学習技術とを利用することで構築されます。「生成AI」の基盤となる技術です。

LLMの性能は「パラメーター」という指標で表されるようです。自然言語処理に特化したAIの新興企業の「ストックマーク」(東京都港区)によると、企業の業務用で130億~700億、一般に広く使われるChatGPTなどでは3500億~2兆程度だそうです。

関連ブログ("生成AI"とは、2024.2.4)のページは、https://blog.goo.ne.jp/blspruce/e/9e2c00c1de0aefa38294f3486089d103です。


  • X
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする

"生成AI"とは

2024-02-04 23:06:18 | AI(人工知能)・生成AI・その対策

大量データの学習を行い、人間が指示することによって文章や表、イラストや写真といった画像、音声などを生み出す人工知能(AI)のことを指しています。英語で「Generative AI」と表現されたりします。

「生成AI」の利用範囲は広く、作業の効率化といったプラスの側面だけでなく、本物と見分けの付きにくい偽情報(即ち、悪意等の意志に基づく誤情報)が作成されて出回るといった問題、や作成されたものの著作権の扱いなどの課題も指摘されており、健全な活用に向けた取り組みが世界各国で展開されつつあるようです。

下の図に示すように、日経新聞各紙に登場する「生成AI」に関する記事の件数は、ここ9か月間でひと月当たり数百件のペースで推移しています。現在、如何に注目されているキーワードであるかが伺えます。


  • X
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする

“チャットGPT記事の新聞掲載”とは

2023-05-20 23:30:25 | AI(人工知能)・生成AI・その対策

対話型AIあるいはチャットボットのサービス「チャットGPT(Generative Pre-trained Transformer)」記事の新聞掲載状況です。

チャットGPTは、2022年11月30日に公開され半年近くが経過しています。公開後、それに関する注目や議論などが瞬く間に世界に広がり、それに関する記事が、最近では毎日のように新聞を賑わしている状況です。

下図は、「日経テレコン21(※)」上で日経新聞等各紙を対象に”チャットGPT”あるいは”ChatGPT”で検索した時のヒット件数をプロットしたものです(注:2023年5月は、1~19日の間で、”チャットGPT”が160件、”ChatGPT”が119件となっている)。ここ2、3か月で急激に増加しています。

※ 日本経済新聞社が提供している総合データベースサービス。

半年間近くで利用者は1億人以上となっているようですが、利用方法や利用ルールなどが固まっておらず、対応が急がれている状況です。広島で本日より開催のG7サミットでも、議論のテーマのひとつに取り上げられているようです。


  • X
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする

"サム・アルトマン(Samuel H. Altman、1985.4.22~)"とは

2023-04-26 23:02:52 | AI(人工知能)・生成AI・その対策

米新興企業「オープンAI(※1)」のCEO(最高経営責任者、2015年~)です。1985年4月22日、ユダヤ人家系に生まれ、高校からスタンフォード大を(2005年に起業により)中退するまで、コンピュータ-サイエンスを学んだようです(Wikipedia)。

※1 対話型AIあるいはチャットボットのサービスである「チャットGPT(Generative Pre-trained Transformer)」の開発企業。2022年11月30日に、チャットGPTをプロトタイプとして公開し、注目や議論などが瞬く間に世界に広がっている。

現在、オープンAI社のCEOですが、それに至る経緯は、以下のようです(※2)。

※2 https://www.paloaltoinsight.com/2022/11/15/openai-ceo-sam-altman/

 2005年:位置情報SNSを運営する「Loopt」を共同起業
 2011年:投資会社「Yコンビネーター」に参加
 2012年:Looptを売却
 2014年:Yコンビネーターの代表に就任
 2015年:新たに設立されたAI研究機関「OpenAI」のCEOに就任
 2019年:OpenAIに注力するためYコンビネーターを退職

2022年11月にチャットGPTを公開後、2023年4月に、初めての海外訪問として日本を訪れ、4月10日の午前には岸田首相と面会し、午後には自民党の「AIの進化と実装に関するプロジェクトチーム」に出席したようです(注:来日に至る経緯については未確認です)。

後者の会合において、アルトマン氏は、塩崎彰久衆議院議員の4月10日付けのツイッター記事(※3)によると、日本がAI分野で世界のリーダーになるための項目として、以下のような7つを提案されたようです。即ち、①日本関連の学習データのウェイト引き上げ、②政府の公開データなどの分析提供等、③LLMを用いた学習方法や留意点等についてのノウハウ共有、④GPT-4の画像解析などの先行機能の提供、⑤機微データの国内保全のため仕組みの検討、⑥日本におけるOA社のプレゼンス強化、⑦日本の若い研究者や学生などへの研修・教育提供、の7項目です。

※3 https://twitter.com/AkihisaShiozaki/status/1645320688746762242

なお、アルトマン氏は、日本訪問後も、他の国への訪問を積極的に行っている/行う予定のようです。


  • X
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする

"エッジAI"とは

2022-08-11 23:19:44 | AI(人工知能)・生成AI・その対策

端末で取得したデータなどを、ネットの先のクラウド側に送信してAI処理する形態でなく端末側あるいはそれに近いエッジサーバでAI処理する形態です。類似ブログ(”エッジAI”とは、2020.1.2)の下記サイトも参照。https://blog.goo.ne.jp/blspruce/e/55abec71f81fd338723acac552d93bd5

AIスピーカー(例.Amazon Alexa)やAI翻訳機器(例.ポケトーク)など従来のAI処理形態は、端末側で取得したデータをネットワーク経由でクラウドサーバへ送りクラウド側で処理する形態(注:”クラウドAI”と呼ばれる)が主でしたが、最近、クラウド側へ送る時間やクラウドサーバ側への負荷の集中を減らす観点から端末や端末に近いエッジサーバで処理する形態(即ち”エッジAI”)への注目が集まりつつあります。

エッジAIを手掛ける新興企業として、「イデイン(Idein株式会社)」(注:東京都千代田区、2015年4月7日設立)や「エイシング(株式会社AISing)」(注:東京都港区、2016年12月設立)などが知られています。

例えば、イデインでは「Actcast」と呼ばれるエッジAIプラットフォームを提供しているようですが、「京セラコミュニケーションシステム株式会社」は、このプラットフォームを利用し「メータリーダー」と呼ばれる、工場の計器類を読み取るAIアプリを開発し販売開始しているようです(※)。

※ 関連プレスリリース(2022.7.27)のサイトは、https://www.idein.jp/ja/news/220727-kccs-meterreaderです。


  • X
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする