JJUG CCCで「2024年AIを利用したJava開発の最新動向」を寺田さんから聴いてきた!
寺田さんは初め、どんな話をしようか考えてました。
というのも、6月5日にJava On Azure Day AIでJavaを使ったAI話はしてきたので、ここでやっても・・・ということで、そういうのに関心がある人は、その動画を見てくださいと言ってました。
で、その動画のQRコードを掲載したんだけど、自分ケータイしまってたので、それを読み取れませんでした。
ま、後で調べればわかるだろうと思ってたのですが・・・
・・・よくわからん、↓これかなあ?
まあ、この動画にはJava On Azure Day AIの内容が全部出ているので、そのJavaでAI使うところも入ってます。
はいってますが、5時間みるのは、きついですよね。↓に番組表があるみたい
ということで、GitHub Copilot × Visual Studio Code みたいな話は今回は↑の動画に任せて、パスということになりました。
ということで、今回はAzuru AI Studioの話から始めてました
AIのモデルを選んで、ここから使えるというものです。
ここにあるモデルは、今はやりのLLMを使ったものもあるし、
RAGもあります。RAGは検索っていって軽く触れてましたが、
(今回のJJUGとは関係ないですけど)マルゼミのメールで説明してたところがあるので、以下に貼っておきます。
<以下、マルゼミのメールより>ーーーーーーーーーーー
【 RAG -- Retrieval-Augmented Generation 】
RAG(検索拡張生成技術)は、 Patrick Lewisらが2020年に発表した次の論文を起源とする技術です。
Retrieval-Augmented Generation for Knowledge-Intensive NLP Tasks
https://arxiv.org/pdf/2005.11401v4
このLLMの機能拡張技術はまたたくまに普及・拡大し、現在、私たちが対話的に利用する大規模言語モデルは、ほとんどすべてこの技術を利用しています。
【 AgentモデルでRAGを見る>】
先にあげた論文本体には、Agentという言葉は、一度も使われていないのですが、このセッションでは、Agentモデルとして、RAGのアーキテクチャーの特徴を見ていきたいと思います。
RAGでは、主要に、二つのAgentが登場します。
第一のものは、大規模言語モデル(LLM)です。LLMは、事前学習によって大量のテキストデータから言語の知識を獲得しており、文章生成、翻訳、質問応答など、様々なタスクを実行できます。
第二のものは、検索Agentです。検索Agentは、ユーザーのクエリやLLMからの要求に基づいて、外部データベースや知識ベースから関連情報を検索します。
ーーーーーーーーーーーーーーーー<以上、マルゼミのメールより>
で、RAGって、答えが同じではないよねっていう話になり、
(乱数使う生成AIは、同じ答えにならない)
そのためのテストとして、Microsoftが提供するテストツールの話。
それと、生成AIは、LLMだけでなく、自分で学習データを作って教えられる
SLM(小規模言語モデル)のPhi-3の話をしていました。
メモは、↓のかんじ