生成AIには事実と違うことを「偽情報」といい、自社のドラマには「フィクション」というマスコミ

2023-06-10 14:28:16 | AI・BigData

いくら一流のシェフがやっているからと言って、

フランス料理店に行って、「ラーメン出せ」というのは、

客のほうが気がくるってる。

生成AIは、仕組み（本質的に）上、今までのコンピューターとは違い、

事実を正確に伝えない反面、

クリエイティブなものを作り出す能力を持っている。

つまり、フィクションを生成するための道具である。

どういうことかというと、ChatCPTなど、現在の生成AIは、

（その前の時代の生成AIであるGANとは異なり）

Transformer（トランスフォーマー：ChatGPTのTの意味）を

もとに作っている。

Transformerについては、

Attention is all you need

という論文が有名なんだけど、そこにあるように、

TransformerはAttentionが基になっていて、Attentionは上の論文

にあるように（↓の式は、その論文の４ページから引用）

っていう式であらわされる。

Qが検索対象

Kが、（Javaのハッシュマップ等）キーバリューストアで有名な、キー

Vが、キーバリューストアのV

一般のデータベース、あるいはGoogleなどの検索システムは、

　　　　Qの検索対象と、Kのキーが一致した時に、値Vを変えす

　　　　Qの検索対象と、Kのキーが不一致のときには、わからないとする

　　　　　　（検索失敗になる）

ところが、Attentionは、

　　まず、QとKの内積を求める

　　　（Kの肩にTがかかっているのは、KもQもベクトルなので、このまま

　　　　だと掛け算できないためKのほうを転置行列にする。その転置のT）

　　　→内積をとると、QとKの長さ＊Coｓ「類似度」がでる。

　　　　このＣｏｓは、Ｃｏｓ類似度と呼ばれ、ＱとＫの類似度になる

　　　　・・・あ～詳しくは、高校の数学の教科書見てくれ

　　・その類似度に基づいて、Ｖを返す

　　　その結果

　　　　Qの検索対象と、Kのキーが一致した時に、値Vを変えす
　　　　Qの検索対象と、Kのキーが不一致のときには、

　　　　　ＱとＫの類似度に応じて、Ｖの値を割り引いて返す※

具体例でいうと、

　　鎌倉幕府は１２００年ごろできました

　　徳川幕府は１６００年ごろできました

　　室町幕府は鎌倉幕府と徳川幕府の間にできました

　　室町幕府は何年にできたでしょう？

と聞かれると、

　　ＤＢ検索では、室町幕府の年号は入っていないので

　　　　→わかりません。

と答えるが、

　　ＣｈａｔＧＰＴなどのトランスフォーマーを使った場合、

　　　鎌倉幕府が１２００年で、徳川幕府は１６００年で、その間なら

　　　→１４００年？

　とか、値を「返してしまう」わかってないのに・・・

　（実際は１３３０年ごろだから、間違い？）

この、教えてないけど、類似度に応じて値を返すという仕組みは、

事実を知りたい場合には、（適当に値を返されるから）困るけど

→上の例では室町幕府の成立を１４００年って返されると、

　受験的にはＸです。

類似いたことを返してくれるってことは、連想してくれたりすることな

わけで、創造的、クリエイティブな仕事にはいいわけです。

たとえば、「足利尊氏の幼少期の物語を作りなさい」と言ったとき、

ＤＢのように「そんなものは、登録されてないのでわからないです」

と言われたら、事実以外、なにも生まれませんが・・・

「足利尊氏」→「将軍」ってことで、源頼朝や徳川家康、その他

将軍の登録されている物語から、適当に割り引いて、乱数入れて

話ランダムに広げてくれれば、小説できるわけです。

小説は、それでいいんです。フィクションですから。

でも、うそじゃない。足利尊氏が源頼朝と同じだったらというフィクション

が入っているけど、そのレベルで大体こんなもんっていうのが

入ってきている。

つまり、生成ＡＩはTransformerを使っている時点で、

正確なものではないけど、クリエイティブなことができるツール

っていうものになっているわけ。

クリエイティブというのは、フィクションが入ってくることであり、

フィクションは当然、事実ではない情報を含みます。

だから、ChatGPTは、「生成AIです」（＝フィクションを含みます）

って言っているのに、それに対して、

「偽情報だあ」といって、マスコミがいじめるのも・・・なんだよねえ・・

自分たちは、ドラマとか流した時に

「このドラマはふくしょんであり」とかいって、「偽情報です」とは

言っていないんだよ・・・不公平だよねえ。

ちゃんと「バック・トゥ・ザ・フューチャー」とかに対して、

「現代ではタイムマシンはまだ完成しておらず、物理学的にも無理であり、

　この映画は偽情報を含みます」って、言うべきになるけど・・・

・・・世の中の人は、そんなの求めてる？？？

なんか、マスコミが生成AIを「フィクション製造機です」と言わずに

「偽情報製造機」にみたいにディするのは、悪意があるのはもちろんだけど

（取材すれば、中身Transformerってことはすぐわかるし、Transformerは

　上記のようなフィクション生成に長けていること、事実を検索する場合

　にはDBを利用し、システムが違うことは、普通の学者は説明するはず）

最近、これ、スポンサーに関係してるんじゃないかと思っている。

つまり、「生成系AIはなんでもできる」と言って売りつけたいスポンサーと

いままでシステムを売ってきて、そういわれると困るスポンサー（はディするわけ）がいて、それらにご機嫌を取るから・・・本当のことは言えない。

　本当のことは、クリエイティブな道具は、実は文章生成より、

　画像生成のほうがお金になって、なので、アドビさんが目を

　つけているっていうわけなんだけど・・・

・・・この続きは、また今度ね！　　　

Attentionは、この検索対象、キー

ランキングに参加中。クリックして応援お願いします！

« うなぎって、今が旬なの？ | トップ | IROHAさんが、かわいすぎるの... »

このブログの人気記事

最新の画像［もっと見る］

日	月	火	水	木	金	土
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30

アクセス
閲覧	832	PV
訪問者	560	IP
トータル
閲覧	34,912,696	PV
訪問者	8,723,152	IP
ランキング
日別	644	位
週別	545	位

	【11/18】goo blogサービス終了のお知らせ
	【PR】プロ直伝・dポイントをザクザクためる術
	【PR】安い＆大量の「訳あり商品」がヤバい!
	【コメント募集中】お気に入りの「道の駅」ありますか？

ウィリアムのいたずらの、まちあるき、たべあるき

ウィリアムのいたずらが、街歩き、食べ物、音楽等の個人的見解を主に書くブログです（たま～にコンピューター関係も）