一次報酬と二次報酬

2010年04月17日 12時12分41秒 | 竹田家博物誌

釣り道具屋さんに行くと「サシ」と称して人工的に飼育したハエの幼虫を手に入れることができるんですけれども、こいつをもてあそんでいると、とても面白いことが分かります。

ハエの成虫は手を近付けると逃げてしまいますが、幼虫は逃げません。けれども光を嫌がることから幼虫にも眼があることは明らかです。幼虫は成虫に比べて眼や筋肉が発達していないのは当然ですけれども、一番の違いは神経系の違いだと思います。

カエルとオタマジャクシを比べてみてもわかると思うんですけど、カエルは手を近づけると「捕まえられる前に」逃げようとするのに対して、オタマジャクシは「捕まえられてから」逃げようとすることが分かります。(1)
まあ、表面的には大した違いではないわけですけれども、「脳の働き」という側面から見ると歴然とした違いなんですね。

「サシ」もオタマジャクシと同様で「予測する」ということができないように見えます。ハエは卵を餌の中に産み付け、生まれた幼虫はともかく食べる。そして進む。食べたものがおいしければ、また進む。ハエの幼虫は「イベント―報酬」の単純な回路で生命活動を営んでいると思いますが、成虫の方はプレ・イベントがある。すなわち「イベント―報酬」と「予測―イベント―報酬」の二段構えになっているのではないか。このことが外敵からの逃避行動によく現れていると思います。

そしてこの二段目のシステムの方は、そもそも「予測」というものがあるために、単純にそのシステムが完成体として備わっているだけでは機能をきちんと果たしてくれるということが保証されず、どうしても過去の蓄積というものが必要になってくるわけです。
「過去の蓄積」はもちろん「記憶」のような「情報」でもいいですし、ダイナミックに回路の構成が組み変わった痕跡としての複雑化した「回路」、あるいはまた「組み変るという機構そのもの」でもよいはずです（過去の蓄積＝情報＋回路＋機構）。

単に「成功に対する報酬」と「情報」「回路」「機構」が備わっていれば「予測―イベント―報酬」系のシステムが稼働できるのであれば、DNAにその設計図が含まれていれば、カエルやハエの成虫にみられる行動を成長の早期の段階で“一挙に”発現させることも可能だったでしょう。ところが実際には幼虫やオタマジャクシというかなりの期間を経過してから発現するわけです。このことは「イベント―報酬」系が、生まれて“即座に”利用できることと極めて対照的です。
しかしながら、ヒトやマウスのゲノムが解読された現在、そうしたものがストレートにDNAに書かれている可能性はほぼなくなったわけです。20世紀のマンガに見られたようなDNA万能説は全くの夢物語だったのだと…。例えば緊急に自分の影武者が必要になったとして、自分のDNAから成人したコピー人間を作ったとします。外見は確かに自分とそっくりにできるし、食事も普通に出来ると思いますけど、コピー人間は、いろいろな面で人間的に“足りない”…おそらく相手の会話内容に応じて相づちを打ったりすることが、普通にできないかもしれません。脳の予測システム構築には、過去の蓄積が必要だからです。

「予測―イベント―報酬」系の稼働には、必然的に準備期間が必要ということになります。学習です。実際に行動して神経回路に覚え込まさなくてはなりません。ハエやカエルに面倒見のよい教師はいませんから、自分で進んでレッスンをする必要があるわけです。捕れないと分かっていても、ともかく捕ろうとしなくては始まらないわけです。

それでは、生命体に「予測―行動―報酬」系の行動をとらせるためには、どうしたらいいでしょう？

それには、それに見合った報酬があればいいわけです。実際に獲物を食べることができなくても、最初は例えば目で見たものにタッチするだけで脳内報酬が起きる仕組みがあればいいわけです。

ところが「予測―行動―報酬」系の行動には、報酬が得られるまでに何度かチャレンジしなくてはならなかったり、チャンスが到来するまでしばらく待たなくてはならなかったりするわけです。このままではこうした行動を継続しようとせず、あきらめてしまうハエやカエルが続出してしまいます。どうしたらいいでしょう？

ハエやカエルを諦めさせないためには、願望を抱かせ続ける仕組みが必要です。

その有力候補が一つあります。眼を使って、視覚を利用して多様な獲物をとらえている動物には「探索像」を利用するものがありますね。
「探索像」がどんな物なのかまだ分かっていませんが、獲物の視覚イメージを抽象化しシンボライズすることで、特定の獲物を効率良く選別することができる、そういう役割があるんだと思います(2)。最近のデジタルカメラには「顔認識」の機能がありますし、工業製品の部品を作る工場では異物検出の目的にCCDカメラを使っています。良品形状を記憶することで異物や不良品を選り分けるわけです。これと似たような仕組みなのではないでしょうか。
水槽で飼っている魚でも、餌が急に変るとなかなか食べてくれないということがしばしば起こりますよね。ザリガニやテナガエビではこういうことはありません。これは、視覚が発達した動物ほど、探索像に依存した餌の捕り方をするためと説明できると思います。

この「探索像」は、獲物を捕まえるためにできた仕組みですけれども、これを先ほどの「諦めさせない」つまり「願望を抱かせ続ける」ということに使えないかどうか？

獲物を見定めた生命体は「探索像」なり、類似の戦略の対象となるターゲット像を保持するだろうと考えられるわけですが、ターゲット像を保持している間、つまり「獲物を獲ろうとしているがまだ成し遂げられていない」間、時間の経過とともに欲求が強まっていくという仕組みがあれば、それが「すぐに諦めてしまう」ということに対する予防線として役立つだろう、ということは容易に想像できると思います。諦めてしまうことが減れば、それに伴って、より難易度の高い行動をとる機会も増えてくるのではないでしょうか。

そしてまた、そのような仕組みが実際にあるとしますと、魚からすれば、海馬をリセットして新しいターゲット象を設定し直すよりも、“旧い”ターゲット像をそのまま保持して追跡した方が得られる報酬が高くなるはず――こういう推測もできるかと思います。
そうすると小魚の群れなどを襲う場合、次から次へと攻撃対象を移していくのではなく、一度決めた攻撃対象を繰り返ししつこく狙うという傾向が生じることになると思います。(3)

もちろんそのような“頑なな”行動をとってもトータルの捕獲量が少なくなってしまえば、「食べる」ことの直接的な報酬が少なくなってしまうわけですから、同じ種類の小魚ばかりを単純に繰り返し襲うということではないでしょう。そこには一定のバランスが生じることになるでしょう。
「食べる」というイベントに伴う直接的な脳内報酬を「一次報酬」、予測をし、戦略を立て、採餌行動というイベントが首尾よく完了したときの報酬を「二次報酬」と呼ぶことにすると、どちらか一方の報酬を最大化するように行動が図られるのではなく、一次報酬と二次報酬の兼ね合いで行動が決まることでしょうし、個体ごとにそのバランスの均衡点は異なるでしょう。結果的に採餌行動にバリエーションと自由度が生まれることになると思います。単純に一次報酬だけで行動が決まるとすると、自ずとそのピークは1点に集中するので全ての魚がほとんど同じような行動をとるはずですが、実際には船釣りのイナダのように、捕食行動は個体ごとにずいぶん異なっているわけです。

「喚起から捕獲までの時間が長引くほど二次報酬期待の強度は強まっていく」ことが正しいとすると、ひとつ考えられることは、結局最終的には行動せずにはいられなくなるのではないかということです。なぜなら、この欲求は無視することができず、実際に行動することによってしか解消されないからです(4)。もちろん何か別な目標物を見つけてターゲット像を更新すれば解消されるわけですが、ここまで来てしまうと、哀れにも、もはやどのような目標物を見てもそれが魅力的に見えないわけです。そうすると、この種の“自分を慰める”代償行動は、必然的に落差というかギャップを味わうことになります…。

一次報酬への期待や憧れは「食欲」や「渇き」であり、これらは実際に個々の細胞が「飢える」ことによって強まっていきます。
一方、二次報酬への期待は「見ること」によって喚起される欲であり、これは細胞の「飢え」に関係なく眼を有する動物に特有の捕獲行動を促すための不思議な作用によって強まっていくのではないかという推測ができるかと思います。

1　「攻撃された」経験を持たないオタマジャクシが外敵から逃れようとする行動は、よく考えてみると面白いテーマです。
2　佐原雄二「魚の採餌行動」64～71ページ。（東京大学出版会、1987年）
3　実際に産卵期のブラックバスなど、集団を形成している小魚に対してアタックをしている光景をよく見るわけです。それで「ガボッ」という水しぶきの上がったときに口を大きく開けて食べているように見えるわけですけれども、よく観察していると本気で食べているというよりもむしろ「体当たり」が目的のようにも見えます。そして群から飛び出した小魚があると、その1尾に照準を合わせて、浅瀬までダッシュで追い続けるという行動がしばしば見られます。夏には小型青物が海岸に回遊してきて、小魚を追い回す光景が見られますけど、小魚を夢中で追いかけている魚の目の前にルアーを投げても、こちらに振り向かせることは案外容易でないことはよく経験することです。もちろんおとなしく泳いでいる群よりも、活気づいた群の方が釣られやすいということも事実なのですが。このように明らかに経済的でない採餌行動の背景には、「より旧くなった探索像ほどそれに対する報酬が大くなる」というメカニズムが働いている証拠なのかも知れません。
4　二次報酬期待を抱いている間、動物は必然的に覚醒状態に置かれることになるわけです。しかしながらほとんどの動物は概日リズムによって、1日1回休息することを強いられます。このことは看過できない神経的ジレンマだと思います（眠りたいのに眠れない…）。

2025年1月
日	月	火	水	木	金	土
			1	2	3	4
5	6	7	8	9	10	11
12	13	14	15	16	17	18
19	20	21	22	23	24	25
26	27	28	29	30	31

竹心の魚族に乾杯

Have you ever seen mythos? 登場する団体名、河川名は実在のものとは一切関係ございません。

一次報酬と二次報酬

このブログの人気記事

コメントを投稿

「竹田家博物誌」カテゴリの最新記事

goo blog お知らせ

プロフィール

文字サイズ変更

検索

最新記事

カテゴリー

最新コメント

カレンダー

ブックマーク

goo blog おすすめ

バックナンバー

Have you ever seen mythos?
登場する団体名、河川名は実在のものとは一切関係ございません。