〇 Excelでゲーム理論の利得表、「囚人のジレンマ」のカラクリを解き明かす。
今回は少々趣向を変えて、ゲーム理論でよく利用する「利得表」をExcelで作成してみた。ただし作り方に関する説明はほとんど要しないので、プラスアルファとして、作成した利得表を基に「囚人のジレンマ」のカラクリを解き明かすことにしたい。
Excelで作る利得表。
ゲーム理論とは、複数の主体が個々の意思決定によって影響を受ける状況において、主体がどのように意思決定し行動するのかについて理論化したものだ。天才数学者ジョン・フォン・ノイマンの論文「室内ゲームの理論」がその端緒の1つになった。
このゲーム理論でよく用いるツールに「利得表」がある。これは一般に2人のプレーヤーが複数の戦略を持っていて、それぞれの戦略を同時に実行した際、双方の利得を数字で表したものだ。下図はExcelで作成した利得表の一例で、行高や列幅を調整したシンプルな表になっている。
ここではゲームの主体がプレーヤー1とプレーヤー2の2人だ。プレーヤー1は表の行側で2つの戦略を持つ。またプレーヤー2は表の列側でこちらも2つの戦略を持つ。セルに表示した値は、各戦略を実行したときの両者の利得で、左側がプレーヤー1、右側がプレーヤー2のものになる。
例えばプレーヤー1が戦略1、プレーヤー2が戦略2を採用したとすると、両者の利得はプレーヤー1がF4の「6」、プレーヤー2がG4の「0」になることが分かる。
さらに下図の利得表では、数字はそのままで、プレーヤーの名前と戦略の名称を書き換えた。実はこの利得表、ゲーム理論の中でも最も著名なモデルといえる「囚人のジレンマ」を示した利得表なのだ。どういう意味か、まずは「囚人のジレンマ」について説明し、その後、利得表を基にそのカラクリを検証しよう。
「囚人のジレンマ」とは何か。
ここに囚人XとYがいる。彼らはある罪を犯したかどで警察に逮捕された。ところがその後、取り調べをしているうち、彼らに新たな犯罪の容疑が浮かび上がった。しかし、囚人XもYも自白しようとはしない。そこで、刑事はちょっとした工夫を凝らす。
刑事は、まず、2人を別々の取調室に呼び出した。もちろん囚人の2人は連絡を取り合うことはできない。その上で刑事は囚人Xにこう言った。
「キミと囚人Yに新たな容疑が浮かび上がったのは承知だと思う。この件に関してキミらが黙秘するのも、自白するのも自由だ。
キミら2人とも黙秘すれば、従来の罪により2年の服役だ。ただし、キミだけが自白し、囚人Yが黙秘なら、キミは無罪放免に処し、囚人Yは6年の服役に処する。
しかし、キミが黙秘して囚人Yだけが自白したら、キミは6年の服役、囚人Yは無罪放免だ。さらに、どちらも自白したら両名とも4年の服役に処する。
いま同じことを囚人Yにも伝えているところだ。自白するも、黙秘するも自由だ。どちらにするか、いまここで答えを出してもらおう。さあ、どうする」。
以上が「囚人のジレンマ」の粗筋だ。何がジレンマなのか、下図の利得表で説明しよう。注意したいのは、利得表に示した値が刑期の年数ということだ。だから値が小さいほどそれぞれの囚人にとって有利になる。
まず、刑事からの提案を囚人Xの立場から考えてみよう。囚人Yが「黙秘」の場合、囚人Xが「黙秘」すれば刑期は「2」年、「自白」すれば「0」年だ(①)。明らかに「自白」した方が得だから「0」を強調表示にした。
次に囚人Yが「自白」の場合、囚人Xが「黙秘」すれば刑期は「6」年、「自白」すれば「4」年だ(②)。明らかに「自白」した方が得だから「4」を強調表示にした。
続いて囚人Yの立場で考えてみよう。囚人Xが「黙秘」の場合、囚人Yが「黙秘」すれば刑期は「2」年、「自白」すれば「0」年だ(③)。明らかに「自白」した方が得だから「0」を強調表示にした。
さらに囚人Xが「自白」の場合、囚人Yが「黙秘」すれば刑期は「6」年、「自白」すれば「4」年だ(④)。明らかに「自白」した方が得だから「4」を強調表示にした。
以上から、囚人Xと囚人Yはともに「自白」したほうが有利になる。結果、両者とも「自白」で「4」年の刑期になるというのが、「囚人のジレンマ」のシナリオだ。
しかし利得表をよく見てもらいたい。両者とも「黙秘」すれば「2」年の刑期で済み、「4」年の刑期よりも断然有利だ。しかし、相手の裏切りを恐れて「自白」してしまう。だからこの状況は2人の囚人にとって大いなるジレンマなのだ。