人間は報酬を受け取る前から受け取ることを前提として無思考で行動選択する。人間の論理は機械学習の重みづけと同様に認知過程のフィルター歪みが思考のベースとなっている。客観的認知判断は常に報酬によって導かれるので(人間は見たいものしか見えない)、少なくとも脳内では人のやる気というものに無報酬予測な刺激はゼロである。偏見と自明との間に区別を置くことは人間の脳にはできない。
もしあなたが自分の周りの誰かの次の行動をあなたの都合のいいように特に自ら進んで行うように支配しようとするのであれば、直接に報酬を見せてはいけない。そういう時は報酬示唆は逆効果となる。時にはあなたを知る人に弱みを見せて報酬に至る道、シグナルを気づかせなければならない。
こうした示唆による人間支配を報酬主張claims for the rewards による支配という。
論文要旨
Neuronal Reward and Decision Signals: From Theories to Data
要旨
報酬は学習、接近行動、選択、感情を誘発する重要な対象である。情動は動物で調べるのが難しいが、学習機能は強化学習理論の基本構成を実行する神経細胞の報酬予測エラーシグナルによって媒介される。これらのシグナルは、線条体と前頭皮質にグローバルな報酬シグナルを発するドーパミンニューロンと、線条体、扁桃体、前頭皮質の特定のニューロン集団に投射されるニューロンに見られる。アプローチと選択機能には主観的価値が関与しており、主観的価値は内的な主観的報酬選好を引き出す行動選択によって客観的に評価される。効用は主観的価値を数学的に特徴づけるもので、経済的選択理論における主要な意思決定変数である。効用は、ドーパミンの位相反応による効用予測誤差としてコード化される。効用は、リスク、遅延、努力、社会的相互作用を含む様々な影響を組み込むことができる。正式な意思決定メカニズムにふさわしく、報酬は特定のニューロンによって対象価値、行動価値、差異価値、選択価値としてコード化される。報酬、強化、決定の変数はすべて理論的構成要素であるが、それらのニューロン信号は測定可能な物理的実装を構成し、その結果、これらの概念の妥当性が確認される。ニューロンの報酬シグナルは、行動の自由意志を制約しながら、行動のガイダンスを提供する。
次へ
I.はじめに
報酬は生命にとって最も重要なものである。その機能は、私たちに食べさせ、飲ませ、交尾させることである。より良い報酬を得ることができる脳を持つ種が、進化において勝利する。私たちの脳はこのように報酬を獲得し、それを可能な限り最善の方法で行っている。それが脳が進化した理由かもしれない。脳は多細胞生物が世界を移動することを可能にする。移動することで、偶然にもたらされるよりも多くの報酬にアクセスすることができ、生存と繁殖の可能性を高めることができる。しかし、動くだけでは餌も交尾相手も得られない。最良の栄養素や交尾相手につながる刺激、物体、出来事、状況、活動を特定することが必要なのだ。脳は個体に生存と繁殖のための最良の報酬を学習させ、選択させ、接近させ、消費させる。そのために脳は、生存と繁殖に必要な対象の報酬価値を識別し、学習、接近、選択、肯定的感情を通じて、これらの報酬対象の獲得を指示する必要がある。感覚の識別と運動の制御は、脳のこの主要な役割を果たす。これらの機能のために、自然は報酬機能の重要な側面をすべて処理する明確な神経細胞報酬シグナルを私たちに授けている。
報酬はその物理的特性によって定義されるのではなく、報酬が引き起こす行動反応によって定義される。したがって、報酬機能の概念を提供する行動理論が必要となる。理論的な概念は、実験のための検証可能な仮説を立てたり、結果を解釈するために使用することができる。このように、報酬と意思決定の分野は仮説主導型であるだけでなく、概念主導型でもある。報酬と意思決定の分野は、感覚システムの研究が信号検出理論から、運動システムの研究が力学の理解から恩恵を受けるように、発達した行動理論から恩恵を受ける。報酬理論が特に重要なのは、報酬に対する特定の感覚受容体が存在しないためである。したがって、この理論は物理的報酬パラメータの説明力の限界を克服し、研究される報酬パラメータの行動評価の必要性を強調するのに役立つ。これらの理論により、ばらばらのデータに一貫性と首尾一貫性が生まれ、一見直感的だが逆説的な説明を避けることができる。
報酬機能の理論では、測定可能な行動から得られる主観的報酬値のような、少数の基本的な変数を用いる。この変数は、報酬機能のすべての重要な要素を凝縮し、多種多様な行動を特徴付け、予測する定量的な形式化を可能にする。重要なことは、この変数は仮説であり、外部の物理世界には存在しないということである。しかし、脳内では様々な神経細胞の報酬信号の中に実装されており、物理的根拠があるように思われる。洗練された報酬や決定過程は、難解な基本変数よりもはるかに魅力的であるが、その解明は報酬処理を理解する上で極めて重要であろう。1897年、ケンブリッジ・キャベンディッシュ研究所でのJ・J・トンプソンによる難解な電子の発見がなければ、我々はどうなっていただろうか?この発見がなければ、マイクロプロセッサーもインターネット全体も不可能だっただろう。あるいは、電磁波について知らなければ、朝のコーヒーを飲みながらラジオの中にニュースリーダーが座っていると思い込んでいたかもしれない。 この総説では、特に基本的な報酬変数、まず学習に関するもの、次に意思決定に関するものを取り上げる。
報酬の主な機能は3つである。
- 連合学習(すなわち古典的条件付けとオペラント強化)を生み出す[1]。
- 意思決定に影響を及ぼし、アプローチ行動を誘発する(報酬刺激に動機付けに関する際立ちを割り当てることによって)[1]。
- 肯定的感情、特に喜びを誘発する[1]。
その洗練された行動レパートリーにより、感覚処理、運動、注意による交絡をコントロールしながら、詳細で定量的な行動評価が可能である。したがって私は、20億個以上のニューロンを持つアカゲザルの脳において、微小電極の先端の視点から、一度に1個のニューロン、何年もかけて何千個ものニューロンから報酬処理にアプローチしているのである。このテーマに関する最近の研究は数多くあり、ここで扱う概念への貢献度によってこれらの研究を選んでいるため、全文を引用できなかった著者には申し訳ない。
こちらへ
II.報酬関数
A.近位報酬機能は行動によって定義される
私たちは環境事象に反応する感覚受容体を持っている。網膜は限られた範囲の電磁波を捉えている。光学物理学、物理化学、生化学は、電磁波がどのように眼に入り、光子がどのように網膜光受容体のイオンチャンネルに影響を与え、神経節細胞がどのように視覚メッセージを脳に伝達するかを理解するのに役立ちます。このように感覚受容器は、環境事象からのエネルギーを活動電位に変換して脳に送ることで、視覚系の機能を規定しているのです。触覚、痛覚、聴覚、嗅覚、味覚も同様である。特定の環境エネルギーに対する受容体がなければ、私たちはそれを感じない。魚の中には磁場を感じるものもいるが、人間は磁場を感じない。このように、物理学と化学は感覚システムの機能を定義し、調査する上で大いに役立つのである。
報酬にはそれがない。報酬となる刺激や物を例にとると、私たちはそれを見たり、感じたり、味わったり、嗅いだり、聞いたりする。それらはあらゆる感覚系を通じて私たちの身体に影響を与えるが、報酬の特定の動機づけ特性をとらえるような特定の受容体は存在しない。報酬の機能は物体の特性だけでは説明できないため、物理学や化学は限られた助けにしかならず、報酬受容体の特性を見て報酬処理を調べることはできません。その代わりに、報酬はそれが引き起こす特定の行動反応によって定義される。したがって、報酬の機能を理解するためには、行動を研究する必要があるのです。電波望遠鏡が天文学にとって重要な道具であるように、行動は報酬機能を調査するための重要な道具となる。
報酬という言葉にはほとんど神秘的な意味合いがあり、ジェレミー・ベンサム(彼の防腐処理された遺体はユニバーシティ・カレッジ・ロンドンに展示されている)やジョン・スチュアート・ミルの功利主義哲学の倫理学から、ティム・シュローダーの現代科学哲学に至るまで、多くの哲学論文の主題となっている(39, 363, 514)。より一般的には、巷の人々は報酬を、学校の成績が良かった子供へのチョコレートのように、特別な業績に対するボーナスとして、あるいは私たちを幸せにするものとしてとらえている。これらの説明は、科学的調査にとって完全でも実用的でもない。この分野は、報酬処理に関する知識を驚くほど進歩させ、これらの調査を経済的意思決定にまで拡大することを可能にした、明確に定義された報酬関数の数に落ち着いた。われわれが扱う報酬の機能は、学習、アプローチ行動と意思決定、快楽の3つである。
1.学習 報酬には学習をもたらす可能性がある。学習はパブロフの主な報酬機能である(423)。彼の犬は、ソーセージがしばしば後に続くとベルに唾液を分泌するが、結果なしにベルが鳴っただけでは唾液を分泌しない。最初は中立だったベルに対する動物の反応が、ソーセージのために変化したのだ。今、ベルはソーセージを予測している。ソーセージはタダで手に入るので、自らの行動は必要なく、学習もまたタダで起こる。このように、パブロフの学習(古典的条件づけ)は、被験者が目を覚まして軽い注意を払っている以外に、自ら積極的に参加することなく自動的に起こる。次にソーンダイクの猫がいる。猫はケージの中を走り回り、とりわけレバーを押すと突然食べ物を手に入れる(589)。その食べ物は最高で、猫はますます熱中して何度も何度もレバーを押す。猫はまた戻ってくる。これが道具学習あるいはオペラント学習である。そうでなければ、報酬は得られず、学習も起こらない。行動を要求することが、パブロフ学習との大きな違いである。このように、オペラント学習は行動に関するものであるのに対し、パブロフ学習は刺激に関するものである。この2つの学習メカニズムは図式的に区別することができるが、一緒に起こることが多く、報酬に対する行動反応の構成要素となっている。
オペラント条件づけにおける報酬は正の強化子である。報酬は、その報酬につながる行動の頻度と強さを増加させ、維持する。ソーンダイクの猫がより多くの報酬を得れば得るほど、より多くのレバーを押すようになる。 強化子は猫の行動を強化・維持するだけでなく、ビール、ウイスキー、アルコール、リラックス、美容、交尾、赤ちゃん、社交的な仲間など、さまざまな刺激、物、出来事、活動、状況を得るためにも作用する。オペラント行動学では、報酬の定義を明確にしている。個々人をより多くのために戻ってくるようにするものはすべて正の強化因子であり、したがって報酬である。これは良い定義であるが、正の強化はいくつかの報酬機能の1つに過ぎない。
2.アプローチ行動と意思決定 報酬は魅力的です。報酬はやる気を起こさせ、私たちに努力をさせます。私たちは報酬を欲しており、報酬に出会っても通常は中立を保つことはない。報酬は食欲行動や準備行動とも呼ばれる接近行動や消費行動を引き起こす。私たちは報酬に出会うと近づきたくなり、報酬を得る準備をする。近づかなければ、食事や交尾相手を得ることはできない。通常、報酬は単独で得られるものではなく、異なる報酬の中から選ぶことができる。私たちはある報酬が他の報酬よりも魅力的だと感じ、最良の報酬を選ぶ。こうして私たちは報酬に価値を見いだし、最高の価値を得るために報酬を取捨選択する。そしてそれを消費する。つまり、報酬は魅力的であり、報酬を消費するのに役立つ接近行動を誘発する。したがって、私たちを接近させ、消費させる可能性のある刺激、物体、出来事、活動、状況は、定義上、報酬なのである。
3.ポジティブな感情 報酬はポジティブな感情を引き起こす可能性がある。報酬によって喚起される感情の筆頭は喜びである。私たちは美味しい食事をしたり、面白い映画を見たり、素敵な人に会ったりすることを楽しむ。快楽は一過性の反応であり、幸福という長続きする状態につながるかもしれない。快楽にはさまざまな程度や形態がある。のどが渇いている人には水が、空腹な人には食べ物が心地よい。味覚の報酬効果は、それが呼び起こす快楽に基づいている。宝くじが当たれば、さらに快感が増す。しかし、多くの楽しみは数度以上の違いがある。スポーツをする人がランニングや水泳で経験する高揚感、交尾の相手と出会うことで呼び起こされる欲望、性的オーガズム、薬物使用者が報告する陶酔感、赤ちゃんに対する親の愛情などは、快楽の度合い(量)ではなく、異なる形態(質)を構成している。
私たちは一度報酬による快楽を経験すると、再びそれを得たいという欲求を形成することがある。のどが渇いたり、おなかがすいたりしたときに、水や食べ物が助けになることを知っていれば、それを欲する。このような具体的な欲望とは異なり、想像上の、あるいは火星への飛行のような不可能な報酬に対する欲望もあり、その場合、欲望は願望となる(514)。欲望は、報酬の予測、あるいは少なくとも表象を必要とし、[何かについてであること(529)]意図的な能動的プロセスを構成する。欲望は行動に目的を持たせ、行動を識別可能な目標に向かわせる。このように、欲望は既知の報酬に向けて行動を能動的に方向づけるのに役立つ感情であり、快楽は受け取った報酬や予想される報酬から派生する受動的な経験である。欲望は快楽と複数の関係を持っており、それ自体が快楽であることもあれば(私は快楽的な欲望を感じる)、快楽につながることもある(私は快楽的な対象を得たいと望む)。このように、快楽と欲望は際立った特徴を持っているが、密接に絡み合っている。これらは報酬によって誘発される最も重要なポジティブ感情を構成している。これらは私たちの意識的な処理を優先させるため、行動制御の重要な構成要素となっている。これらの情動は、依存症研究において、好き(快楽)、欲しい(欲求)とも呼ばれ(471)、報酬の学習・接近生成機能を強く支えている。
報酬機能において絶大な力を持つにもかかわらず、快楽と欲求を客観的に測定可能な方法で評価することは非常に困難であり、擬人化の試みにもかかわらず、動物を対象とした科学的調査にとってはさらに大きな問題である(44)。私たちは、他の人間が何を感じ、何を欲しているのか正確には知らないし、動物が何を感じているのかはもっと知らない。私たちは、人間の快楽に関する言語的報告に関連する行動反応から快楽を推測することができる。快楽や欲求の表れとして、血圧、心拍数、皮膚抵抗、瞳孔径を測定することもできるが、これらはさまざまな感情とともに起こるため、特定できない。ヒトが快感を覚える刺激や出来事の中には、動物が快感を覚えることすらなく、生得的なメカニズムによって起こるものもある。私たちにはわからないのだ。とはいえ、進化による快楽と欲求の発明は、多くの刺激、対象、出来事、状況、活動を魅力的なものにできるという大きな利点があった。このメカニズムは、必須物質や交尾相手を得るという主要な報酬機能を重要な形で支えている。
4.潜在的報酬は、学習、接近、決断、ポジティブな感情を生み出す可能性がある。 ある瞬間にその機能が呼び起こされなくても、報酬は報酬である。例えば、オペラント学習は、被験者がオペラント反応を起こした場合にのみ起こるが、被験者がオペラント反応を起こさず、報酬が学習機能を発揮できなくても、報酬は報酬のままである。同様に、接近を誘発したり、私を喜ばせたり、欲望させたりする可能性のある対象は報酬であり、忙しいとか、関与しない理由があるからといって、必ずしも毎回行う必要はない。パブロフの条件付けによる接近行動は、報酬が少なくとも最小限の注意を喚起する限り、報酬に遭遇するたびに起こるが、これはこのことをうまく示している。
5.罰 報酬以外の動機づけイベントの2番目の大きなカテゴリーは罰である。罰は否定的なパブロフ学習や否定的なオペラント強化、受動的・能動的回避行動、恐怖・嫌悪・悲しみ・怒りなどの否定的感情を生み出す(143)。罰(反応強度の低下、受動的回避)と負の強化(反応強度の増強、能動的回避)はより細かく区別されます。
6.報酬の構成要素 報酬となる刺激、物、出来事、状況、活動はいくつかの主要な構成要素からなる。まず、報酬には基本的な感覚的要素(視覚、聴覚、体性感覚、味覚、嗅覚)があり(図1左)、大きさ、形、色、位置、粘度、酸味などの物理的パラメータがある。食物や液体の報酬には、炭水化物、タンパク質、脂肪、ミネラル、ビタミンなど、生存に必要な化学物質が含まれており、物理的に測定可能な量の分子が含まれている。これらの感覚成分は脳の特定の感覚受容体を介して作用する。報酬の中には、認知プロセスによって検出される状況や、運動プロセスを伴う活動からなるものもあり、これらもまた感覚的なものに類似した基本的な構成要素となっている。第二に、報酬は顕著であるため、注意を喚起し、方向づけ反応として現れる(図1中)。報酬の顕著性は、3つの主要な要因、すなわち、その物理的強度とインパクト(物理的顕著性)、その新規性と驚き(新規性/驚きの顕著性)、そして懲罰者と共有される一般的な動機づけのインパクト(動機づけの顕著性)に由来する。このスキームには含まれていない別の形態であるインセンティブ・サリエンスは、主に依存症におけるドーパミン機能を扱うもので、(学習とは対照的に)接近行動のみを指し、したがって報酬であって罰ではない(471)。この用語は、学習におけるドーパミンの役割に関する現在の結果(下記参照)とは矛盾しており、明確なドーパミン反応成分が認識される以前の、最初の相反する反応成分に基づく注意のドーパミン機能の仮定を反映している(下記参照)。第3に、報酬には、報酬の積極的な動機づけ効果を決定する価値成分があり、感覚成分や注意成分には含まれず、説明もつかない(図1右)。この要素は行動の嗜好を反映するため、主観的であり、物理的パラメータによって部分的に決定されるにすぎない。私たちが報酬として理解するのは、この要素だけである。この構成要素は、生物の生存と繁殖にとって極めて重要な、報酬による特定の行動強化、接近生成、感情的効果を媒介する。
主な報酬の構成要素が揃うことで、最大の報酬獲得が可能になる。感覚成分がなければ、報酬の識別は困難であり、注意成分がなければ、報酬処理の優先順位付けが不十分であり、価値成分がなければ、無駄な対象を追い求めることになる。実用的な報酬実験では、価値成分はデザインにおいて別個の変数として認識されるべきであり、感覚成分や注意成分とは区別され、無相関でなければならない。
報酬成分は、環境刺激、物体、出来事が生体に与える影響を反映する外的成分と、脳機能によって生成される内的成分に分けることができる。感覚成分は外的事象に由来するため外的であり、評価を開始する前に刺激を識別することができる。例えて言えば、外的な物理的顕著性成分は刺激主導型の注意につながる。最も重要な内的要素は報酬価値である。これは刺激、物体、出来事、状況、活動に本来備わっているものではなく、それらが生存と再生産に有用であるという脳の評価を反映したものである。価値は物理的な報酬パラメータで適切に定義することはできないが、内的で、私的で、観察不可能で、個人間で比較不可能な主観的嗜好で表される。これらの選好は、客観的に測定可能なアプローチ行動や選択によって引き出される。価値の内的な性質は、それに関連する動機づけの顕著性にも及ぶ。同様に、報酬予測因子も、記憶された事象との比較に依存する新奇性/驚きの顕著性と同様に、外部の事象にハードワイヤされているのではなく、神経細胞の学習と記憶のプロセスを必要とする。報酬予測因子は、報酬が発生する前に、環境の顕著性マップを確立するトップダウンの認知的注意を生み出す。さらに内的な報酬の構成要素は、潜在的に報酬のある環境状況を識別する認知過程と、内発的に報酬のある運動を媒介する運動過程である。
B.遠位報酬機能は進化的フィットネスである
現代の生物学理論は、現存する生物は進化的競争の結果であると推測している。リチャード・ドーキンスは、適者生存という考えを推し進め、生命の基本的なメカニズムとして遺伝子の生存と伝播を強調している(114)。最も適した表現型につながる遺伝子だけが生き残る。表現型は遺伝子の伝播を最大化する行動に基づいて選択される。そのためには、その表現型が生き残り、子孫を残し、競争相手よりも優れていなければならない。このように、報酬の究極的で遠位的な機能は、生物の生存と繁殖を保証することによって進化的フィットネスを向上させることである。そうすると、現在の生物の行動報酬機能は、遺伝子の伝播を最大化する表現型の進化的選択の結果ということになる。学習、接近、経済的意思決定、肯定的感情は、表現型が生存、交配、子孫の世話に必要な栄養素を得るための近位的機能である。
行動的報酬機能は、個体が遺伝子を伝播するのを助けるために進化してきた。個体は繁殖するのに十分な長さで、よく生きる必要がある。そのためには、体を正常に機能させる物質を摂取する必要がある。その物質は食べ物や飲み物と呼ばれる固体や液体の形で含まれている。そのため、食べ物や飲み物は報酬である。経済的な交換に使われるものも含め、追加の報酬が十分な食べ物と飲み物の供給を保証している。交配と遺伝子の伝播は、強力な性的魅力によって支えられている。体型のような付加的な性質は、交尾の機会を増やし、子孫を養い守るので、報酬となる。子孫が自ら繁殖できるようになるまで世話をすることは、遺伝子の伝播を助け、報酬となる。そうでなければ交配は無意味である。どんな小さなエッジでも最終的には進化的に有利に働くので(112)、新奇性の追求や探索のような付加的な報酬メカニズムは、利用可能な報酬のスペクトルを広げ、生存、繁殖、最終的な遺伝子伝播のチャンスを高める。これらの機能は、自分自身の興味によって決定され、環境ではすぐには得られない遠くの報酬の利益を得るのに役立つかもしれない。このように、遺伝子の伝播と進化的適性における遠位報酬機能は、日常的な行動に見られる近位報酬機能を定義している。食べ物、飲み物、仲間、子孫が報酬をもたらすのはそのためである。
報酬を求めるという要求が、脳の構造と機能を規定する遺伝子の進化につながった。つまり、動き回り、刺激を識別し、価値を見いだし、決断や行動を通じて報酬を獲得することで、環境中の報酬を検知し、求め、学習するために脳は作られているのである。 脳は素晴らしい食事を楽しむために作られたのではなく、生き残るために最高の食べ物を得るために作られたのであり、その方法のひとつは、人々が食べるものに気を配り、感謝するようにすることなのだ。
C.ご褒美の種類
報酬という言葉にはいろいろな呼び方がある。心理学者は報酬につながる行動を強化することから正の強化子と呼び、行動の結果や行動の目標と呼ぶ。経済学者はそれを財または商品と呼び、意思決定者にとっての主観的価値を効用と評価する。私たちは今、学習、接近、意思決定、肯定的感情といった近位機能を引き出し、進化的適性という究極の遠位報酬機能を果たす刺激、対象、出来事、活動、状況の種類を特定したいと考えている。
1.一次的なホメオスタシスと生殖の報酬 遺伝子を確実に伝播させるために、一次的な報酬は遺伝子を持つ個体の生存とその生殖を媒介する。これらの報酬は個体の生存に必要な物質を含む食物や液体であり、交尾、子孫の生産、子孫の世話に必要な活動である。これらは魅力的であり、すべての動物や人間において進化的適性を達成するための主要な手段である。一次食物と液体報酬は、恒常性の不均衡を是正する役割を果たす。これらはハルの意欲減退理論(242)の基礎となっているが、しかし恒常性によって定義されない報酬には適用されないだろう。性的行動は、少なくとも男性においてはホルモンのアンバランスに従うが、快楽にも強く基づいている。このような主要な食欲と交尾の報酬を獲得し、それに従うことが、そもそも脳の報酬系が進化した主な理由である。一次」報酬とは、無条件報酬と条件付き報酬の区別を指すのではないことに注意。実際、ほとんどの一次報酬は学習されるため、条件付き報酬となる(食物は典型的に学習される一次報酬である)。
2.2.非一次報酬 その他の報酬はすべて、一次報酬である摂食報酬や交尾報酬の機能を高める役割を果たし、生存、繁殖、進化的淘汰のチャンスを高める。ホメオスタシス報酬や生殖報酬でなくても、それ自体が報酬なのである。このような非一次的報酬は、お金や洗練された車、高価な宝石のような物理的で目に見えるものであったり、一杯のワインのような物質的な液体であったり、スパイスやアルコールのような特定の成分であったりする。日本庭園や豪華な夕日の視覚的特徴、キース・ジャレットのケルン・コンサートの音響美、カリブ海の水の温かい感触、グルメ・ディナーの豪華な味、香水の抗しがたい匂いなど、特定の心地よい感覚的特性を持つこともある。私たちはこれらの報酬を感知するために感覚受容体を必要とするが、それらの動機づけや快楽の特性は、感覚成分の処理にとどまらず、さらなる鑑賞を必要とする(図1)。良い例がカナレットの大運河(図2)で、その特別な美しさは、フィボナッチ数列(320)を反映した中心から外れた黄金比の位置のような、物理的な幾何学的特性に基づいている。しかし、この物理的比率には本質的な見返りはない。その審美的な(そして金銭的な)価値は、感覚的な処理と非対称性の識別に続いて脳が割り当てる主観的な価値によって完全に決定される。私たちは味や香りを感覚的な出来事として処理するが、主観的な評価によって、やる気を起こさせ、喜ばせるものとして評価するのである。グルメな食事で培われたこの報酬機能は、高品質でエネルギーが豊富な一次食品や液体の評価と識別を高め、最終的にはより高品質な食品の識別を向上させ、生存確率を高めることにつながる(グルメは通常、食べ物に不自由しないため、これは進化的適性のための本能的な特質かもしれない)。性的魅力はしばしばロマンチックな愛と結びつけられるが、これはストレートなセックスとは対照的に、生殖に必要とされないため、主要な報酬機能を持たない。しかし、愛は愛着を誘発し、子孫の世話を容易にするため、遺伝子の伝播をサポートする。性的報酬は社会的報酬の最も単純な形でもある。その他の社会的報酬には、友情、利他主義、一般的な社会的出会い、集団の一貫性、協力、競争を促進する社会活動などがあり、これらは集団のメンバーにとって相互に有益であり、したがって進化的に有利である。