協力する種 その33

協力する種:制度と心の共進化 (叢書《制度を考える》)

協力する種:制度と心の共進化 (叢書《制度を考える》)

第9章 強い互恵性の進化 その1


第9章は罰の進化が扱われる.著者たちは第7章と第8章で,相手を皆殺しにする様な部族間戦争が頻発する状況下で,無条件の利他主義が(それが戦争の帰趨に大きな影響を与えるなら)グループ間淘汰を通じて進化することを示したと主張している.これについては,先史時代の戦争で相手が皆殺しになるわけではないし,戦争の帰趨に与える利他主義の影響は大きくないだろうし,さらに実際に観察されるヒトの利他性は100人のグループのために自分の命を犠牲にして戦うようなものではないというのが私の感想だ.


著者たちは本章の冒頭で,実際にヒトにこのような無条件の利他主義が観察できないことを認めている.ではそもそも先の2章は何だったのかという気もするが,ともあれ,著者たちは裏切り者に団結して対抗する性質,つまり罰が進化できれば,この問題も解決できると考えているようだ.彼等の議論はこう続いている.

  • ヒトが大規模に示す協力には「協力的な性質」と「裏切り者を罰しようとする性質」(合わせて強い互恵性と呼ぶ)の組み合わせが必須である.ここでは「個人的なコストを負担してでも社会規範からの逸脱者を罰しようとする性質」がどのように進化可能であったかを示す.
  • 罰のコストは,罰行使者が自分1人のときは大きいが,多くの罰行使者が存在すると大きく減少する.つまりこのような規範が一旦社会の中に広まると高水準の協力が維持されやすいことになる.これはプライス則からも示すことができる.またボイドとリチャーソンの先駆的な仕事はこのロジックによっている.
  • しかしこの説明には2つの問題がある.
  • 第1に,罰の行使者へのコストおよび罰を受けたもののコストの合計が協力の利益を上回るとグループ間淘汰上不利になる.特に(認知エラーなどによって)協力者へも罰が行使される状況下ではこの問題は大きくなる.
  • 第2に,罰行使者が少ないときには大きなコストがかかるが,このシナリオでは最初に罰が現れることを説明できない.
  • しかしこれらはいずれも研究上のアーティファクトに過ぎない.民族学誌的には個人が単独で罰行使することはほとんど観察されない.行動実験においても,プレーヤー間のコミュニケーションを認めて集合な罰戦略に可能にした場合には集団の利得を挙げるような罰行使が観察でき,協力的な個人に罰が向かうこともほとんどない.
  • この2つの問題を解決するためにここでは罰の持つ2つの特徴を考えていく.ひとつは「複数の集団メンバーが連携して行使するものである」こと,もうひとつは「規模が大きい罰ほど効率的に行使される(コストの総量は行使者が多くなるほど減少する)」ことである.


著者たちは,自ら(著者たちのモデルで出現するはずの)無条件の利他主義がヒトに見られないことを認めた上で,罰の存在がそれを解決するかのようにほのめかすが,しかし罰の仕組みが生じたら,どういう理由でどのような利他主義が可能になると考えるのかを説明していない.だから著述の流れはここで大きくぶつ切れていて,読んでいて不満の残る進め方になっている.


ともあれ,罰の問題はこれはこれで非常に興味深い問題だ.彼等の議論を見ていこう.

9.1 連携した罰 その1


著者たちは罰の進化を説明するモデルを提示する.これは以下のようなものだ.

  • 大きな繁殖集団(ポピュレーション)の中に複数のn人集団がある.各集団内で相互作用を行う.
  • 相互作用は3つのステージからなる.
  • 最初は,コストqを掛けて非協力者を罰する意図をシグナルするシグナリングステージ
  • 次は,協力コストcとして集団メンバーがb/nを受け取る公共財ゲームを行う.
  • 最後に,罰行使者が連携する罰ステージになる.罰行使の参加人数に応じて,罰行使の成功度が変化する.罰行使は成功するか痛み分けになる.対象者1人に対する罰行使者の数をnpとした時に,痛み分け確率は1/npで,痛み分けが生じると罰行使者から1人がランダムに選ばれてコストkを負担する.つまり痛み分け時の行使者一人あたりの期待罰コストはk/npとなる.このためこの集団の罰行使メンバーの期待罰コストは痛み分け確率にこのコストをかけたものになりk/np2になる.
  • この3ステージを1ラウンドとする.第2ラウンドからは(シグナルが既知となるため)シグナリングステージは省略される.ラウンド継続確率δを持つ.終了すると各集団は解散し,ポピュレーションから新たな集団が作られプロセスが繰り返される.
  • 個人は罰行使か罰非行使のいずれかの戦略を遺伝的に持つ.拡張して嘘つき戦略(行使を宣言するが行使しない),機会主義戦略(行使を宣言し,特定条件でのみ行使する)などを考えることができる.
  • 罰行使戦略:罰行使をシグナルする.第1ラウンドの第2ステージの協力には閾値があり,集団の中で自分以外にτ人以上の罰行使戦略シグナル者がいるときに協力を行う(エラー率εがある.またτは個人により異なり閾値がτの行使者をτ罰行使者と呼ぶ).第3ステージでも同じくτを閾値として非協力者に罰行使する.第2ラウンド以降は罰の予想に応じて協力か非協力かを選ぶ.(協力かどうかは状況依存で決まり,罰行使かどうかは遺伝的に決まることになる)
  • 非行使戦略:第1ラウンドでは罰非行使をシグナルする.非協力を選び,罰も行使しない.第2ラウンド以降は罰の予想に応じて協力か非協力かを選ぶ.(集団にτ+1以上の行使者がいると罰を受け,コストpを受ける.pは.協力の純コストc-b/nより大きいとする.これによりεが小さいときには罰が予測されるなら協力が利益最大化行動となる)
  • 初期状態は全員非協力とする.
  • 個人はポピュレーションの平均利得に対する自分の利得に応じて繁殖する.


なかなか複雑なモデルだ.著者たちは,このモデルのポイントは第2ステージの協力・非協力と第3ステージの罰行使・非行使の連動が弱くても罰が進化しうることを示すところにあると述べている.


ではその解析結果はどうなるか.著者たちはそれを図で示している.



(適当に描写しています.)

これは18人のグループがランダムに作られた(血縁度r=0)場合の状況を示している.上記閾値τを変化させたときに均衡がどうなるかを一度に図示している.●は安定平衡点,◯は不安定平衡点で.罰行使者の初期頻度が◯より小さいと0に,◯より大きいと上部の●のところに収束する.
b=2cのときとb=4cのときを比べると,b=4cのときは上部●がより上に上がり,◯がより下に下がり(τ=1のときには協力を含む均衡のみが安定均衡になる),協力達成のための初期条件が広がり,達成均衡が高くなることが示されている.

著者たちいろいろ解説しているが,要点としては以下のようなところになる.

  • 長期的には2つの進化的状態が得られる(2つの●を指している)
  • 初期罰行使者の初期頻度が少ないと,行使者のコストを協力によって取り戻せないので,「罰行使なし:下部の●」に進化しやすい.
  • 協力が進化する場合にも多くの閾値において行使者と非行使者が混在する状態が進化的に安定になる.
  • 協力のある状況に進化するための最低τ条件がある.b=2cのときにはτは最低でも3が必要,b=4cだとτが1でも進化可能になる.
  • 閾値τが高いと,協力が進化するためにより罰行使者初期頻度が高くなければならない(τが低い方が協力が進化するための罰行使者初期頻度の値は低くなる)が,成立した均衡の協力程度は高くなる.
  • 安定的な多型均衡においては,罰の行使と非行使に適応度の差が無くなる.つまり罰は「利他的」ではなくなる.


著者たちのモデルの前提に基づくと,罰行使者が多いと罰のコストが低く効果的になる.つまり正のフィードバックが働くのでこのように初期罰行使者の頻度に応じて2つの安定均衡が現れることになる.また片方の均衡は全員非協力というのもよく見られる形だ.もうひとつの協力が生じる均衡は頻度依存的多型ということになるだろう.そしてこの協力均衡頻度がτ,bcの相対的な大きさに依存するのは予想通りということだろう.著者たちはここからさらによりモデルを一般化して微妙なパラメータの挙動を説明しはじめる.