「進化するシステム」

進化するシステム (シリーズ社会システム学)

進化するシステム (シリーズ社会システム学)


本書はエージェントベースの進化ゲームの数理モデルやシミュレーションによりヒトの社会を理解するリサーチにかかる本だ.単に順序立てて説明している本というより著者の関心の移り変わりを追っていくような面白い構成になっている.


第1章ではそもそも社会を数理モデルやシミュレーションで解析するとはどういうことかをまとめている.様々な数理モデル解析やシミュレーション解析の実例をまず挙げた上で,かなり実務的にリサーチ手法の概要や留意点を求めている.


第2章は理論編.まず進化と自然淘汰を概説した後,進化ゲームの基礎とESSの説明があり,タカハトゲームや囚人ジレンマゲームが取り上げられている.ここでは離散的戦略の頻度変化の分析としてメイナード=スミスによる親の子育てゲーム,タカハトにブルジョワを加えたタカハトゲームの進化動態が解説されている.続いて連続形質の変化の解析として微分を用いた式によるESS,CSS(連続進化可能な戦略)の導入,アダプティブダイナミクスの考え方にも簡単に触れているが,紙数の関係からか詳細には紹介されていない.ここはちょっと残念だ.
その後,進化理論をヒトの社会に適用する問題に移り,言語,生活史,文化継承,ニッチ構築,協力の進化の問題を解説している.協力の進化に関する著者のフレームワークは血縁淘汰とそうでないものをまず分けた上で,非血縁についてはグループ淘汰・直接互恵性・間接互恵性・空間構造・罰行動というカテゴリーでそれぞれ別個に考察するというものだ.いかにもシミュレーションベースの理論家らしくノヴァクのとらえ方とちょっと似ている.私としては血縁も含め「ゲームの両当事者の戦略の相関をいかに上げるか」という包括的なフレームで考えるハミルトン的なとらえ方がないのがちょっと残念なところだ*1
ここでは様々なモデルに関して著者の実務的なコメントがあって面白い.グループ淘汰ではサブ集団よりも格子の方が協力戦略が侵入しやすいこと,繰り返し囚人ジレンマでは「エラーの存在」「手を交互に出す」「少しずつ手を変えることが可能」などの変更によって結果が大きく変わること,スノードリフトゲームでは空間構造は必ずしも協力につながらないこと,文化継承モデルでは「教える能力の進化」「寛容性が高いと寛容性が低い文化を受け入れてしまう」などの問題が難しいことなどが指摘されている.


第3章は格子モデルにおける協力行動の進化.格子状に並んだプレーヤーが囚人ジレンマゲームを行う場合の戦略の進化が扱われている.本書のよい工夫はモデルについて文章と式で説明するだけでなくシミュレーションのアルゴリズムチャートをつけてくれている点だ.モデルの概要が紛れなく把握できる.結果は基本的に1次元格子でも2次元格子でもゲームの反復確率が高まると協力行動が進化しやすいという常識的なものだ.
著者はここでゲームの世代更新ルールがモデルの挙動に違いをもたらすことについて大変興味深い現象だと指摘し,詳細を説明している.私から見ると「更新ルールが異なるとゲームの得点がその戦略の適応度にどう効くかが異なってくるのでモデルの挙動が異なるのは当然だろう」という感想を禁じ得なかった.大まかにいうとゲームの得点に応じて死亡率に効いて増殖はランダムなのか,死亡はランダムで増殖に効くのかの違いだが,グループ全体の中での競争か近隣個体間の競争かなどの詳細が異なるため適応度への効き方が変わってくる.より自然なモデルは両方に効くものだろう.両方に効くモデルは複雑すぎるということなのだろうが,単に両ルールの違いを問題にしている本書の著述はややものたりない.


第4章は罰行動について.ここではまず囚人ジレンマゲームを行い,その後罰を与えるかどうかを決められるという2ステージのゲームを行う.この定式化では罰を与えること自体が利他行動になるので理論的に面白い問題になる.著者たちのリサーチではシミュレーションとは別にペアエッジ近似を用いた数理解析を行っていて,そこも詳しく解説されていて興味深い.
著者たちはランダム対戦と格子モデルの結果をそれぞれ示している.結果はなかなか複雑なもので更新ルール,罰とコストのパラメータなどで変わってくる.ここでも更新ルールと挙動について詳細な解説がなされているが,やはり適応度への関わり方が異なるので当然だという印象だ.また空白がある場合とない場合での挙動の差についても詳しい*2.ここの説明はなかなかトリッキーでパズルとしては面白いのだが,実際の社会の分析についての意味はややよくわからないところもあるように思う.またさらにゲームの得点を2つに区分して片方が死亡に効いて片方が増殖に効くモデルも提示されているが何故そう決めたのかの説明がなくよくわからなかった.背後には深い考えがあってのことだと思われるので残念なところだ.
結局「協力かつ罰を行う」という戦略は単純には進化しにくく,空間構造があると進化しやすくなること,更新ルールにより様々な挙動が生じることあたりが現在の知見ということになる.著者は「協力と罰の共進化条件はよくわかっていない」とまとめている.またゲーム理論から罰の進化は説明しにくいが,実際にヒトを使った実験では罰による協力行動の促進はよく観察されるという問題にも触れている.この率直な姿勢には好感が持てる.著者も少し触れているが,罰は文脈が非常に重要であり,より条件依存的な行動戦略なのだろう*3


第5章はコロニーベースのモデルとして,コロニーが成長したときに半分の大きさのコロニー2つに分岐して近くにとどまるか,ごく一部の個体が遠くに分散するかという戦略と環境変動条件の問題を扱っている.


第6章は噂のリサーチ.囚人ジレンマゲームを行ってから噂の交換をすることを繰り返すとどうなるかというリサーチが紹介されている.噂戦略は立てることに関して「自分は協力者」「○○は協力者」「○○は非協力者」「噂を立てない」の4つで,広めることについて「全て広める」「まったく広めない」の2つ,使うことに関して「使う」「使わない(この中に裏切り戦略と自分の経験を元に対応する戦略がある)」の2つになる.すると組み合わせた戦略の幅が広くなるので,この組み合わせの中でありそうないくつかを取ってシミュレーションにかける.著者の結果はこのような制限戦略セットの中でいくつかの条件(噂の伝播速度,ゲーム回数など)によっては噂が生じることを示している.
しかし私の感想としてはこの結果にはあまり意味はないように思う.この設定では噂にコストがないし,正しい噂を立てたものへの報酬もない.だから純粋に利得に絡んだ設定の中では,噂を使うユーザーがいるなら必ずそれを利用して嘘をついて操作する戦略が有利になるだろう.すると噂を自由に使えれば噂の信頼性はすぐになくなると思われる.このシミュレーションの結果は単に戦略が制限されている*4ことによるだけではないかと思われる.嘘がばれた場合のコスト,正しい噂を広めたときの報酬を入れ込んで分析すべきではないだろうか.


第7章は推移的推論.タカハトゲームのような状況で,強さが非対称であれば相手の実力を見極めた方が有利になる.そのときにA>BかつB>CならばA>Cが推論できる方が有利になると考えられる.そこで何も推論しない,(相手を区別せず)自分の勝ち負けから自分の実力のみ推論,自分の対戦のみ使って自分と個別の相手の強さを推論,すべての対戦を利用して自分と個別の相手の強さを推論,の4戦略の進化をシミュレートする.このシミュレーションには推論コストが含まれていないので当然第4の戦略が勝つと思われるが,ゲーム数が多くて利得行列がタカよりな状況では対戦数が大きくなるので,第3の直接的推論の方が結果が正しくなって有利になるという意外な結果になっている.またこのようなシステムでは対戦数を増やしてデータを取ることが有利になるため正確な推論よりやや楽観的な推論(よりタカになりやすい)の方が有利になるだろうとも指摘されている.
なかなか面白いが,認知コストがないという前提は不自然だし(普通はそのコストと正確さのトレードオフが問題になるだろう)そもそもタカハトのような状況ではハンディキャップコストによるディスプレー信号が進化しやすいのでこのような推論が重要になる状況は考えにくいように思う.


第8章は模倣.まずプレーヤーが規範や意見を持ち,ネットワークでつながった相手の規範や意見を一定の規則で真似をするというシミュレーションを行う.予想される通りネットワークの形状により規範や意見が収束する時間が異なってくることが示されている.
また模倣が集団全体の頻度に対して生じるとして,それが頻度に対して非線形な場合にどうなるかも扱われている.当然ながらその関数型やパラメータによりモデルの挙動は異なってくる.次に集団内でゲームを行っているとして,ゲーム戦略の頻度に対して非線形に模倣が生じるとどうなるかが扱われる.ゲームの種類により様々な挙動が現れる.頻度依存的で頻度が少ない方が有利であるようなゲーム状況と頻度が少ない方を真似るという模倣関数の組み合わせの結果はなかなか面白い.


第9章は頼母子講の分析.頼母子講の最大の問題はもらい逃げによる講の崩壊だ.これが評判(繰り返し講を行い,評判スコアによって入会を拒否できるというシステム)によって維持可能かどうかを調べる.著者によるシミュレーションの結果は「講は評判だけでは維持されないが,『ファンド受領前の非拠出者にはファンド支払いを拒否する』というルールがあれば維持可能」というもので,先行研究がルールの存在に気づいていなかったところを発見できたとしている.講の外側での罰則なしに講が維持可能というこの結果は大変面白いものだ.ただ「このファンド受領前の非拠出者には支払いを拒否する」というルールはあまりに当たり前で*5,先行研究では暗黙の前提にしていただけではないかという気もするところだ.


最終章では今後の方向が示されている.このようなエージェントベースのリサーチは時間変化を捉えたり,ミクロとマクロのリンクを行うのに向いていることから,歴史的な現象の解明や脳と社会をつなぐような方向が面白いだろうと指摘されている.


本書は数理科学の本でありながら著者の研究物語的な匂いもあってなかなか独特の雰囲気の本に仕上がっている.リサーチの結論についてはオープンなものが多いが,そのリサーチの進み具合や研究者の関心がよくわかる.様々なシミュレーションを繰り返し,個別の挙動の説明をつけようと集中して取り組んでいる著者の熱意が感じられる好著だろう.

*1:空間構造による協力行動の進化の解説に置いて,血縁個体が固まっているとみれば血縁淘汰に,近隣個体がサブグループだと考えればグループ淘汰に似ているとの指摘はあるが,そこでとまっている.もう一歩進めれば,いずれも包括適応度が上昇する仕組みだととらえることができるだろう

*2:これも結局利得が適応度にどう効くかが異なってくるからだろう

*3:怒りの感情とセットになることから何らかのコミットメントである可能性が高いし,報復されるリスクも重要だろう

*4:戦略セットが限られているだけでなく,そもそも噂を選択的に立てたり,広めたり,利用したりできない

*5:講が始まっても自分の割当分を拠出しないメンバーにその後ファンドを払う講があるとは想像できないだろう