「シグナル&ノイズ」

シグナル&ノイズ 天才データアナリストの「予測学」

シグナル&ノイズ 天才データアナリストの「予測学」


本書は2008年と2012年のアメリカ大統領選挙の州ごとの勝敗を驚異的な精度で予測したことで一躍有名になったネイト・シルバーによる統計的な手法を駆使することによる予測についての本だ.原題は「The Signal and the Noise: Why So Many Predictions Fail - but Some don’t」

序章では予測にかかる今日的な問題が書かれている.1970年代までの様々な予測は「少ないデータからどう予測するか」が問題だった.現在では「多すぎるデータをどう使うか,どうノイズとシグナルを見分けるか」が問題になっているのだ.シルバーはいわゆる「ビッグ・データ」によせられる世間の期待とは逆にビッグ・データを使ったからといって予測が常に正確になるわけではないと主張する.それにはいくつかの条件や前提が必要になるのだ.うまくいかない要因にはヒトの認知傾向も含まれる.


第1章から第3章は導入部分で,様々な分野の予測の失敗と成功が取り上げられる.最初は経済予測の失敗,特にリーマンショックを予見できなかったことだ.この中で,格付会社のサブプライムモーゲージを組み込んだCDOのデフォルト予想の失敗*1,リーマンなどのインベストメントバンクのプロップ取引の失敗,政府による経済刺激策に際しての経済予測の失敗を個別に見た後で,共通要因としては予測の根拠としたものがアウトオブサンプルだったこと,つまり前提の異なる例を予測根拠としたことだと整理している.

第2章では選挙予測や政治情勢の予測が取り上げられる.テレビ番組のパネリストや政治学者の酷い成績を概観した後で,シルバーは予測の姿勢が問題だと指摘する.多くの予測者とその成績を分析すると,より柔軟で複雑な現状を受け入れ,経験重視で自己批判的な予測者の予測の方が成績がいいのだ.片方で,テレビに出てもてはやされるためにはイデオロギー的で自信過剰で特定の政治信条について硬直的な方が有利だというインセンティブ構造にも触れつつ,シルバーはうまく予測するための原則をこう整理している.

  • 確率論的に考える
  • 新しい情報を得たら予測を見直す
  • コンセンサスにも気を配る

第3章はスポーツに関する予測だ.シルバーは経済統計で学位を取った後,KPMGで移転価格コンサルタント*2を行っていたのだが,趣味で野球に関する統計的な予測を始め,結局独立してその仕事を立ち上げることになる.野球に関する統計利用といえばセイバーメトリックスとマネーボールが有名だが,これらのモデルは,ある選手の成績がチームの勝利にどれだけ貢献したと評価すべきかという問題が中心だ.シルバーが行ったのは,(そのような評価を前提にして)ある選手の今後数年間の成績の予測だ.そしてチームのGMにとってはFA市場でいくら金を使うかに大きく関わるため,正確な予測ができるならそれには大きな価値がある.
ここの詳細はいかにもオタク的で読んでいて面白い.予測にあたっては年齢とともにどう成績が推移するかというベース予測,そのような推移にはどのような多様性・パターンがあるかというモデル化,そして特定の選手がどのパターンに当てはまるかの分析が含まれるのだ.またこのような統計利用が広く知られるようになった後もなぜ伝統的なスカウトが大幅にカットされていないかについてもコメントされている.結局統計的なデータだけでは捉えきれない資質もあるからなのだ.両者は補完的だということだろう.


第4章から第7章では,本質的には似たような複雑で動的なシステムについての予測がある程度うまくいったりいかなかったりすることについてのケーススタディだ.
第4章はある程度うまくいっている例,天気予報だ.天気予報の精度は年々上がっている.予報は地区をセルに区分けして,セル間の相互作用をみるモデルによって行われる.そしてこれはコンピュータの演算能力の向上によってより細かく区分けできるようになり,より正確になっているのだ.また天候は前提がほぼ同じの繰り返しデータが得られるので,モデルの検証,改良が容易であるという事情も大きい.もっとも天候は複雑系の動的システムなのでカオス的な性質を持つ.これに対しては,様々な初期条件を入れ込んでシミュレーションにより確率分布を出すこと,またデータを視覚化することにより予報官の判断を合わせてみることによりある程度対処できる.シルバーはこのような複雑系のシステムの予測について天気予報は成功例だと述べている.なおこの章では,予報を人々が利用することから来るバイアスの問題も扱っていてちょっと面白い.

第5章はうまくいかない例,地震予知だ.シルバーは様々な山師の例をあげながら,地震予知は基本的に失敗の歴史だとまとめる.それは冪乗則に従った生起確率を持ち,天気予報と違って大きな地震数が限られ,それぞれ前提条件がばらばらなため,観測データのノイズとシグナルを見分けることが難しいからだ.シルバーは様々なモデルのオーバーフィッティングの歴史を解説し,東日本大震災についてもM9を超える地震の生起頻度を低く見積もっていたのはオーバーフィッティングのためではなかったかとしている*3

第6章はうまくいかないもうひとつの例,経済予測だ.典型的なオーバーフィッティングのモデル「スーパーボールでNFCのチームが勝つと景気があがる*4」を取り上げた後に,経済現象もデータ数が少なくそれぞれ別の前提条件の上にあり,ノイズとシグナルの見分けが難しいことを解説する.またここではエコノミスト側の動機(当たるか当たらないかより,人々の注目を集めるかどうかの方を重視する方がビジネスとして合理的)の問題も扱っている.

第7章は感染症の流行予測.新型インフルエンザの大流行予想が外れたのは記憶に新しい.シルバーは技術的な理由として,指数関数的な増加を示すものの最終的な規模予測が難しいこと,新型感染症では基本パラメータである「患者一人あたり何人に感染させるか」「致死率」の見通しが難しいことを理由に挙げている.さらにここでは対象が人の集団であるために,予測自体や感染症の知識の普及が人の行動に影響を与える*5という問題も扱っている.シルバーは感染症の予測については,このような複雑な問題があるので,まず単純な前提を置くモデルを過度に信用しないこと,そして用いる場合にも単純な微分方程式系のSIRモデルよりもエージェントベースのシミュレーションモデルの方がよいのではないかと示唆している.


第8章から第10章で,これまでの教訓を踏まえて,よい予測を行うための方法を考察する.ここもケーススタディ的に進められる.
第8章はスポーツの勝敗予想.冒頭に,NBAの勝敗を予想しラスベガスのブックメイカー相手にギャンブルして,勝ち賞金で生計を立てている男が紹介される.彼は,すべてを確率で捉え,極めて多くの情報を取り入れて,その都度総合的に判断し,その時々の自分の主観的オッズとブックメイカーのオッズの差を見つけてそれに賭ける.それは極めてベイズ主義的なのだ.
ここからベイズ統計とベイズ主義の解説があり,なぜ予測においては頻度主義よりベイズ主義の方が収まりがいいのかも解説されている.それは単純にいうと操作実験やランダム化されたサンプルデータが得にくいからだということになる.シルバーは,これについて「頻度主義は,『誤差を実験に付随するものとしてのみ考え,実験を繰り返せばそれを減らせる』と考えることから,世界を理解しようとする人間の能力不足を無視し,ヒューマン・エラーに背を向ける態度につながりやすい,また客観的であろうとするあまり,事前確率や現実世界の様々な文脈を否定し,仮説の妥当性自体を考えない態度につながりやすいのだ」と表現している.予測の実務家から見た頻度主義の姿という意味で興味深い.

第9章はチェスプログラム.有名なカスパロフディープ・ブルーの対決の模様が詳しく解説されている.ここも詳細がオタク的で読んでいて楽しい.この章でのシルバーの示唆は,コンピュータと人間では得意分野が異なるということだ.

第10章はポーカー*6について.現在アメリカでは高額の賞金がかかったポーカートーナメントが花盛りであるそうだ.この章も詳細がオタク的で楽しい.基本的にはできるだけ細かく状況の場合分けを行ってそれぞれ最善手を選んでいくことを目指すのだが,相手の手,出方の読みが入るので複雑になる(進化生物学ではおなじみのESSと同じで,時にランダム化が最善戦略となる).ここでシルバーはこのような相手の手を読むゲームの予測能力の学習曲線や,実際のオンラインポーカー市場で誰が誰に支払っているかの分析を行っている.またゲームプレーヤーの心理として「運」という幻想,自己欺瞞なども扱っている.麻雀を行う日本人読者にはいろいろ得るところも多いだろう.


第11章からは応用編だ.
第11章では金融市場の予測が扱われている.まず,いわゆる予測市場(選挙結果に関するイントレードなど)が取り扱われる.この市場について取引当事者双方ともベイジアンであるとした場合の解釈がまず提示され,続いてなぜ伝統的予測よりイントレードの方が正確なのかが解説される.それは参加者が多いとよりもとになる情報が増えること,そして予測が正しいことによる金銭的誘因以外の動機がシャットアウトされるからだ.
続いてシルバーは効率的市場仮説の問題を扱っている.これは予測の市場ではなく,市場の予測についての問題だ.「インデックスに長期安定的に勝てるファンドはない」「安定的に勝てるチャート戦略もない」あたりの話から始まり,効率化仮説の3つのバージョン,その統計的検定が扱われている.シルバーはこの議論の様々な側面を丁寧に扱っている.「基本的に市場はかなり効率的で,特に取引コストを勘案するとそうなる.またこの効率性はごく一部の優れた予測者に利益が出ることで保たれる.片方で,取引エージェントのインセンティブのゆがみや自信過剰により価格がファンダメンタルから乖離するバブルは発生しうるし,それを観測することも可能だが,何時破裂するかを予測するのは難しい.」あたりが論じられている.

第12章は地球温暖化について.シルバーの視点から見ると温暖化は,「二酸化炭素と温暖化の因果関係はかなり明らかで大きな事前確率があるが,観測結果は『大半がノイズでそれにシグナルが隠れている』という状況で,事後確率についてコンセンサスが難しい問題」ということになる.また懐疑論の中には,健全な科学的懐疑論のほか,利害関係があるために判断が歪んでいるもの,何でも反対論があるため解決が難しくなっている.問題の一部は科学と政治の衝突でもある.
シルバーは科学的懐疑論について,特に単純化したモデルには「初期条件の不確実性」「シナリオの不確実性*7」「構造的不確実性*8」の問題がありうることを指摘している.そして問題を確率論的,ベイズ的に捉え,観測結果についてのシグナルとノイズについて注意深く判断することを勧めている.

第13章はテロについて.それまで生じたことのないことをどう予測するのか.シルバーはまず米国政府が第二次世界大戦時に日本の真珠湾攻撃を予測できたか,9.11のテロ攻撃を予測できたかという問題をケースとして取り上げる.情報を事後に精査すると確かにシグナルはある.しかしそれを事前にノイズから選び出せたかというのは別の問題だ.
シルバーは「未知の未知」という問題が極めて厄介であることを断った上で,しかし突発的な事件は冪乗則的に生じることが多いので,それまで生じたことのない大規模な問題が発生しないと考えるべきではないのだと強調する.そして最終章で結論としてベイズ的な思考法を改めて勧めて本書を終えている.


本書は豊富な実務経験を踏まえた上で物事を予測する際の有益な方法,そして限界をまとめてくれている.記述はケーススタディ的でわかりやすく,著者の思い入れが強い部分は非常に詳細に記述されていて読んでいて大変興味深いところが多い.また単に「統計や数学を使うとこんなにすごいことができるのだ,どうだ」という本ではなく,その限界や最後に残るアートの部分にも目を配った本となっていて,そのあたりも渋い.
多くの実務的な問題について予測を行う上では,基本的に歴史的事象は一回限りなので,(天気予報や野球の場合を除くと)頻度主義的アプローチを取るためには必須である「ほぼ前提が同じであるランダム化された多数のデータ」を得ることは通常できない.だから実務的な問題を実時間内で予測しようとするとベイズ的なアプローチが大変有益になるのだ.そしてそのような予測においては,ベイズ的な事前確率の不確実性,モデルにおける前提の不確実性,モデル構築の不確実性,特にオーバーフィッティングなどの問題*9が不可避であり,限界がある.予測においてはその限界についても深い理解を行っておく必要があるというわけだろう.実務を背景にした示唆はなかなか味わい深い.全体として数理と実務のバランスがとれた好著だと思う.



関連書籍


原書

The Signal and the Noise: Why So Many Predictions Fail-but Some Don't

The Signal and the Noise: Why So Many Predictions Fail-but Some Don't

*1:シルバーは格付会社の失敗について,組み込まれた個々の債権のデフォルトに相関性があるのに独立事象として扱ったこと,リスクと不確実性を取り違えたことが原因と整理している.私には,インセンティブ構造と自己欺瞞によって途中で軌道修正できなくなったことの方が本質的に思えるが,それはあまり強調されていない.

*2:グローバル企業での国境をまたいだ親子兄弟会社間の取引価格設定に関してアドバイスを行う仕事,移転価格は税務上重要な問題になる.

*3:もっとも実際にはあの大震災がM8.6ならあのような被害に遭わなかったというわけではないだろうから,やや例としてはどうなのかなという感想は持たざるを得ないところがある

*4:これは1990年代の後半に半ばジョークとして,半ばオーバーフィッティングモデルについての当てこすりとして市場関係者の間に広く知られた話だった.その後もちろんこの相関性は崩れている.

*5:ここではゲイ集団の性病感染について一旦コンドーム使用が増えて感染率が低下したが,その後HIV感染者同士でコンドームをつけない性交渉が増え,梅毒などの性病とAIDSの感染の挙動が異なってしまったという例があげられている

*6:ここではポーカーの内「テキサス・ホールデム」というルールによるゲームが扱われている.中央に全員が使えるコミュニティカードが3枚あるというのが特徴だ

*7:今後諸国家や人々がどう行動するかについての不確実性

*8:気候システムをどこまでモデルに取り込めているか,それが時間とともに変化するのか,するとすればそれをモデルに取り入れられるかあたりの不確実性

*9:オーバーフィッティングについてAIC的なアプローチが扱われていないのがちょっと残念だった