「ビッグデータ・ベースボール」


マイケル・ルイスの「マネーボール」はメジャーリーグの現場に統計的分析(セイバーメトリクス)を応用するという物語で,そのポイントはGMが限られた予算内で選手を集めるのには,伝統的な「打率」「打点」「HR数」よりも「出塁率」「長打率」を重視した方が合理的かつ効率的だというところにあった.そしてあれから10年以上経過し,メジャーリーグはさらに進んでいる.本書は「マネーボール」のアスレチックスと同じように予算が限られた弱小球団ピッツバーグ・パイレーツがさらに進んだ統計分析を応用して成功する物語だ.著者はピッツバーグトリビューンでパイレーツ担当だった記者トラヴィスソーチック.原題も同じく「Big Data Baseball」だ.


物語は20年連続で負け越しとなったピッツバーグパイレーツ*1で,2013年の成績に首がかかる監督ハードルとGMハンティントンの苦悩から始まる.失うもののない彼等は統計分析をより活用してチームの成績を上げる取り組みを行うことに合意する.ここでは監督ハードルのこれまでの野球人生模様も語られていて味がある.実はこのような統計分析を実際にチームに導入するには(マネーボールでも語られていたが)体育会系の現場と数字オタクの統計屋の間の信頼関係の構築が重要なのだ.監督の苦労した野球人生の経験はここで役立つ.そして本書ではこの人間模様と統計利用の話が交互に挟まれていく構成を取っている.


人間模様の話はさすがに記者あがりのライターだけあってよく書けている*2.ここでは統計分析応用に絞って本書の内容を紹介しよう.


<守備の革新>

  • 2002年にベースボールインフォソリューションズ(BIS)という会社が設立され,メジャーの試合のすべての打球の行方と投球データが記録され利用可能になった.これにより守備を客観的に評価することが可能になってきた.
  • これによるとフライを除く打球(ライナーとゴロ)は圧倒的に引っ張り方向が多い(右打者なら左,左打者なら右方向).そしてそれにあわせた極端な内野守備シフトを敷いた場合には守備成績が向上していることがわかった.(バッターは守備シフトを見て流そうとはあまりしない*3こともデータから明らかになった)しかしほとんどのチームはこれを常用していなかった.それは逆をつかれた場合に無様に見えること,特に投手の抵抗(打ち取ったと思った当たりがヒットになる心理的な負担を嫌がる投手が多い)が大きいからだと思われる.パイレーツはこれを積極的に採用することにした*4.プレーヤーには打者が流し打ちを試みるなら(それは彼等のバッティングを崩すことになるから)勝手にやらせておけと指示した.この部分はプレーヤーの反発が最も大きいところなので導入後の詳細が詳しく書かれている.そしてプレーヤーからの疑問(例えば投手(持ち玉の球種)ごと,カウントごとの違いなど)がさらによい守備戦術に結びつく様子も描かれている.本書の読みどころだ.この積極的な守備シフト戦術は成功を収め,メジャー全体に普及しつつある*5
  • さらにパイレーツはこの守備シフトを外野にも応用し始めている.(外野守備は打球の軌道や滞空時間のばらつきが大きく,球場ごとの広さや形も異なるため最適化がより難しい)


<選手の評価>

  • 2007年からメジャーではPITCHf/xと呼ばれる自動投球追跡システムによる膨大なデータが利用可能になっている.これは投球の正確な軌跡やスピードを記録するものだ.これを利用して分析した結果,捕手のキャッチングの巧拙(ピッチフレーミングと呼ばれる)によってストライクゾーンが伸縮することが発見された.パイレーツはまだ他球団がこれに注目していない中,ピッチフレーミングの上手な捕手ラッセル・マーチンをFAで(その価値から見て大きく割安で)獲得に成功する.
  • さらにパイレーツの分析チームはPITCHf/xにないリリースポイントの(前後の)位置を把握できるトラックマンのデータも利用し実効球速データも得るようにした.
  • インプレイ打球のヒット率を調べると,それは投手間で驚くほど安定している.つまり,インプレイ打球をヒットにするのを防ぐ力の差はメジャーの投手間には無いということだ.これは2000年頃から知られるようになり,マネーボール時代には奪三振率や与四死球率が重視されるようになっていた.パイレーツはこの考えをさらに進め,守備から独立した投手成績をできるだけ反映する独自の指標を作り上げた.さらにPITCHf/xおよびトラックマンのデータを用いて投手を評価するようになった.これによりトミー・ジョン手術後の成績が思わしくないが,球速等に回復の兆しのある投手フランシスコ・リリアーノをやはり格安で獲得できた.


<負傷の予防>

  • パイレーツは負傷の予防のための投手起用方法についても統計データの応用を試みている.この詳細は公開されていないが,生体力学測定を利用し,さらに投げた球種を加味した計算を行った上での試合ごと,シーズンごとの球数制限が導入されていると思われる.


<配球戦術>

  • PITCHf/xとBISデータは球種と打球の種類の相関分析を可能にした.パイレーツは向上させた守備を活かすべく,よりゴロの多いツーシームを多投する戦術を採るようになった.(これが知れ渡るようになった後,マネーボールで名を馳せたアスレチックスのGMビリー・ビーンはよりフライを多く打つ選手を揃えて対抗しているそうだ.)
  • また同じくこのデータから,内角を攻められた後の外角球に対して打者は無理矢理引っ張ってゴロを打つようになる確率が高くなることも発見された.パイレーツはこれももちろん採用した.(ただその結果相手チームとのいざこざは増えたそうだ)


<選手の守備力のより正確な評価>

  • 2014年から,スタットキャストシステムが運用開始され,打球の正確な軌跡データと,打撃の瞬間からの守備選手の動きをすべてトラックしたデータが利用可能になった.これはまさに膨大なデータだが,個々の選手の守備力を初めて正確に評価できるようになると期待される.そしてデータが膨大なだけにどういう切り口で分析するかについての数理統計および現場の応用のセンスが重要になるだろう.


そして物語はパイレーツがついに連続負け越しの記録をストップさせ,プレーオフ出場を果たすクライマックスを迎える.ここは元スポーツ記者の腕の見せ所というわけで劇的な盛り上がりを旨く描写している.
最後のエピローグでは,パイレーツの優位性の多くは1年で他の球団にも模倣され,その真の価値が他球団にも認識されたFA選手を引き留められなくなる状況が描かれる.メジャーの世界では常にさらに新たなレベルでの競争が行われているのだ.
本書はスポーツと統計に興味がある人には大変面白い本だ.しかし彼我の差を感じる本でもあるだろう.日本でもセイバーメトリクスはネットで随分統計値を見られるようになったが,まだまだマスメディアでは無視されているし,日本プロ野球でも(一部球団は取り入れているともいわれているが)大幅に利用されている印象はあまりない.そしてPITCHf/xのようなシステムが運用されるのはいつの日だろうか.思わずそういう遠い目をしてしまう本でもある.


関連書籍


原書

Big Data Baseball: Math, Miracles, and the End of a 20-Year Losing Streak

Big Data Baseball: Math, Miracles, and the End of a 20-Year Losing Streak


マイケル・ルイスの描くセイバーメトリクスとアスレチックスGMビリー・ビーンの物語.文句なしに面白い.

マネー・ボール〔完全版〕

マネー・ボール〔完全版〕


これは映画化もされている.


やや古い本だがセイバーメトリクスの統計的詳細はこの本が詳しい.

メジャーリーグの数理科学 上 (シュプリンガー数学リーディングス)

メジャーリーグの数理科学 上 (シュプリンガー数学リーディングス)


最近の本としてはこれ


これは行動経済学的な視点でいろいろなスポーツデータを解説している異色の本.私はこの本でPITCHf/xの存在を知った.私の書評はhttp://d.hatena.ne.jp/shorebird/20120811

オタクの行動経済学者、スポーツの裏側を読み解く

オタクの行動経済学者、スポーツの裏側を読み解く

*1:同じくピッツバーグに本拠地を置くNFLスティーラーズ,NHLのペンギンズが最近スーパーボウルスタンレーカップで優勝しているのと比較してなかなか厳しい状況だ.

*2:技術的な側面ではアスリートに対してはビジュアルなデータ提示が有効だということが強調されている.プレーヤーはゲームに対して特に視覚的に認知している部分が大きいのだろう

*3:特に強打者でカウントが追い込まれるまではそうだ.著者は「長打,特にホームランにその打者の価値があるからだ」とコメントしている

*4:このような守備シフトを積極的に採用しているのはパイレーツだけではなくレイズやアストロズも有名なようだ.

*5:本書では基本的に守備シフトは平均して効果があることが間違いないというような書きぶりだが,このあたりには賛否両論もあるようだ.特にメジャー全体で大きく極端な守備シフトが増えたのは2014年だが平均打率が有意に下がっている気配はないとされている.また当然ながらシフトに対して流そう(あるいはバントしよう)とするバッターもいて,バッティングスタイルを変えようとしないプルヒッター以外のバッターへの有効性についても議論されているようだ.