「サッカーデータ革命」

サッカー データ革命 ロングボールは時代遅れか

サッカー データ革命 ロングボールは時代遅れか


ビッグデータベースボールを最近読んでスポーツの世界の統計利用についてもっと知りたくなって手に取った一冊.現在メジャースポーツで統計利用がもっとも進んでいるのが野球であり,次はバスケットボール,そしてサッカーとアメリカンフットボールはやや遅れているということのようだ.本書はそういう中でのサッカーの現状がイングランドプレミアリーグを主な題材にして解説されている本ということになる.著者はアメリコーネル大学の学者コンビで,ドイツ出身でサッカーの下部リーグの選手経験もある筋金入りのサッカーファンである社会学者クリス・アンダーセンと(それほどサッカーには詳しくない)アメリカ人行動経済学者のデイヴィッド・サリーだ.

最初に断っておくと,本書はサッカー愛とサッカーの面白い逸話にあふれていて大変興味深く読み進められる本であると同時にロジカルには非常に読みにくい本だ.論理的な筋書きは大量に挿入される逸話と脇道へそれる蘊蓄話で非常に見えづらいし,根拠がよくわからない断定や,結局解決されない謎の提示や,統計的な扱いの詳細の省略にあふれているからだ.サッカーファン(特にプレミアリーグのファン)にとってはこれほど楽しい本もないだろうが,私はしばしば途方に暮れてしまった.とはいえいくつか大変興味深い示唆もなされている.ここでは統計的な議論が関連する部分を紹介しておこう.


<得点などの統計>

  • サッカーはほかのスポーツより偶然の要素が大きい.本命チームの勝利確率は5割を少し上回るに過ぎない(バスケットやアメフトでは2/3,野球で6/10).(ただしこの数字だけでは単に引き分けが多い結果なのかどうか判然としないはずだ.読者は別のところにある引き分け割合から自分で補正することを余儀なくされる.そして本書全体の問題だが,その他のテーマでも著者たちはサッカーにおいて引き分けの割合が多いことをどう考えるかについて,きちんと調整した議論を提示していない.ここは読んでいてかなりもやもやさせられる.)なおサッカーに偶然の要素が大きいことは,リーグ戦での3すくみ状況の生じる確率が高いことによっても検証されている.
  • コーナーキックと得点の相関関係はほとんどない.(コーナーキックは高く評価されすぎている)
  • ゴールの分布はほぼポアソン分布に従っている.
  • サッカーの1試合当たりのゴール数は歴史的に減少してきたが,1970年代以降は一試合当たり2.5強でほぼ一定している.著者たちはこれは攻撃と守備の戦術の軍拡競争の平衡点だという言い方をしている.(またこのゴール数が黄金の均衡だともいっているが根拠はなく,単に著者たちの主観的意見のようにしか読み取れない.)またこの点から見ると英国,イタリア,スペイン,ドイツのトップリーグの本質は(様々な文化的な差にもかかわらず)非常に均質である.
  • 勝ち点を2から3に上げたルール改正はゴールの増加を生みださずに,むしろ守備の強化とイエローカードの増加を生みだした.(何故そうなったのかについての解説はない)
  • 一試合当たりゴールが2.5強であることからもっとも価値のある得点は2点目だと考えられる.ストライカーはこの何点目の得点かにかかる重み付けによる評価を受けるべきだ.(これは全く理解できない議論だった.何点目かより,何点差で残り時間がいくらかという条件の方が重要ではないだろうか.そして選手の評価については,そもそもこれは個別の選手に「何点目かの得点をとりやすい,とりにくい」という傾向があることが前提になるはずだが,そんなことが本当にあるかについての統計的検証が全く提示されていない)


<戦術面への応用>

  • サッカーの戦術面へのデータ利用の先駆者はイギリス人のチャールズ・リープだ.彼はサッカー観戦しながら自分でデータをとって整理し,パスの成功確率,シュートにいたる確率,シュートの成功確率などをはじき,パスの成功確率は1/2,シュートの成功確率は1/9であるとした.そしてロジカルに,ロングボールで敵ゴール前にボールを放り込み,シュートを増やすことがよい戦略だと結論づけた.しかしそれは実際にはうまくいかなかった.著者たちは,その理由について効率が上がるように見えても得点機会の頻度が減るためではないかと分析している.
  • サッカーにおいてはポゼッションが頻繁に入れ替わり,トップリーグでは難易度を調整した場合のパス成功率はすべてのチームと選手でほぼ同じになる.片方でシーズンを通したチームごとのパスの回数と成功率は正に相関する.この優位性は容易にパスが通る状況を創り出す能力,戦術によって生まれると考えられる.そしてポゼッションの高さと得点力も相関している.これが現在の主流であるパスサッカー哲学の基礎になる.
  • しかし例外的なチームもある.ストークシティはロングボールを用いるサッカーを成功させている*1
  • 英国プロリーグの順位の92%は選手への年俸総額で説明できる.(おそらく何らかの回帰分析の結果だと思われるが分析方法の詳細はない.なおこの後の部分でプレミアリーグでは10年単位では81%,シーズンごとでは59%という数字も出てくるが,最初の92%が10年単位なのかシーズンごとなのか,またプロリーグ全体とプレミアで何故数字が異なるかについて説明はない.)
  • この分析からすると年俸総額が小さく簡単に2部に落ちそうであるにもかかわらず,5年連続プレミアリーグに残ったウィガンの成績はアノマリーだと評価できる.ウィガンはシュート頻度もゴール確率も捨てて,速攻,セットプレー,ロングシュートに特化している.またフォーメーションを頻繁に変える.これは(あまり使われていない戦術で)相手の意表を突くゲリラサッカーと評価できる.(ウィガンの成功の要因についての統計的な議論はない.)


<選手>

  • サッカーチームの強さはチームの中の選手の能力に依存するが,単純な相加平均ではなく,もっとも弱い選手の与えるマイナス影響の比重が高い.このためプロチームは似たような技量の選手が集まる傾向がある.そして補強は弱点の解消に金を使うのがもっとも効果的になる.(著者たちはこれを「弱連結」と呼んでいる.ここはいろいろ統計的に分析されていて面白い.野球とは随分異なる構造になっているようだ.なおこの分析の基礎になる選手の個別能力評価には「カストロールの評価ポイント」が使われているが,その詳細の説明がない.この選手評価手法は最も興味が持たれるところであり,ここも読んでいて大変もやもやさせられる.)
  • どのタイミングで選手交代をするのが効果的かを統計的に分析すると,58分以前,73分以前,79分以前という結果が得られた.(分析手法の詳細はない.)実際の監督の交代タイミングはこれより遅い傾向がある.(著者はこれは疲労によるパフォーマンスの低下がはっきり目に見えるまでためらうからではないかとしている)
  • サッカーの監督の評価は難しい.しばしば悪い結果が連続したときに解任され,後任の元で成績が上向くことが観察されるが,「平均への回帰」でほとんど説明できる.


全体としてサッカーのデータの統計利用は,なお始まったばかりということだろう.本書の分析も基本的には統計オタクのファンによる分析の域を出ておらず,プロチームによる利用の内情にはあまり触れられていない.しかし今後得られるデータは技術の進展とともに飛躍的に増え*2,そしていかに現場に抵抗があるのだとしても勝敗に大金がかかっている以上,いずれ弱小チームはこれを取り入れ,そして有力チームにも広がっていくのだろう.その他のスポーツもあわせて,5年後,10年後がどうなっているかなかなか興味が持たれるところだ.



関連書籍

メジャー・リーグで弱小チームがデータの統計利用を行って成功していく物語.やはりデータ利用は野球がもっとも進んでいるようだ.私の書評はhttp://d.hatena.ne.jp/shorebird/20160414


関連情報

http://www.wired.com/2016/01/the-nfls-impending-data-revolution/

関連して少し調べてみるとNFLでも今シーズンからすべての試合ですべての選手の両方のショルダーパッドにRFIDチップを埋め込んで選手の運動の位置と速度データ収集し(選手の向きもわかる),いずれそれを各チームとファンに公表する方向で検討しているそうだ.
アメリカンフットボールは野球と同じようにプレーが細切れ(ラグビーと違ってボール保持選手がダウンしたり,フォワードパスが失敗するたびにプレーが止まる.)なので統計的に意味のある繰り返しが得やすいように思われ,そのときにどのようなプレーコールする方がよいかという面での分析は進んでいるようだが(それも現場では割と無視されている),選手の評価などはなかなか難しいようだ.それはサッカーも同じだが複数の選手のプレーが相互に影響して単純な相加的な関係にならない部分の処理が難しいのだろう.これもすべての選手の動きがデータ化され,いい解析方法が編み出されれば変わっていく可能性があるだろう.また怪我の予防にも是非役立ててほしいものだ.

*1:著者たちは成功の理由についていろいろ推測しているが,あまり説得的ではないように思える.このスタイルに合わせた選手を揃えて戦術を徹底させているということなのだろうか

*2:より正確な選手の位置と運動のデータを得るためにシューズにチップを埋め込む計画があるそうだ.