競馬データ分析の落とし穴

果たして、競馬で「データ分析」は有効か?

競馬の予想の一つに「データ分析」があります。

有効なものもあれば、ほとんど役に立たないものもあります。

またレースによっては施行条件が変わるものもあるため、データ分析が有効なのは「長年施行条件が変わっていないもの(開催時期、距離、ハンデ戦/別定戦など)」に限ります。

1番人気が勝てない

1番人気と言っても、色々なタイプがあります。

単勝人気が1.0倍のこともあれば、6倍以上付くことも。

あるレースのデータで「1番人気が〇連敗中」というのは、ほとんどあてになりません。

今回の1番人気の単勝が5.x倍なら疑わしいですが、もし1倍台なら来る可能性が高いでしょう。

一口に「1番人気」と言っても様々なタイプに分かれるので、データを基に1番人気は無条件に消し、などとしない方が良いです。

脚質

「このレースは過去10年で逃げ切った馬はいない」とか、そういう話です。

展開はその時々により様々なので、鵜呑みにするのは危険です。

「このレースは過去10年で逃げ切った馬はいない」というレースで、その開催は逃げ馬が大活躍だった場合、1番人気の逃げ馬を切るのは馬券妙味がありますが。。

過去の開催では「開催全体を通して、逃げ馬は不振だった」かもしれません。



ジョッキー

「過去〇年間、毎年必ず外国人ジョッキーが馬券に絡んでいる」

は「単に今までそうだった」というだけで、とてもデータとは言えません。

今回外国人ジョッキーが一人だけ乗っていて、その馬が直前に放馬して出走取り消しになったら、この法則は崩れることになります。

ハンデ戦で

「過去にトップハンデ馬は連絡みなし」も、たまたまこれまでそうだった、としか言えないでしょう。

圧倒的に実力のある馬が出てきて相手が弱ければ、トップハンデであっさり勝つ可能性が高いです。

キャリア、レース間隔

このレースは〇戦以上経験した馬は不振、キャリア〇戦以内しか好走歴がない。

これも過去はそうだった、というだけですね。

こういうデータはあまり信じない方がいいです。

レース間隔に関しては近年、調教技術の向上により、過去のデータがほとんど当てはまりません。

「〇か月以上の休み明けの馬は来たことがない」という感じの”データ”です。

その他オカルトに近い物

  • 芦毛の馬は勝てない
  • 体重が重い馬は勝てない
  • 名前が〇〇な馬は消し

とか、このレベルまで来ると、単なるオカルトでしかありません。