JRAが独自のアルゴリズムで算出した、データマイングを深堀りしたいと思います。方法は幾つかの仮説を立ててそれを調べることにします。データマイニングは馬の走破タイムを基にしたMマイニングと、対戦したレースでどっちが勝つかを推定したTマインニングが有りますが、Tマインニングの方がしっくりくるので以降マイニングと言ったらTマイニングだと思って下さい。

1.マイニング1位の馬の複勝率が一番高いコースは?
2023年1月から遡って5年間のデータを集計しました。尚、10レース以下のコースはサンプル数が少なすぎるので除外します。

答えは、京都ダート1200mの未勝利です。勝率、連対率、複勝率も高いんですが、回収率が伴っているので価値が高いと思います。

2.マイニング1位馬のクラス別の成績は?

クラス別では、未勝利戦が一番高いです。G1は低いようです。

3.マイニング1位の牝馬と牡馬で勝率が高いのは?

ほぼ同率です。

4.ハンデ戦と非ハンデ戦ではどちらが成績がよい?