予測の検証結果|JRA-VAN広場

競馬予想・競馬情報ならJRA-VAN

データマイニング予測の仕組み

予測の検証結果

データマイニング予測モデルの精度を検証した結果は以下の通りです。

(1)検証の前提事項

  • 検証に使用したレース: 2007年 1月〜2008年 6月に開催された全レース(※1)(レース数:4,315)
    ※1:ただし、阪神競馬場は学習期間中に改修工事が行われ、改修後の情報を予測モデルが学習できていないため、今回は検証対象からははずします。
  • 検証方法: 2001年〜2006年までのデータを使用して作成した予測モデルで、上記レースを予測させ、予測結果を実際のレース結果と比較します。

※予測に使用したデータのなかで、天候、馬場、馬体重などは実績値を使用しました。これは、JRA-VAN NEXTのマイニング画面での「直前」予測に相当します。

(2)予測順位と実際の着順の相関

予測タイムを元にした予測順位と、実際の着順の関係を以下の表に示します。

2007年 1月〜2008年 6月に開催された全てのレース(レース数:4,315)

2007年 1月〜2008年 6月に開催された重賞レース(レース数:162)

予測と実際の着順を、縦・横軸にとっていますので、着順が一致したところを青色で示しています。また、各予測順位について、実際の着順件数が最も多いところを赤枠で示しています。青色と赤枠が一致するほど予測精度が高いといえます。上記の表を見ると、予測順位の上位に若干ばらつきがありますが、かなり一致していることがわかります。
ただ、競馬の場合は上位着順に関する予測精度が命ですので、予測での 5着以上について、勝率、連対率等を算出した結果を以下に示します。

2007年 1月〜2008年 6月に開催された全てのレース(レース数:4,315)

2007年 1月〜2008年 6月に開催された全ての重賞レース(レース数:162)

  • ※1 単勝率:実際のレースで1着であった比率
  • ※2 馬連連対率:実際のレースで2着以上であった比率
  • ※3 ワイド連対率:実際のレースで3着以上であった比率

(3)的中率、回収率に関する検証結果

では、この予測結果に基づいて実際に馬券を買っていたらどうなったでしょうか。単勝と馬連( 8頭以下のレースでは枠連)について検証してみます。対象とするレースは、2007年 1月〜2008年 6月までの全レース(障害も含む)で、4,315 レースです。
※ この検証結果は今後の予測性能を保証するものではありません。あくまで参考データとしてお読みください。

(1) 単勝・馬連馬券での検証結果
予測順位に基づき、単勝の 1点買い(予測 1位の単勝のみ購入)、及び馬連馬券を購入した場合の結果をシミュレーションします。買い方はすべて 1点につき 100 円づつ均等に買ったものとします。

タイム合計6点とは予測タイムに基づく馬連の選び方ですが、予測タイムが図抜けて速い馬がいる場合はその馬を軸にした流しに近い買い方となり、各馬の予測タイムが接近している場合はBOXに近い買い方となります。

対象レース数:4,315

全レースの平均回収率は100 %に届いていませんが、これは2007年 1月〜2008年 6月に開催された全てのレースについてモデルの予測結果をもとに馬券を購入した場合の回収率です。では、購入するレースを絞り込んで馬券を購入すると回収率はどうなるのでしょうか。

(2) 購入対象レースを絞り込む

絞り込む条件として、レースクラス、天候、馬場状態、コースの特徴(競走場・距離)等、様々な組み合わせが考えられますが、その中で以下のような条件において検証結果の回収率は高くなります。

■レース条件
クラス:500万、1000万
コース:ダート
馬場状態:稍重、重、不良
天候:1300メートル〜1700メートル

対象レース数: 121

購入点数が多くなると回収率が100 %を超えています。中でも 1点、3頭BOXによる買い方は高配当を得られそうです。このような予測モデルの検証は、JRA-VAN NEXT Browser で提供している”自由自在!マイニング分析”でも行うことができます。”自由自在!マイニング分析”での上記条件での 2008年の予測結果はこちらです。

ところで、芝についても同様に回収率が高くなるような条件を探してみると、以下のような条件が見つかります。

■レース条件
クラス:新馬、未勝利、未出走、500万、1000万
コース:芝
世代:2歳、3歳
天候:晴れ、曇り
距離:1000メートル〜1200メートル

対象レース数: 237

単勝以外の買い方であれば、回収率は100 %を超えています。ただ、単勝の的中率(25.7%)と全レースの的中(24.0%)には大きな差はありませんので、回収率が悪い要因は高配当のレースを当てられなかったことにあるようです。 参考までに、”自由自在!マイニング分析”での上記条件での 2008年の予測結果はこちらです。

以上から、予測モデルが当てやすい (得意とする) レース条件が存在することがおわかりかと思います。
今回ご紹介した条件については、今後の回収率を保証する条件ではありませんが、”自由自在!マイニング分析”を使ってマイニングモデルが当てやすいレース条件を見つけ、そこから独自の買い方を展開するのも面白いかと思います。
是非、”自由自在!マイニング分析”を使って予測モデルが当てやすいレースを見つけてみて下さい。