競馬で回収率100%を超えるための意外に簡単な方法

たいのすけ
2019/5/6 データを直近の内容に更新し、記事内容を修正しました

私はこれまでこのブログにて、性別、馬齢、キャリア(出走回数)、枠番、馬番など、誰でも新聞を見れば確認できるようなデータから馬王Zの予想タイム指数といった特定ソフトの指数まで、様々なデータの回収率を検証してきました。

そしてそれらの検証結果をもとに、自分独自の目安として「単勝回収率85%以上はプラス評価、75%未満はマイナス評価」というように、評価を与えてきました。

ここでもしかするとあなたは「回収率85%を超えたから何なの?回収率は100%を超えないと意味ないでしょ」と疑問に思うかもしれません。

そこで今日はこれらのデータを組み合わせるだけでも回収率が100%を超える馬を見つけることができるということをお話したいと思います。

回収率が高いデータの組み合わせで「回収率100%超え」を目指す

ある馬が1つの項目で回収率が良い条件に当てはまり、さらに別の項目でも回収率が良い条件に当てはまったとします。

このとき、この馬の回収率はかなり高くなると思いませんか?

例えば、「ダートレースで外枠の馬」と「夏の牝馬」はそれぞれ回収率が高い条件ですが、「夏のダートレースで外枠の牝馬」はかなり回収率が高くなりそうな気がしませんか?

そして今回のように2つの項目の組み合わせだけでなく、当てはまる条件が3つ、あるいは4つ、あるいはそれ以上なら…。

 

また、その逆にマイナス評価がいくつも重なるような馬の回収率は悲惨なものになる気がしませんか?

 

そこで実際に複数の良い条件が組み合わさると本当に回収率が上がるのか、あるいは複数の悪い条件が組み合わせることで本当に回収率が下がるのか、確認してみたいと思います。

 

「性別」と「キャリア」の2つのデータの組み合わせ

まずは一例として、これまで私がブログで公開した検証データのうち、「性別」と「キャリア」を組み合わせたケースについて見てみます。

性別とキャリアの具体的な検証結果については各カテゴリの記事をご参照ください。
性別
キャリア

この2つの項目それぞれで私は加点・減点ルールを決めましたが、そのルールに基づいた評価点ごとの成績は以下の通りです。

(対象:2014年5月~2019年4月の障害レースを除くJRA全レース、単勝2~8番人気のみ)

①性別

②キャリア

評価点の+1点は単勝回収率85%以上、-1点は単勝回収率75%未満という目安で、各項目の検証結果にもとづいて付けた点数です。

また、-2点というのは単勝回収率が70%を著しく割るような条件について付けています。

たいのすけ
それとは反対に単勝回収率が90%を顕著に超えるようなデータがあった場合には、プラス2点の評価をつけています。

 

それでは上の①性別と②馬番の評価点を合計した点数の成績を見てみます。

①②それぞれにマイナス2点からプラス1点までのデータがありますので、これを足し合わせるとマイナス4点からプラス2点までのパターンができます。

そして、各パターンごとの成績は以下の通りとなりました。

①性別+②キャリア

ご覧の通り合計点がプラス2点の成績はかなり良い結果となっています。

性別とキャリアの両方の項目でプラス評価だった馬は、単勝回収率が100%近くに達していたことになります。

 

反対にマイナス3点以下はひどい結果となっています。

もちろん、プラス2点馬やマイナス3~4点馬はデータ数が少ないので、このままの数字を鵜呑みにするのは危険です。

ただ、この例だけでも回収率が少し良いもの同士を組み合わせることの可能性は感じていただけたのではないかと思います。

 

「枠番」と「馬番」の2つのデータを組み合わせてみる

続いてもう1例、「枠番」と「馬番」の評価点について足し合わせるケースを見てみたいと思います。

枠番と馬番の検証結果については各カテゴリの記事をご参照ください。
枠番
馬番

枠番と馬番は一見似たような項目ですが、両者の評価内容が重複しないように注意して検証していました。

それではこの2つの項目を組み合わせるとどうなるでしょうか。

 

まず、それぞれの評価点ごとの成績は以下の通りです。

(対象:2014年5月~2019年4月の障害レースを除くJRA全レース、単勝2~8番人気のみ)

③枠番

④馬番

枠番については単独でもプラス2点馬の単勝回収率が100%を超えています。

一方、馬番のプラスは2点のみですが、こちらもかなりの回収率となっています。

この2項目を組み合わせるとどうなるでしょうか?

結果は以下の通りとなりました。

③枠番+④馬番

ここで、枠番の評価がマイナス2点~プラス2点、馬番の評価がマイナス1点~プラス2点ですから、合計するとプラス4点やマイナス3点の馬が出てもよさそうなものです。

しかしそのような点数の馬がいないのは、枠番の+2点と馬番の+2点、あるいは枠番の―2点と馬番の―1点というケースが両立しないような条件付けになっているからです。
(例えば、枠番におけるプラス2点という評価は芝レースでしか獲得できない条件ですが、反対に馬番のプラス1点はダートレースでしか存在しないので、両立はしません)

たいのすけ
また+3点というのもかなりのレアケースなので無視します

さてこの結果を見て、もしかすると「枠番単独の条件でも+2点の馬は単勝回収率が120%を超えていたのに、馬番と組み合わせたら+2点馬の回収率は104%まで下がった。だからこの組み合わせの効果はマイナスに働いたのではないか。」と思うかもしれません。

ですが、私はプラス2点馬の件数が増えたことでデータの信頼性が増したと思っています。

よって、一見回収率が下がったように見えても、この「枠番」と「馬番」の組み合わせた意味はあったと考えます。

 

このように、組み合わせ方によって回収率が大きく上がるケースとそうでもないケースがあるものの、「少し回収率が良いデータ」を組み合わせることで回収率がさらに高いデータを見つけることができるというのがおわかりいただけたかと思います。

ただ、私は2つの要素を組み合わせただけでは回収率が安定的に100%を超えるのは難しいと考えており、3つ、4つ・・・と有用なデータを足し合わせていくことで初めて実戦レベルで使用に耐えうる条件が見つかると思っています。

そこで、①~④の評価点を全部足し合わせた結果を見てみましょう。

今回の「性別、キャリア、枠番、馬番」の4つの要素については全体的にマイナスの評価項目の方が多かったため、合計点もマイナスの方に寄った分布になっていますが、合計点が低い方から高い方に行くにしたがって回収率も高くなっていく傾向があることがわかる思います。

マイナス6点以下やプラス4点についてはデータ数が少なすぎるため度外視するとしても、プラス3点馬の単勝回収率が100%を超えており、先ほどの例の2点馬よりも回収率は高くなっています

11個のデータ項目の組み合わせ

さて、組み合わせるデータは多い方が良いことは何となくわかっていただけたかと思いますが、せっかくなので私が現在ブログで公開している以下の11項目のデータについてすべてを合計した評価点も載せておきます。

  1. 性別
  2. キャリア
  3. 枠番
  4. 馬番
  5. 馬齢
  6. 前走馬体重
  7. クラス変動
  8. トラック種別変更
  9. 前走着順
  10. 距離増減
  11. 馬王Z予想タイム指数

 

集計結果は以下の通りです。

件数が少ない項目はあまり参考にしなくても良いと思いますが、3点以上のデータの件数が増え、より信頼度が高くなりました。

さらに最後にもう1つデータをご紹介しておきます。

上の表は単勝2番人気~8番人気に限定したものですが、それ以外の1番人気や9番人気以降も含めすべての馬についてもこの得点付けが有効かどうかをみておきたいと思います。

データ分析は2~8番人気のみで行ったとしても、実際のレースではそれ以外の人気の馬も買えた方がよいですからね。

補足
そもそも私が単勝2番人気~8番人気に絞っている理由については、以下の記事に書いてあります。

競馬の分析にふさわしいデータの選び方

2017年9月8日

単勝人気を絞らずに集計した結果は以下の通りとなりました。

もともと単勝人気を2~8番人気に限定して作成した評価方法でしたが、単勝人気を絞らない場合にも有効であることがおわかりいただけるかと思います。

たいのすけ
このように最初から全人気を対象として分析するよりも、適切な対象に絞って分析したあとに範囲を広げた方が有効であると考えています

 

以上、私がブログに公開済みの項目だけでも回収率100%超えは十分に狙えることはわかりました。

そして、この11項目には血統、騎手、脚質などの主要データは入っていません。

これらを加えればさらに多くの高回収率データを見つけることができます。

また、今回は単純な足し算で評価点を計算した結果をご紹介しましたが、実際には重要度が高い項目に重みづけをしたり、重複する要素は少し割り引いて計算するなどの考慮をすることで、計算結果の精度も向上します。

その辺の工夫の仕方についても今後触れていきたいと思います。

 

さて、「回収率が85%以上のデータ」あるいは「回収率が75%未満のデータ」の利用価値はご理解いただけましたか?

いきなり回収率100%超えの条件を見つけることは難しくても、85%というハードルであればそれほど高くはないと感じる方も多いと思います。

ぜひあなたも色々と高回収率の条件を発見し、そしてそれらを組み合わせて行ってください。

最初は少しの項目だけしか利用できないかもしれませんが、どんどん要素を増やしていってより芯の強い予想法を作成していく過程は楽しいですし、特定の馬券術にこだわるよりもリスクや挫折が少ないと思います。

 

なお、私は現在約40のデータ項目を使用しています。

 

ブログランキングに参加しています。この記事が役に立ったという方はぜひ応援クリックお願いします。

競馬・データ理論ランキング

 

4 件のコメント

  • いつもブログやTwitterを拝見させて頂いております^_^
    有益な情報ありがとうございます♪
    初心者の私に教えていただきたいのですが、ノートパソコンの購入→JRAVANデータラボへの加入を考えています。今はJRAVANアプリで購入です。
    イメージが全く湧かないのですが、AIソフトというのは、また別にあるのでしょうか?
    あと馬王Zは一つの材料として活用するのでしょうか?
    ど素人の質問で、本当に申し訳ございませんm(_ _)m

    • コメントありがとうございます。
      ご質問のAIソフトがどのようなものを指しているのかがわかりませんが、データラボを契約すると様々なソフトが使えるようになるので、その中にご希望に合致するものがあるかどうかが回答になるかと思います。
      馬王Zはそのソフトのうちの1つですが、データを分析したりそれを元に自動投票するといった機能が特徴です。
      ただいきなり馬王Zを使いこなすのは難しいと思うので、まずは最も有名なTARGETというソフトを使ってみると良いと思います。

  • こんにちは
    回収率100%越えのデータを組み合わせて買うという方法は良く聞きます
    自分も魅力を感じて最近興味を持っているのですが

    その100%越えの回収率はいつまで続くのでしょうか

    また、続きそうなデータをどのように選べばいいのでしょうか

    たとえば過去5年で見た回収率は120%を超えていても
    過去10年、30年と伸ばした時には回収率が80%前後に落ち着いてしまいます
    また、条件を重ねすぎてしまうと母数が少なくなってしまうので、尚更怖くなってしまいます。
    回収率が信頼できるデータの期間はどのくらいが目安なのでしょうか
    今とても悩んでいて実戦に移すことができないので、良ければこの辺の目安を教えていただけないでしょうか

    • こんばんは。コメントありがとうございます。

      ご質問の回答ですが、過去のデータが将来いつまで続くのかはわからないので、それぞれが過去データから統計手法などを使って判断するしかないと思います。
      その結果私の場合は5年に落ち着いたということです。

      判断の手法の1つとして以前に以下のような記事を書いていますので、ご参考にしていただければと思います。
      https://bakenseikatu.com/tkentei

  • コメントを残す

    メールアドレスが公開されることはありません。 が付いている欄は必須項目です

    このサイトはスパムを低減するために Akismet を使っています。コメントデータの処理方法の詳細はこちらをご覧ください

    ABOUTこの記事をかいた人

    アバター画像

    競馬歴20年のたいのすけです。 逃げ馬の研究をきっかけにここ数年は「競馬で勝つ」ことを追求し、分析と実践を繰り返しています。 徐々に成績は向上してきていますが、目標とする「完全自動投票でお金が勝手に増えていく」という状態にはまだ達していません。 なるべく多くの情報を発信して、それを受け取った方々から反対に情報をいただく、というのが現在のスタイルです。 ぜひ情報交換していきましょう!