前回の記事では、性別ごとの成績を確認しました。
もう一度その結果を確認してみます。
(単勝2~8番人気 2012年9月~2017年8月の障害を除く全レース)
この結果ではせん馬の単勝回収率が85.4%と最も良いように見えます。
私の評価も基本的には85%以上であればプラスとしているので、それをクリアしているように見えます。
しかし、私はこのせん馬の成績についてはプラス評価するのは危険だと考えます。
以下、その理由をいくつか挙げてみます。
●勝率がそれほど高くない
勝率を見てみると牡馬よりも低いですし、牝馬ともほとんど差異がありません。
つまり、せん馬が牡馬や牝馬よりも単勝回収率が高いのは「2~8番人気の中でもオッズが高い部分での的中がたまたま多いため」と考えられます。
このように人気薄馬の偶然の活躍によるダマシは、勝率を見ることである程度防げます。
●複勝回収率が高くない
単勝回収率は確かに高いですが、複勝回収率はそれほど高くはありません。
単勝回収率が高いデータは複勝回収率も必ず高くなるとまでは言い切れませんが、データとして信頼できるのは的中のサンプル数が多い複勝回収率の方です。
また「1着か凡走か」というような特徴を持つようなデータ以外は、ある程度単勝回収率と複勝回収率は連動するはずです。
よって複勝回収率が高くないデータは私はあまり信用しないことにしています。
●「せん馬は馬券的にオイシイ」という話は聞いたことがないし、その理屈も思いつかない
もし事前に「せん馬は馬券的にオイシイ」という話を聞いており、その理由にも納得をしていたとしたら、それがデータで裏付けられた格好になるので信用したかもしれません。
しかし、残念ながらそのような話は聞いたことがありません。
理屈が先にあるのではなく、データを調べてみたらたまたま好成績だったというパターンは、疑ってかかるようにしています。
●年度別に見ると成績がバラバラ
これも重要なポイントなのですが、過去5年間をまとめてみると良い成績でも、年度別に見るとバラバラだったりします。
実際に、せん馬の成績を年ごとに見てみると以下の通りになります。
(単勝2~8番人気 2012年9月~2017年8月の障害を除くレース)
確かに2014年までの3年間は絶好調の成績ですが、2015年以降はさっぱりです。
特にここ2年は悲惨な成績で、これでは使えるデータと呼ぶのは難しいでしょう。
このようにデータをも細分化してみると、信頼できるかどうかが見えることがあります。
以上、一見回収率が高いせん馬について、私が有効だとは判断しない理由を説明しました。
せっかく優秀な計算式でも、誤った分析結果を加えればその精度は落ちるため、有効と判断するデータは慎重に選ばなければなりません。
統計学的に必要なデータ数を割り出すような方法もあり、それについてもいずれ説明しようかと思いますが、私は今回のように総合的に判断することが大切だと思っています。
あなたも、データ分析の際には、「これは本当に有効なデータなのか」ということを慎重に考えてみて下さい。
次回は、「では、性別で使えるデータはどんなデータなのか」について見ていきます。
【次の記事】
コメントを残す