競馬に於ける数字の信頼性
こんにちは、ゆ~じ~です。
今日はデータを使った競馬予想を行うに避けては通ることの出来ない「数字」について少々触れてみることにします。
競馬新聞や各種サイト、書籍などでは必ずと言っていいほど「数字」と触れ合うことになります。
「数字」は情報を的確に把握するのにはもっとも優れたものとして競馬だけでなく、様々な状況の中で多様されている非常に有用な道具であるからですね。
競馬予想などでよく見かけるものとしては、あるG1レースなどで、
このレースに於いて過去10年、ダイワメジャー産駒の成績は、
4-1-0-5
勝率40.0%、連対率50.0%
と、非常に好成績。
などといったデータが示されているものを見ることが少なからずあろうかと思います。
こうしたものがきっかけに馬券を買ったことがある人も少なからずいると思います。
ただ、個人的に感じるのは、
『このデータでは信頼性に欠ける』
と、いうこと。
勿論、このデータ自体は過去の成績を示しており、正しいものでしょう。
ただ、これだけのデータでは、
『ダイワメジャー産駒がこのレースに高い適性を持っている』
との結論に至るには、あまりに心もとないと思います。
このケースの場合、仮に1頭のスーパーホースがこのレースを、
3-0-0-0
と、3連覇していたとしたならどうでしょう?
この馬がいなかったとするなら、
1-1-0-5
勝率14.3%、連対率28.6%
に、なります。
これでは「ダイワメジャー産駒はこのレースに高い適性を持つ」
なんてことは言えなくなりますね。
ましてやこの数字には牡、牝のことについても触れていませんね。
何が言いたいのかと、言うとこれではデータとしての信頼性を持たせるには分母であったり、切り口が少なすぎるということです。
先程の例であれば、たった1頭の成績が全体の数字がまるで異なるほどの影響を与えています。
10程度の分母ではこうしたことが往々にしてあるわけです。
ジャンケンを例に挙げてみます。
10回ジャンケンをした時、1回しか勝てないこともあれば、5回勝つこともあります。
ただ、1000回ジャンケンをした時に500回勝つなんてことはまずない、というのはご理解頂けるでしょうか?
数字というものは分母が大きくなればなるほどその信頼性が増す側面があります。
裏を返せば少ない分母の場合にはちょっとした偏りが全体に占める影響が大きくなるということ。
この例の場合、たった10回の出走データを元に「ダイワメジャー産駒はこのレースに高い適性を持つ」と言い切るには無理があるということになります。
実際にダイワメジャー産駒にそのレースに高い適性がある、「かもしれない」けど、そうではない「かもしれない」と、いうことになります。
加えて、先程の例には回収率であったり、平均着順といったデータも示されてはいませんね。
読み物としてみれば、先程のデータは
・ 大量のデータを示せばマニアックになり、初心者には敬遠されてしまう可能性が少なからずある
・ 大量にデータを掲載した場合、紙面に大きなスペースが必要となる
など、書き手の都合というものもあったりします。
実際、仮に私が予想を掲載する場合に於いても、そうした細かいデータをつらづらと書いてしまうと大変な手間ですし、読むのも大変ですから、
「ダイワメジャー産駒は好成績を収めており、相性は良さそう」といった書き方に留めると思います。
ですから、先程のデータは
『予想に使えるほど有用なものではない』
と、いうことになります。
実際、私はこうしたデータに頼った予想はしないよう意識もしています。
ただ、先程記した事情などもあって一般に公開されている「データ」にはこうしたものがあまりに多いんですよ。
確かに簡潔な方がわかりやすいですしね。
しかしながら数字というものは分母が大きくなればなるほど、様々な切り口から総合的に見ていくことでその信頼性が増すことは紛れもない事実です。
そうした競馬新聞やサイト、書籍のデータをどれだけ信頼するかはひとりひとりの自由なんですが、そのデータに信頼性があるのか、ないのかってことも頭に置いておいても悪くないかと思います。