競馬の統計論文を参考にして素人が競馬予想をする方法を解説

競馬 統計 論文 競馬統計学

競馬には膨大なデータを利用して、自分なりのファクターを論文で公開したり、販売している方が存在します。

その論文は、細かいデータを元に個人的に最適なファクターとして公開していることが多くありますので、競馬を予想する上で参考になる場合もあります。

しかし、個人的な見解が多く含まれる内容になるので、実際に誰もが参考になるかどうかは判断できないでしょう。

そこで、今回はどんな論文があるのか詳しく紹介します。

様々な種類の統計論文を確認して、参考にしてみて下さい。

競馬は統計学を使って算出できるのか

競馬 統計 論文

まず、様々な論文を紹介する前に、前提として競馬は統計を利用して算出できるのか?という観点について説明します。

そもそも、競馬はギャンブルであることに変わりはありません。

ギャンブルは、運の要素が高く偶然儲かるものなので、どんなに予想しても未来を予知することができないことから、攻略法などは存在しないでしょう。

しかし、カジノやパチンコ・スロットのように確率だけは判明しているので、運の要素と漠然とした推測で楽しむギャンブルも存在します。

その中で競馬には確率が備わっているのにに加え、過去のデータというものが存在しており、この過去データを利用すれば、運の要素が少しでも少なくなるギャンブルだと思います。

そのため、過去のデータを参考にした統計論文で公開したり、販売する方がいるのです。

そこで、今回はどんな論文があるのか紹介しますので、確認してみて下さい。

競馬から学ぶ統計の世界@トウケイバ

競馬 統計 論文

この統計論文は、noteで公開されている論文になっており、概要には下記の内容を記載していましたので紹介します。

「統計学を勉強するためのアカウントです。競馬は目的のための手段。統計学を楽しく学びたい、そしてあわよくば、競馬の敷居を下げたい、という思いでnoteを書いています。よろしくお願いします。」

このように、統計学の勉強をするために論文を書いており、競馬の膨大なデータをJRA-VANから参照しながら算出しています。

この論文の筆者が選定した変数を軸に統計を算出しながら競馬分析を行っていることが解りました。

競馬分析で使用している変数は下記の通りです。

・競馬場
・距離
・コース区分
・レース条件(グレード)
・重量種別
・天候
・馬場状態
・出走頭数
・逃げ馬・先行馬の割合
・枠番
・馬体重
・馬体重増減割合
・負担重量
・負担重量率
・騎手 勝率
・騎手 3着内率
・性別
・馬齢
・調教師 勝率
・調教師 3着内率
・生産者
・馬主
・父
・母父
・予測対象馬 
・出走回数
・1着回数
・3着内回数
・出走回数(同トラック)
・1着回数(同トラック)
・3着内着回数(同トラック)
・出走回数(同距離)
・1着回数(同距離)
・3着内着回数(同距離)
・重賞出走回数
・重賞勝利数
・重賞3着内回数
・脚質(逃げ・先行)
・前走のレース条件
・前走からの間隔
・前走のレースのレベル
・前走のレースタイム比
・前走の上がりタイム比
・前2走のレースのレベル
・前2走のレースタイム比
・前2走の上がりタイム比
・前3走のレースのレベル
・前3走のレースタイム比
・前3走の上がりタイム比
・直近1年のベストタイム比
・直近1年のベスト上がりタイム比
・過去1ヶ月の平均調教本数
・過去1ヶ月の最高ラップタイム
・走破速度

この膨大な量の変数を用いて、走破速度の実力差を算出したり目的変数を利用して着順は回収率を基準に算出していました。

競馬分析の場合、先行馬の研究も重要なので、今後はその点も含めて論文を公開するようです。

詳しくは下記リンクから参照してみて下さい。

競馬から学ぶ統計の世界@トウケイバ

テクニカル分析の立場をベースとした複勝馬券の的中確率に関する統計モデル

この論文は、伊藤耕介という筆者が競馬の統計に関して書いた論文です。

馬の着タイムや走破速度を過去の着順やタイムを様々な要因から説明した論文になっており、重回帰分析やニューラルネットワークを一般化された共分散構造分析などの統計的手法を用いて、説明変数と馬の走破能力とを関係づけることを解説しています。

主な記載内容を下記の通りです。

・「真の確率」の概念
・過去の研究のレビュー
・日本の中央競馬会でのモデル選択問題と確率予測
・単勝馬券の支持率は的中率に等しいか?
・まとめ

この論文は、統計学を用いた競馬の論文なので、数学の知識が無いと理解することは難しいでしょう。

内容が理解できない方は、自分が目的としている部分だけでも参照してみて下さい。

興味のある方は下記のリンクから確認ができます。

テクニカル分析の立場をベースとした複勝馬券の的中確率に関する統計モデル

競走馬の強さの分析と馬券ポートフォリオ問題

続いて紹介する論文は、中央大学理工学部情報工学科の学生だった秋田貴成さんが卒業論文で書いた論文の紹介です。

この論文のには、概要が記載されていますので、抜粋して紹介します。

「本研究では対戦成績に基づく Bradley-Terry モデルを用いて競走馬の強さについて論ず
る。また、リターンの期待値(回収率)を確認した上でリスクの低減を考えた馬券の組み合
わせについて論ずる。
まず、過去の競走馬の対戦成績から、Bradley-Terry モデルを用いて各競走馬の「強さ」
を推定して、求めた競走馬の推定値と実際の競走馬の成績を比較して評価を行う。
続いて、本研究ではリターンの複数の期待値と組み合わせてリスクの低減を考えた馬券
におけるポートフォリオ最適化問題についても論ずる。馬券を投資の対象とすることによ
って、2 次計画問題として定式化して最適解を求める。」

この論文では、競走馬の強さを統計学を用いて分析しており、関数の計算式を作成して分析している論文になります。

またこの論文では、中央競馬で行われたレースのレース結果データとオッズデータを使用しています。

素材は、JRA-VANの過去データを使用しており、1 レース分のデータから得られるデータはレース名、レースの開催年月日、場所、レース距離、全着順、枠番、馬番、人気、全競走馬名、全騎手名、タイム、オッズを利用して算出しています。

詳しく内容は下記のリンクで論文を確認してみて下さい。

競走馬の強さの分析と馬券ポートフォリオ問題

論文には個人の見解や算出方法が含まれる

競馬 統計 論文

上記に紹介した論文を読んでもわかるように、統計学を利用しいた論文には個人的見解をもとに計算式を作成して、関数を利用しながら算出しています。

競馬の過去データを利用して独自ロジックを考えて、アプローチしているので、論文を読んでも数学の知識がないと判断することは難しいでしょう。

そもそも統計学とはデータ分析するための手法になるので、目的は何に設定するのかで内容は大きく変わってしまうと思います。

競馬には数多くの統計論文が公開されていますが、全てにおいて筆者の目的が設定されています。

勝てる確率を求める統計論文と、競走馬のスピードに関する統計論文では内容は大きく異なり、目的にしている数値は違います。

そのため、論文を参考にする時は、自分の考え方と目的が一致するものを選択すると良いと思います。

まとめ

競馬 統計 論文

今回は競馬の統計に関する論文を紹介させて頂きました。

競馬の過去データを使って論文を算出する時には、数学的要素がたくさん必要になります。

論文ではデーターベースのJRA-VANを利用していますが、算出方法は自分のロジックを基準にすることが多く、算出する統計分析の目的も全て異なるでしょう。

競馬の論文を確認する上で、重要なのは自分の目的と論文の目的が一致しているのか?という部分です。

統計を利用して、競馬で儲けたいと思うときは、論文の筆者がどんな関数を使って算出するのかが重要になると思いますので、自分に合っている統計論文を探してみてはいかがでしょうか。

何か新しい発見ができるかも知れません。