高柳式スピード指数は、最小自乗分散分析法という統計解析法により、2000年以降のJRA平地レースデータを用いて、競走タイムを左右する要因の影響を推定し、その推定値によって個々のレースや馬の競走タイムを補正・指数化したものです。これによって、異なる条件で行われたレース結果を比較することが可能になります。
最小自乗分散分析法は多量のデータを用いて統計的に解析する方法で、例えば動物実験による投薬の効果の判定や、店の売り上げを左右する要因の調査などにも使われます。高柳式スピード指数の場合は、100mあたりの競走タイムに対して、統計的に有意な影響を及ぼす各種要因とその効果の大きさを推定します。
競走タイムに関与する各種要因は以下の通り。
○母数効果(各水準ごとに値が割り当てられる効果)
・馬場状態×芝&ダートの交互作用:芝とダートで良~不良の影響はほぼ逆になる
・当日馬場:同じ競馬場&馬場状態でも、開催日によってタイムが違う
・内回り&外回り:同じ競馬場でも外回り(直線)の方が内回りよりタイムは速い
・コーナー数:コーナー数が増えるほどタイムは遅い
・ダートのスタート地点:スタート地点が芝のダートコースはタイムは速い
・コース改装:中山ダート1200m(2002年秋~)、阪神(2006年冬~)、中京(2012年春~)
・非直線の芝1000m:全能力を使い切る前にゴールするせいか時計は遅い
・クラス×芝&ダートの交互作用:下級条件ほど芝の方がダートよりレベルは高い
○共変量(連続変量として取り扱う効果)
・距離:3次回帰の効果まで考慮
・ペース:全体&上がりタイムを用いた数式から値を算出し、2次回帰まで考慮
競走タイム=母数効果+共変量+残差(指数+誤差)という数学モデルを立て、残差の分散が最小になるようにレースデータを用いて連立方程式を解き、そこで得られた母数効果&共変量の推定値を用いて、個々の馬の競走タイムを補正することによってスピード指数を算出します。
競馬予想GPで提供するスピード指数は、左から平均指数+レースごとの指数(5前走→前走の順)となっています。平均指数は2&3歳馬に関しては過去3走、古馬に関しては過去5走のうち、いずれも最低値をカットした後の平均値で示しています。2&3歳馬に関してそのような扱いをするのは、若駒の成長力を考慮すると、4&5走前の指数が現在の能力を反映しているとは考え辛いという理由からです。
スピード指数は当然ながら、レースの条件や当時の馬の状態によって左右されるため、あくまで平均指数はその馬の能力を「ザックリと」捉えたものとして考えて下さい。また、スピード指数は個々の馬同士で単純に比較できるように、クラスの効果を含めて算出しているので、クラスごとの水準値を覚えておくと、あるレースの指数が当該クラスにおいて高レベルか低レベルか判別できます。なお、指数に芝とダートのレースが混在する場合、出走するレースのトラックに合わせて補正しています(生データでは芝>ダートのため)。
各クラスごとの芝&ダートの指数の水準値は以下の通り。
芝 | ダート | |
2歳新馬 | 29.556 | 22.172 |
2歳未勝利 | 33.651 | 25.005 |
2歳500万 | 38.573 | 34.186 |
2歳オープン | 39.034 | |
3歳新馬 | 31.888 | 24.146 |
3歳未勝利 | 37.286 | 28.372 |
3歳500万 | 41.357 | 36.729 |
3歳オープン | 44.932 | 43.993 |
古馬500万 | 42.436 | 36.489 |
古馬1000万 | 44.589 | 42.011 |
古馬1600万 | 46.507 | 46.132 |
古馬オープン | 50.000 | 50.000 |