ラグビーワールドカップ 2023 予想

先日,組み合わせ抽選が行われたラグビーのワールドカップの展望をお届けします。

仮に今のランキング(2021/3/7 現在)どおりに予選の通過チームが決定したとしましょう。各グループのチームとランキングは以下のとおりです。[ ]内の数字がランキングを表します。*1

Pool A

Pool B

Pool C

Pool D

 

 さて,ランキングポイントを使うと,2 チームが対戦した時の勝率を求めることができます。*3これを使って,大会をシミュレーションしてみました。100 回繰り返すと,以下のようになりました。

f:id:hoshiotan:20210307152548p:plain

青色が優勝した回数,オレンジは決勝に進んだ回数,黄色はベスト 4 ,紫色は決勝トーナメントに進んだ回数です。

 

まず,日本のいる Pool D についてみてみましょう。右の 5 つの国です。

イングランド(ENG)の突破が固いだろうということがわかります。一方で,日本(JPN)とアルゼンチン(ARG)がおよそ半分ずつの確率で突破するようです。すなわち,日本とアルゼンチンの直接対決がかなり重要になってくると考えられます。

大会全体について見ると,南アフリカ(RSA)が優勝大本命のようです。ただし,これは現在のランキングで南アフリカが断トツで一位になっているためであると考えられます。今後のランキングの動向次第でこの数値は大きく変わってくるので,これからのテストマッチにも注目が集まります。

日本はベスト 4 に 20% 程度の確率で進出するようです。ありえない数値ではないですね。前回は南アフリカに阻まれましたが,今回は歴史を作って欲しいと期待しています。

*1:予選形式,グループ分けについては

en.wikipedia.org

を,ランキングについては

www.world.rugby

を参考にしました。

*2:最終予選はケニア [32] (アフリカ予選 2 位),カナダ [23] (アメリカ予選 3 位),ルーマニア [19] (ヨーロッパ予選 3 位),香港 [22] (アジア太平洋プレーオフ敗者)の組み合わせ

*3:www.procrasist.com

を参考にしました。

B リーグプレーオフ予想(3/3 時点)【訂正版】

※この記事は以前投稿した記事の訂正版です。

 

hoshio.hatenablog.com

 

Elo rating を用いた B リーグのチャンピオンシップの結果予想です。 現時点でのレーティング*1を用いて,シーズン終了までの全試合とチャンピオンシップについて, 1000 回シミュレーションを繰り返してどのような結果になるかを調べました。

f:id:hoshiotan:20210307121229p:plain

左から順に,青が優勝,赤が決勝進出の回数,黄色がセミファイナル進出の回数,紫色がプレーオフ進出の回数です。

まずはプレーオフについて。

ほぼ確定:宇都宮・千葉・琉球

圏内:A 東京・川崎・三河・大阪

ボーダー上:SR 渋谷・富山・名古屋D

可能性あり:秋田

というところでしょう。圏内以上のチームが 7 チームあるので,残りの 1 チームをめぐるボーダー上の 3 チームの争いが激しくなることが予想されます。もちろん,圏内のチームからボーダーへと落ちてくるということも考えられます。

 

次は優勝チームについてです。2020-21 シーズンのチャンピオンは,次のようになっているようです。

本命:宇都宮

対抗:千葉

穴:A 東京・川崎・琉球

大穴: SR 渋谷・富山・三河・名古屋 D・大阪

プレーオフの組み合わせがどうなるかが決まらないとなんとも言えないところではありますが,全体としては宇都宮と千葉がかなり優位にあるようです。

B リーグプレーオフ予想(3/3 時点)【削除】

この記事はプログラミングを利用して作成したのですが,チャンピオンシップで次に進出するチームを決める部分のコードに間違いがありました。その結果,実際と異なる予想が出ていました。大変申し訳ございません。この記事中の画像を取り下げたうえで,訂正記事を出させていただきます。

 

訂正版の記事はこちらです。

 

hoshio.hatenablog.com

 

 

Elo rating を用いた B リーグのチャンピオンシップの結果予想です。 現時点でのレーティング*1を用いて,シーズン終了までの全試合とチャンピオンシップについて, 1000 回シミュレーションを繰り返してどのような結果になるかを調べました。

左から順に,青が優勝,赤が決勝進出の回数,黄色がセミファイナル進出の回数,紫色がプレーオフ進出の回数です。

まずはプレーオフについて。

ほぼ確定:宇都宮・千葉・琉球

圏内:A 東京・川崎・三河・大阪

ボーダー上:SR 渋谷・富山・名古屋D

可能性あり:秋田・(島根)

というところでしょう。圏内以上のチームが 7 チームあるので,残りの 1 チームをめぐるボーダー上の 3 チームの争いが激しくなることが予想されます。もちろん,圏内のチームからボーダーへと落ちてくるということも考えられます。

 

次は優勝チームについてです。2020-21 シーズンのチャンピオンは,次のようになっているようです。

本命:宇都宮

対抗:千葉・A 東京・大阪・琉球

穴:SR 渋谷・川崎・富山・三河

大穴:秋田・名古屋 D

プレーオフの組み合わせがどうなるかが決まらないとなんとも言えないところではありますが,全体としては宇都宮がかなり優位にあるようです。

B リーグ結果予想(第 26 節)

バスケットボール B リーグの各チームの Elo rating を計算してみました。*1

f:id:hoshiotan:20210309101930p:plain

Elo rating とは,

  • 2 チームのレーティングの差から,試合で勝つ確率を求められる
  • 試合があるごとに修正され,より正しい値に近づこうとする

というものです。

より詳しくは↓↓↓

 

hoshio.hatenablog.com

この数値を元に,第 26 節の試合の勝率を予想することができます。

北海道 67%-33% 広島

秋田 62%-38% 滋賀

SR渋谷 34%-66% A東京

川崎 85%-15% 新潟

富山 30%-70% 千葉

三河 78%-22% 信州

京都 74%-26% 三遠

大阪 62%-38% 名古屋D

島根 12%-88% 宇都宮

琉球 88%-12% 横浜

 

自分が応援している横浜ビー・コルセアーズは勝率 12% … 2 試合のうち 1 つでも勝てたら御の字というところでしょうか。(もちろんできるのなら 2 つとも勝ってほしいんですけどね。)

*1:初期値は去年の成績(勝数)を参考にし,最大変化値は 30 としました。レーティングの差が 600 で勝率が  \frac{1}{11} になるようなシステムを使っています。

セパの差だけではない,日本シリーズ 4 連敗の原因

昨年の日本シリーズ。始まる前からソフトバンクの有利が予想されていました。自分は「圧倒的な差で優勝した巨人が負けるとセ・リーグの威信が保たれないんじゃないか…」と考え,普段はアンチの巨人を応援していました。結果は(以下自粛)。

 

この記事では,あのような結果になったのは(もちろんセパの差も関係はしていますが)シーズン終盤での調子が対照的だったのが大きい,ということを記していきたいと思います。

 

この記事で使う "Elo rating" というシステムについては,以下のことを知っておいてください。

  • Elo rating を使うと,試合で勝つ確率を大まかに予想できる。レーティングの差が大きければ大きいほど,勝つと予想される確率は大きくなる。
  • 試合があるとレーティングは更新される。負けたチームから勝ったチームにレーティングを渡すような形で更新は行われる。

もっと詳しく知りたい方は↓↓↓

hoshio.hatenablog.com

 

さて,昨年のセ・リーグの各チームの日にちごとの Elo rating の推移をグラフに表すと,次のようになります。*1

f:id:hoshiotan:20210302115811p:plain

巨人が 10 月上旬までレーティングのトップを走り続けていたことがわかります。しかし,シーズンの最後にかけて調子を大きく崩し,最終戦の頃では阪神・中日・広島を下回り,DeNA と競って 4〜5 番目のレーティングになっています。*2

一方で,パ・リーグのレーティングの推移は以下のようになっています。今回は 2 リーグ間で差がないと仮定して,レーティングの初期値はセ・リーグのチームと同じにしました。

f:id:hoshiotan:20210302115053p:plain

9 月〜 10 月上旬まではソフトバンクとロッテが競り合っていましたが,突如としてソフトバンクのレーティングがすごい勢いで上がっていっているのがわかります。

それでは,巨人とソフトバンクのレーティングの推移だけを取り出してみましょう。

f:id:hoshiotan:20210302120035p:plain


10 月上旬まではあまりレーティングは変わりませんが,中旬以降,恐ろしいまでに両チームの調子が対照的になっていることがわかります。結局,最終戦終了時点では,レーティングの差が 251 もついてしまいました。この差は,巨人はソフトバンクと試合をすると 27.6% の確率でしか勝てないと予測できる,ということを意味します。27.6% の確率で勝つチームが日本シリーズで勝てる(= 相手より先に 4 勝できる)確率を計算すると,

9.7%

になります。

これはセ・パの差がないと仮定して話を進めて得られた数値なので,昨年の日本シリーズでは,巨人とソフトバンクのシーズン最終盤での調子の差が結果に大きな影響を及ぼしていたのではないかといえるのではないのでしょうか。(パ・リーグが強い分だけレーティングの初期値を上げると,この差もさらに大きくなり,巨人が日本シリーズで勝つ確率がさらに小さくなったのではないかと考えられます。すなわち,実際には巨人が日本シリーズを制する確率は 9.7% 未満だったということです。)

なお,過去 5 年でセ・リーグ交流戦での勝率が .445 であり,これを Elo rating に直すと,セ・リーグのレーティングの平均はパ・リーグのレーティングの平均より 57 だけ低いということになります。これは両チームのレーティング差 251 に比べるとかなり小さい値になっていることからも,この結論は確認できるのではないかと思います。

*1:最大変化値を 30 としました

*2:レーティングはその時点での実力を表すものなので,今までの総合成績を表す順位とは性質が大きく異なります。

Elo rating の基本

スポーツにおいて,チームがどれくらいの確率で勝つのかを知りたいとき,どうすればよいのでしょうか。

ここでは,Elo rating (イロレーティング)と呼ばれるシステムについて紹介したいと思います。チェスをはじめとして,最近では FIFA のサッカー代表のランキング付けにも使われるようになりました。

1.まとめ

すごく長い記事になったので,はじめにまとめを記しておきます。

  • Elo rating を使うと,試合で勝つ確率を大まかに予想できる。レーティングの差が大きければ大きいほど,勝つと予想される確率は大きくなる。
  • 試合があるとレーティングは更新される。負けたチームから勝ったチームにレーティングを渡すような形で更新は行われる。
  • 番狂わせが起きると渡すレーティングは大きくなり,予想通りの結果だと小さくなる。
  • Elo rating の予想は万能ではない。例えば,試合数が少なかったり,チームに変化があった後だったりすると,予想される確率は正確性を欠くと考えられる。

2. 勝つ確率の(おおまかな)予測

例えば,レーティング 2000 のチーム(X とします)と 1500 のチーム(Y とします)が対戦をするとしましょう。このとき,X が勝つ確率 P_{winX}は次のように求められます。

P_{winX}=\frac{1}{1+10^{-\frac{2000-1500}{600}}} = 0.872

また,Y が勝つ確率 P_{winY}

P_{winY}=\frac{1}{1+10^{-\frac{1500-2000}{600}}} = 0.128

なお,チェスやサッカーでは勝ち負けだけでなく引き分けもあるため,引き分ける確率を P_{drawX}として

 P_{winX}+P_{drawX}\times 0.5=0.872

となります。

それでは,具体的な数式の仕組みを解説していきましょう。

FIFA の使用している Elo rating では,2 チームのレーティングの差を drとして,以下のような式を用いて勝つ確率を予測しています。

 P_{win}=\frac{1}{1+10^{-\frac{dr}{600}}}

この式だけを見てもわからないと思うので,グラフに落としてみます。

f:id:hoshiotan:20210227142205p:plain

レーティングの差と勝率の関係

相手とのレーティングの差が大きければ大きいほど,勝つと予想される確率は上がります。また,そのグラフはシグモイドカーブを描くことがわかります。これが Elo rating の特徴です。

また,相手とレーティングが同じ時(= 差が 0 のとき),実力が同じと考えているので,当然ながら勝つ確率は 0.5 になっています。

3. レーティングの更新

当然のことながら,チームの実力は時によって変化します。ということは,実力を示すレーティングも変動しなければなりません。

Elo rating では,試合の結果に応じてチームのレーティングを変化させることができます。計算式は次のようになります。

 \Delta R=K\times \Bigl(R-P_{win}\Bigr)

  •  \Delta R はレーティングの変化値で,求めたいものです。( \Deltaは「デルタ」と読んで,変化量を表します。)
  •  K はレーティングの最大の変化値で,適当な数を代入します。
  •  R には結果を代入します。勝ち→ 1 ,負け→ 0 ,(引き分け→ 0.5 )です。
  •  P_{win}にはそれぞれのチームが勝つ確率を代入します。

先程の例で,X が Y に勝ったとしましょう。 Kを 30 とすると,試合後のそれぞれのレーティングは以下のようになります。

X:
 \Delta R=30\times(1-0.872)=3.84
よって,試合後のレーティングは 1700+3.84=1703.84

Y:
 \Delta R=30\times(0-0.128)=-3.84
よって,試合後のレーティングは 1500-3.84=1496.16

試合前と比較すると,X のレーティングは増え,Y のレーティングは減りました。X は試合に勝ったので今までより強いと見なされることになりました。

また,X のレーティングの増加分と Y のレーティングの減少分が同じになっていることがわかります。言い換えれば,Y から X に 3.84 だけレーティングを渡したというふうにみなすこともできます。これはこの場合に限らず成立します。すなわち,負けたチームから勝ったチームにレーティングを渡すような形で更新が行われます。

逆に,Y が X に勝ったとしましょう。試合後のそれぞれのレーティングは以下のようになります。

X:
 \Delta R=30\times(0-0.872)=-26.16
よって,試合後のレーティングは 1700-26.16=1673.84

Y:
 \Delta R=30\times(1-0.128)=26.16
よって,試合後のレーティングは 1500+26.16=1526.16

試合前と比較すると,負けた方の X から勝った方の Y へレーティングが 26.16 渡されたことがわかります。

注目すべき点は,Y が X に勝ったときのほうがレーティングの変化が大きくなっていることです。このように,番狂わせが起きるとレーティングの変化は大きくなります。レーティングの低い Y が勝ったということは,それだけ多くレーティングを修正しなければいけないからです。

逆に,レーティングの高いほうが勝ったら,それは想定に近かったということなので,あまり修正は必要ありません。そのため,レーティングの変化は小さくなります。

4. Elo rating の問題点

1 章で「Elo rating を使えば勝敗の確率の予測ができる」と書いたのですが,それがうまくいかない場合があります。

  1. 試合数を多くこなしていないとき

    試合数を多くこなさないと,レーティングが十分に更新されませず,実際の実力を反映することができません。

    先程の例で,仮に X と Y が対戦した時に勝つ勝率がともに 0.5 だとしましょう。試合をするごとにランダムに勝者を決めてレーティングを更新すると,レーティングの推移は以下のようになります。

    f:id:hoshiotan:20210228122556p:plain

    試合数とレーティングの変化

    実際に試合に勝つ確率は 0.5 なので,2 チームのレーティングはおよそ同じ値になるべきです。しかし,はじめのレーティングがかなり異なっていたため,レーティングが等しくなるまでに 60 試合くらいかかっています。すなわち,試合数が少ないとレーティングの初期値の影響を大きく受けてしまい,正しく確率の予測をすることは難しいと考えられます。

  2. チームに変化があったとき

    例えばチームの主力が怪我で離脱して,そのチームが弱くなったとすると,実際のチームの勝つ確率は下がるはずです。また,強い選手を補強すれば,実際のチームの勝つ確率は上がるはずです。
    しかし,Elo rating は試合をしないと変化することはないので,試合前に計算して得られた確率は元のままで,その確率はあまり信用できないことがわかります。
    このように,チームに変化があった直後の Elo rating はあまり正しくない可能性があります。

5.まとめ(再掲)

  • Elo rating を使うと,試合で勝つ確率を大まかに予想できる。レーティングの差が大きければ大きいほど,勝つと予想される確率は大きくなる。
  • 試合があるとレーティングは更新される。負けたチームから勝ったチームにレーティングを渡すような形で更新は行われる。
  • 番狂わせが起きると渡すレーティングは大きくなり,予想通りの結果だと小さくなる。
  • Elo rating の予想は万能ではない。例えば,試合数が少なかったり,チームに変化があった後だったりすると,予想される確率は正確性を欠くと考えられる。

長くなりましたが,最後まで読んでいただきありがとうございました。