完全な履歴が与えられた場合にスポーツの試合に勝つチームのオッズを計算するアルゴリズム

debugcn 投稿 Dev

ジョン・シェドレツキー

仮定：

チームは決して変わらない
チームのスキルは向上しません
他のチームのサブセットに対する各チームのパフォーマンスの全履歴がわかっています
チーム間でプレイされるゲームの数は多いですが、潜在的にまばらです（各チームはお互いにプレイしていません）

例えば：

私は次のような試合結果の長いリストを持っています：

Team A beats Team B
Team B beats Team A
Team A beats Team B
Team C beats Team A
Team A beats Team C

問題：

他のチームを打ち負かすチームの正しい賭けのオッズを予測します。

上記の例では、AがBに66％の確率で勝つべきであると結論付けるかもしれません。これは直接観察に基づいており、非常に簡単です。ただし、CがBを打ち負かす確率を見つけるのは難しいようです。彼らは一緒にプレイしたことはありませんが、C> Bである可能性が最も高く、自信はありません。

私が行った調査：

チェスのEloおよびGlickoレーティングシステムなど、スキルゲームのさまざまなランキングシステムについてかなり読んだことがあります。これらは、関係する確率分布について仮定を立てているため、不十分です。たとえば、Eloの中心的な仮定は、各ゲームの各プレーヤーのチェスのパフォーマンスは正規分布の確率変数であるというものでした。ただし、ウィキペディアによると、既存のデータによりよく適合する他の分布があります。

配布を想定したくありません。10,000以上の一致結果が手元にあるので、証拠から分布を推測するか（これを行う方法がわかりません）、または気にしない何らかの強化学習スキームを使用できるはずです。分布は何ですか。

ジュリアン

確率（または複数の確率）の最良の推定を行い、より多くのデータが利用可能になったときに推定を継続的に更新する必要があります。それはベイズ推定を必要とします！ベイズ推論は、AとBの2つの事柄が同時に発生する確率（分布）が、Bがケースに確率を掛けた場合のAの確率（分布）に等しいという観察に基づいています。そのBが当てはまります。数式形式：

P（A、B）= P（A | B）P（B）

そしてまた

P（A、B）= P（B | A）P（A）

それゆえ

P（A | B）P（B）= P（B | A）P（A）

P（B）を反対側に移動すると、ベイジアン更新ルールが得られます。

P（A | B） '= P（B | A）P（A）/ P（B）

通常、Aは推定しようとしている変数（「チームxがチームyを打ち負かす」など）を表し、Bは観測値（たとえば、チーム間で勝ち負けた試合の完全な履歴）を表します。方程式の左辺があなたの信念の更新を表すことを示すために、素数（つまり、P（A | B） 'の引用）を書きました。それを具体化するために、あなたの新しいチームxはチームyを打つする確率の推定値は、これまでのすべての観測与えられ、それらの観測を行うための確率で、あなたの前の見積もり与え、時間があなたの前の推定値を、観察した観測値を見る全体的な確率で割ったものです（つまり、チーム間の相対的な強さについての仮定はありません。ほとんどの場合、一方のチームが勝つ可能性は、両方のチームがほぼ同じ頻度で勝つ可能性が低くなります）。

現在の更新の左側のP（A | B） 'は、次の更新の右側の新しいP（A）になります。より多くのデータが入ってくるので、これを繰り返し続けます。通常、可能な限り偏りを持たないようにするために、P（A）の完全に平坦な分布から始めます。時間の経過とともに、P（A）はますます確実になりますが、アルゴリズムは、推定しようとしている基礎となる確率の突然の変化にかなりうまく対処できます（たとえば、新しいプレーヤーが参加したためにチームxが突然強くなった場合）チーム）。

幸いなことに、ベイジアン推論は、ElKaminaも言及したベータ分布でうまく機能します。実際、この2つは、確率分布を学習することを目的とした人工知能システムで組み合わされることがよくあります。ベータ分布自体はまだ想定されていますが、さまざまな形（完全に平坦で非常にスパイク状を含む）をとることができるという利点があるため、分布の選択が結果に影響を与える可能性があることを心配する理由は比較的少ないです。

悪いニュースの1つは、ベータ分布とは別に、まだ仮定を立てる必要があるということです。たとえば、次の変数があるとします。

A：チームxがチームyを打ち負かす

B：チームyがチームzを打ち負かす

C：チームxがチームzを打ち負かす

また、xとyの間の直接一致、およびyとzの間の一致からの観測値がありますが、xとzの間の一致からの観測値はありません。P（C）を推定する簡単な（ただし単純な）方法は、推移性を仮定することです。

P（C）= P（A）P（B）

アプローチがどれほど洗練されていても、データの相互依存性だけでなく、ギャップに対処するために、ある種の確率の構造を定義する必要があります。どのような構造を選択しても、それは常に前提となります。

もう1つの悪いニュースは、このアプローチが非常に複雑であり、問題にどのように適用するかについて完全に説明できないことです。相互依存確率の構造（チームx、y、zを含む他の分布でチームxがチームyを破る確率）が必要な場合は、ベイジアンネットワークまたは関連する分析（マルコフ確率場や経路分析など）を使用できます。）。

これがお役に立てば幸いです。いずれにせよ、説明を求めてください。

この記事はインターネットから収集されたものであり、転載の際にはソースを示してください。

侵害の場合は、連絡してください[email protected]

編集2021-05-27

コメントを追加

サインイン

分類Dev

Related 関連記事

記事

完全な履歴が与えられた場合にスポーツの試合に勝つチームのオッズを計算するアルゴリズム

完全な履歴が与えられた場合にスポーツの試合に勝つチームのオッズを計算するアルゴリズム

時間計算量O（n ^ 2）のアルゴリズムが与えられた場合、入力nを3倍にするとどうなりますか？

ソートされた配列の部分的に絶対合計の中央値を計算するための効率的なアルゴリズム

変数に応じてチームが勝つ確率を計算するアルゴリズムを設計する

合計が値になる5つの要素の配列を検索するためのアルゴリズム

アルゴリズムがスタックを使用して正確な合計を持つサブセットを見つけられない場合、ターゲットに最も近い値を持つサブセットを見つける

2部グラフが与えられたときにフィボナッチヒープまたはバイナリヒープを使用するプリムアルゴリズムの時間計算量

ジュリア：反復可能な `itr`が与えられた場合、` itr`の上位の `n`値のインデックスを取得するための効率的なデータ構造とアルゴリズムはありますか？

すべてのパス合計を見つけるためのこのアルゴリズムの時間計算量はどれくらいですか？

二分木で与えられた合計ですべてのパスを印刷するアルゴリズム

アルゴリズム：トーナメントに勝つチャンスがなくなったプレイヤーを排除する

キースペースに2つの要素しかない場合、最も安定した並べ替えアルゴリズムは何ですか

二分木が与えられた場合、各深さのすべてのノードのリンクリストを作成するアルゴリズムを設計します

可能なすべてのパスを計算するために、オプションのノードと代替ノードを使用してツリーを歩くアルゴリズムが必要です

アルゴリズムが派生クラスの知識を必要とする場合のデータからのアルゴリズムの分離

円をポリゴンに結合するためのアルゴリズム

どの値が配列から指定された数値の合計になるかを取得するアルゴリズム

遺伝的アルゴリズムに部分的に一致したクロスオーバーを使用する場合の重複の処理

与えられたグラフ上の2つのノード間の最短経路の数を計算するO（E + V）アルゴリズム

昇順でソートされたintの配列が与えられた場合、すべての重複をback.exにプッシュするアルゴリズムを記述します。ex[1,2,2,4,5,5]は[1,2,4,5,2,5]になります。

最大合計値まで適合するように繰り返し可能な値のセットを見つけるためのアルゴリズム

実行履歴によって、与えられた命令でオペランドスタックサイズが異なる場合がありますか？

2つのポーズが与えられた場合、どのようにホモグラフィを計算しますか？

与えられた最小値でフィボナッチツリーを構築するアルゴリズム

アルゴリズムが見つからない場合にnullではなくconsole.logを出力する

Kセットのポイントが与えられた場合、選択したポイント間のペアワイズ距離の合計が最小になるように、各セットから1つのポイントを選択します。

考えられるすべてのシナリオの可能性を計算するための柔軟なアルゴリズム

すべての組み合わせを見つけるためのこのアルゴリズムの時間計算量はどれくらいですか？

ズームする場合にスケールと変換のために計算する変換値

アルゴリズム-要素の合計が0以上になるように配列の開始インデックスを見つける