仮定:
例えば:
私は次のような試合結果の長いリストを持っています:
Team A beats Team B
Team B beats Team A
Team A beats Team B
Team C beats Team A
Team A beats Team C
問題:
他のチームを打ち負かすチームの正しい賭けのオッズを予測します。
上記の例では、AがBに66%の確率で勝つべきであると結論付けるかもしれません。これは直接観察に基づいており、非常に簡単です。ただし、CがBを打ち負かす確率を見つけるのは難しいようです。彼らは一緒にプレイしたことはありませんが、C> Bである可能性が最も高く、自信はありません。
私が行った調査:
チェスのEloおよびGlickoレーティングシステムなど、スキルゲームのさまざまなランキングシステムについてかなり読んだことがあります。これらは、関係する確率分布について仮定を立てているため、不十分です。たとえば、Eloの中心的な仮定は、各ゲームの各プレーヤーのチェスのパフォーマンスは正規分布の確率変数であるというものでした。ただし、ウィキペディアによると、既存のデータによりよく適合する他の分布があります。
配布を想定したくありません。10,000以上の一致結果が手元にあるので、証拠から分布を推測するか(これを行う方法がわかりません)、または気にしない何らかの強化学習スキームを使用できるはずです。分布は何ですか。
確率(または複数の確率)の最良の推定を行い、より多くのデータが利用可能になったときに推定を継続的に更新する必要があります。それはベイズ推定を必要とします!ベイズ推論は、AとBの2つの事柄が同時に発生する確率(分布)が、Bがケースに確率を掛けた場合のAの確率(分布)に等しいという観察に基づいています。そのBが当てはまります。数式形式:
P(A、B)= P(A | B)P(B)
そしてまた
P(A、B)= P(B | A)P(A)
それゆえ
P(A | B)P(B)= P(B | A)P(A)
P(B)を反対側に移動すると、ベイジアン更新ルールが得られます。
P(A | B) '= P(B | A)P(A)/ P(B)
通常、Aは推定しようとしている変数(「チームxがチームyを打ち負かす」など)を表し、Bは観測値(たとえば、チーム間で勝ち負けた試合の完全な履歴)を表します。方程式の左辺があなたの信念の更新を表すことを示すために、素数(つまり、P(A | B) 'の引用)を書きました。それを具体化するために、あなたの新しいチームxはチームyを打つする確率の推定値は、これまでのすべての観測与えられ、それらの観測を行うための確率で、あなたの前の見積もり与え、時間があなたの前の 推定値を、観察した観測値を見る全体的な確率で割ったものです(つまり、チーム間の相対的な強さについての仮定はありません。ほとんどの場合、一方のチームが勝つ可能性は、両方のチームがほぼ同じ頻度で勝つ可能性が低くなります)。
現在の更新の左側のP(A | B) 'は、次の更新の右側の新しいP(A)になります。より多くのデータが入ってくるので、これを繰り返し続けます。通常、可能な限り偏りを持たないようにするために、P(A)の完全に平坦な分布から始めます。時間の経過とともに、P(A)はますます確実になりますが、アルゴリズムは、推定しようとしている基礎となる確率の突然の変化にかなりうまく対処できます(たとえば、新しいプレーヤーが参加したためにチームxが突然強くなった場合)チーム)。
幸いなことに、ベイジアン推論は、ElKaminaも言及したベータ分布でうまく機能します。実際、この2つは、確率分布を学習することを目的とした人工知能システムで組み合わされることがよくあります。ベータ分布自体はまだ想定されていますが、さまざまな形(完全に平坦で非常にスパイク状を含む)をとることができるという利点があるため、分布の選択が結果に影響を与える可能性があることを心配する理由は比較的少ないです。
悪いニュースの1つは、ベータ分布とは別に、まだ仮定を立てる必要があるということです。たとえば、次の変数があるとします。
A:チームxがチームyを打ち負かす
B:チームyがチームzを打ち負かす
C:チームxがチームzを打ち負かす
また、xとyの間の直接一致、およびyとzの間の一致からの観測値がありますが、xとzの間の一致からの観測値はありません。P(C)を推定する簡単な(ただし単純な)方法は、推移性を仮定することです。
P(C)= P(A)P(B)
アプローチがどれほど洗練されていても、データの相互依存性だけでなく、ギャップに対処するために、ある種の確率の構造を定義する必要があります。どのような構造を選択しても、それは常に前提となります。
もう1つの悪いニュースは、このアプローチが非常に複雑であり、問題にどのように適用するかについて完全に説明できないことです。相互依存確率の構造(チームx、y、zを含む他の分布でチームxがチームyを破る確率)が必要な場合は、ベイジアンネットワークまたは関連する分析(マルコフ確率場や経路分析など)を使用できます。)。
これがお役に立てば幸いです。いずれにせよ、説明を求めてください。
この記事はインターネットから収集されたものであり、転載の際にはソースを示してください。
侵害の場合は、連絡してください[email protected]
コメントを追加