株式会社ジャパン・マーケティング・エージェンシー
企画部 大阪事務所 マネージャー 上田 牧人

ベイズの定理


前回までに、ベイズ統計が隠された真の値(母数)を問題とする推計学の仲間であり、伝統的統計より実践的な考え方に立っていることを紹介しました。今日はベイズ統計の核となる「ベイズの定理」について説明します。
今回は数式が出てきます。苦手な方はごめんなさい。でも内容はいたってシンプルです。
事象Aが起こる確率をP(A).gif 、事象Bが起こる確率をP(B).gif とします。
事象Aと事象Bが同時に起こる確率をP(A,B).gif とすると
数式1.gif
となります。ここで P(A|B).gifはBが起こったという条件下でAが起こる確率、 P(B|A).gifはAが起こったという条件下でBが起こる確率で、ともに「条件付確率」と呼ばれるものです。
図で示すと分かりやすいでしょう。①式は左図のようにBの範囲のなかにあるAの確率、②式は、右図のようにAの範囲のなかにあるBの確率ということで、結局同じ領域を指すことが分かりますね。
数式2.gif
となる、この③式が『ベイズの定理』です。
いったい何のこっちゃと言われそうですが、Aを隠された真の値(母数)θ(シータ)、Bを情報として得られたデータDに置き換えると、ある意味合いが見えてきます。
数式4.gif
左辺はデータDが得られたときの母数θの確率分布を表わし、これが【事後確率】になります。
右辺分子のうち、 P(D|θ).gifは母数θのもとでデータDが得られるもっともらしさで、【尤度(ゆうど)】と呼ばれます。
 P(θ).gifは条件付でないθの確率分布で【事前確率】を示します。
 P(D).gifはデータが得られたあとは固定値になるので省略して、ベイズの定理は通常次のように表現されます。
ベイズの定理.gif
こうして、事前確率がデータによって更新されて事後確率になる道筋が示されたわけです。
ただし、話はこれだけではおさまりません。ここからがちょっと大変です。簡単な例えで説明します。
 
事後確率の評価


サイコロで1が出る確率は1/6 と考えるのがふつうでしょう。
ところが、目の前で相手があらかじめ宣言して3回サイコロを振り、3回とも狙いどおりに1が出たとします。
3回とも1が出る尤度1/6の3乗.gifは ととても小さな値になるはずです。ただちにそのサイコロがいかさまだと騒ぎたてるべきでしょうか。そうとは限りません。もしあなたがそのサイコロに100%の信頼を置いていれば、たまたま珍しいことが起こっただけと考えるでしょう。
母数 θ=1/6.gifへの信頼が揺らぐかどうかの判断には、べつのθの可能性も合わせて考慮しなければなりません。
いまθ0=1/6.gif 、それ以外のθをθt と置くと、はじめに100%の信頼があれば、
数式5.gif
結局 θ0.gif以外の可能性がないのでθ0.gifの事後確率は100%と変化がないことになります。
したがって、あなたは次にサイコロを振ったら何が出るか分からないと考えるでしょう。
もし相手がマジシャンで、思いどおりの目を出せるかもと半ば疑っていたとしたらどうでしょう。
数式6.gif
となって、やっぱりこれは手品だと得心し、もう1回振ってもまた1が出るだろうと予想することになります。
なんだかどろどろした展開になってきましたね。
事後確率は事前確率の設定の仕方で変わり、事後確率分布の全体を見ないと更新作業は完結しません。
『事後確率∝尤度×事前確率』の比例定数(上記の分母)も、実際には事後確率分布を評価した後に決まることになります。
この先の道は険しいです。その険しさが長い間一般の人たちからベイズ統計を遠ざけてきました。
近年MCMC法(マルコフチェーン・モンテカルロ法)など技術的なブレークスルーがあり、これを契機にチャレンジャーがどっと増えました。言ってみれば、登山装備の革新があったようなものです。そのあたりは回を改めて述べることにします。
次回はその前に、ベイズの山を登りきったあとに開ける眺望の一端を、具体的な事例を通じて見ておきましょう。