原因の確率(時間的に逆行する条件付き確率)

5回に1回の割合で帽子を忘れる癖のあるK君が,\ 正月にA,\ B,\ C3軒を 順に年始回りをして家に帰ったとき,\ 帽子を忘れてきたことに気付いた.} 2番目の家Bに忘れてきた確率を求めよ.        [早稲田大  原因Aによって結果Bが生じるとする. 結果Bの情報が与えられたとき,\ 原因がAであった確率が次で求まる. {帽子を忘れてきたとき,\ それが家Bであったという条件付き確率}は 事象Aが先に起こり,\ その後事象Bが起こるとする. 先に起こる事象Aの情報は事象Bの確率に影響を与える. このときの条件付き確率は,\ P_A(B)={P(A B)}{P(A)}であった. 逆に,\ {後に起こる事象Bの情報が,\ 先に起こる事象Aの確率に影響を与える.} 直感的には納得しにくいが,\ 次の例を考えると当然であろう. 赤玉2個と白玉5個が入っている袋から1個ずつ3回取り出すとする(戻さない). ここで,\ 2回目と3回目に赤玉が取り出されたという情報を得た. このとき,\ 1回目に赤玉が取り出された確率は?言うまでもなく0である. さて,\ {事象Bの情報を得た上での事象Aの確率は,\ 条件付き確率\ P_B(A)}\ である. これはのAとBを単純に逆にすればよく,\ {P_B(A)={P(B A)}{P(B)\ となる. これで,\ {Bが起こる確率P(B)と,\ BもAも起こる確率P(B A)に帰着}する. 着目すべきは,\ P(B A)は{AとBの時間的順序が関係しない}ことである. P(B A)=P(A B)\ が成り立つからである. 結局,\ どちらが先か後かは重要ではなく,\ 単にP(B)とP(A B)を求めればよい. 「3軒のうちのいずれかの家で帽子を忘れる」という事象をBとする. 今,\ 事象Bについての情報が与えられている. この情報を得た上で,\ 「家B}で忘れる」という事象Aの確率を求める問題である. 公式に当てはめると,\ P_B(A)=(家Bで帽子を忘れる確率)}{(いずれかの家で帽子を忘れる確率)\ である. 帽子を忘れる場合は,\ 「Aで忘れる」「Bで忘れる」「Cで忘れる」}が{排反}である. 「Bで忘れる」確率は,\ 「(Aで忘れない)かつ(Bで忘れる)」として求める. 家A}で忘れてきた確率は 家C}で忘れてきた確率は  単純には,\ 家A,\ B,\ C}のどこで忘れるかは対等で,すべて\ 13\ となるように思える. しかし,\ 家Bで忘れるには,\ 家Aで忘れない}という条件が付く.\ 家C}も同様. よって,\ 3軒は対等ではなく,\ 家A}で忘れてきた確率が最も高くなる. 癌の検査の正確さが98\%だとする.\ つまり,\ 癌にかかっている人がこの 検査を受けた場合に,\ 陽性と出る確率が98\%であり,\ 癌にかかっていな い人が受けた場合には98\%の確率で陰性と出る.\ さらに,\ 実際に癌にか かっている人の割合は0.5\%だとする.\ ある人がこの検査を受けたとこ ろ,\ 結果は陽性であった.\ この人が癌にかかっている確率を求めよ. 癌にかかっている人の結果が陽性となる}確率は 癌にかかっていない人の結果が陽性となる}確率は 結果が陽性であるとき,\ 実際に癌にかかっているという条件付き確率}は 陽性という結果の情報は与えられているが,\ 癌か否かという原因の情報はない. つまり,\ {結果が陽性であるとき,\ その原因が癌である確率を求める}問題である. 公式に当てはめて考えると次にようになる. (癌で陽性となる確率)}{(陽性となる確率)}={(癌で陽性となる確率)}{(癌で陽性となる確率)+(癌でなく陽性となる確率) 癌の人が0.5\%であるから,\ 癌でない人は99.5\%いる. よって,\ 癌で陽性となる確率は,\ 0.5\%の98\%である. また,\ 癌でなく陽性となる確率は,\ 99.5\%の2\%である. 結果を\%で表すと,\ {49}{248}0.198={19.8\%}\ だが,\ 低いと感じる人が多いだろう. 98\%の正確さの検査の実際の確率が約20\%になることは,\ 直感的には不可解である. 納得するために,\ 具体的な人数で考えよう. 10万人いるとき,\ 実際に癌にかかっている人はその0.5\%,\ つまり500人である. 逆に,\ 残りの99500人は癌にかかっていない人である. 癌にかかっている500人を検査すると,\ 98\%の確率で陽性となる. よって,\ 500人の内,\ 490人(98\%)が陽性,\ 残りの10人(2\%)は陰性となる. 一方,\ 癌にかかっていない99500人を検査すると,\ 2\%の確率で陽性となる. よって,\ 99500人の内,\ 1990人(2\%)が陽性,\ 残りの97510人(98\%)は陰性となる. ゆえに,\ 結果が陽性となる人は,\ 全部で\ 490+1990=2480人\ いるのである. この2480人中,\ 実際に癌である人が490人なので,\ 確率は\ {490}{2480}={49}{248}\ となる. さらに,\ この人が{もう一度同じ検査を受け,\ 再び結果が陽性}であったとする. このとき,\ この人が実際に癌である確率は次となる. これは,\ {再検査・精密検査の重要性}を物語っている.
タイトルとURLをコピーしました