(2)の問題 ×「男子あった」 ○「男子であった」
男女合計40人の生徒に理系か文系かを尋ねたところ,\ 下表のようになった.
\ \ (1)\ \ 40人から無作為に1人選ぶとき,\ その人が理系の男子である確率を求めよ.
\ \ (2)\ \ 40人から無作為に1人選んだとき,\ その人は男子あった.\ この人が理系である
確率を求めよ. \条件付き確率と確率の乗法定理 \\
\象$A}$が起こったときに事象$B}$が起こる確率条件付き確率)をP_A(B)}$で表す.
$n(A)≠0,\ P(A)≠0$のとき{P_A(B)=n(A∩ B)}{n(A)}=P(A∩ B)}{P(A)確率の乗法定理P(A∩ B)=P(A)P_A(B)=P(B)P_B(A)$\
$「男子」という事象をA,\ 「理系」という事象をBとする.$
条件付き確率を理解する上で最も重要なのは,\ 普通の確率と条件付き確率の違い}である.
結論から言えば,\ (1)はP(A∩ B)}\ (普通の確率),\ (2)はP_A(B)}\ (条件付き確率)\ である.
この2つの違いをはどこにあるだろうか.
確率は,\ 基本的には未来予想}である.
まだ何も試行していない段階で,\ 今後もし試行したとしたら何が起こるのかを割合で表す}のである.
すでにくじを引き終わってハズレがわかった後で「当たる確率は・・・」などと考えても意味がない.
普通の確率の問題文は,\ 「くじを\dot{引}\dot{く}とき」のように未来形で書いてあるはずである.
くじはこれから引くのであって,\ 「くじを\dot{引}\dot{い}\dot{た}とき」を考えているわけではない.
実際の試験の問題文は時制が適当なこともあるので,\ その場合は解答者が題意を汲み取る必要がある.
(1)は,\ まだ選んでいない段階で,\ 今後もし1人選んだとして,\ その人が理系男子である確率}である.
40人の中から1人選ぶのであるから,\ 全体40人中の「男子かつ理系」の割合}を求めることになる.
一方で,\ 「条件付き確率」はすでに試行し終えて情報を得た段階での確率}である.
(2)は,\ すでに選び終わって男子という情報を得た段階で,\ その男子が理系である確率}である.
この場合,\ 男子22人中の「理系」の割合}を求めることになる.
すでに男子であることは確定しているので,\ もはや女子について考慮する必要はない.
P(A∩ B)とP_A(B)の違いは,\ ベン図ならば一目瞭然である.
どちらも赤色の部分が対象}であることに変わりはないが,\ 何を全事象とするか}が異なる.
P(A∩ B)の全事象はU,\ P_A(B)の全事象はA}である.
結局,\ P(A∩ B)とP_A(B)は,\ 分子は同じだが,\ 分母が異なる}のである.
事象Aが起こったという情報を得ると全事象が事象Aに縮む}のが条件付き確率の考え方である.
確率は,\ 情報を得るたびに更新される}ものなのである.
本問の場合,\ 男子という情報を得る前は,\ 理系男子である確率は\,14}{40}=35\%\,であった.
男子という情報を得たことにより,\ 理系男子である確率が\,14}{22}≒64\%\,に更新されたわけである.
条件付き確率は,\ 本問のように要素数がわかる場合は,\ 単に要素数の比で求められる.
これは,\ 確率の比}に変換することができ,\ 実戦では確率の比でP_A(B)を機械的に求めることが多い.
P_A(B)=n(A∩ B)}{n(A)}=n(A∩ B)}{n(U){n(A)}{n(U)=P(A∩ B)}{P(A)=(AかつBが起こる確率)}{(Aが起こる確率)
確率の乗法定理は,\ 条件付き確率P_A(B)の定義式の分母をはらっただけである.
実は,\ 本項以前にすでに確率の乗法定理を秘かに使ってきていたのだが,\ 深入りはしなかった.
以下の問題で,\ 今まで何となく使ってきていたこの定理を完全に理解してほしい.
特に,\ 独立試行の乗法定理P(A∩ B)=P(A)P(B)との違いを理解することが重要である.
それぞれ1から5までの数字が書かれた5個の玉が入った袋から,\ 1個ずつ順に玉を
取り出す.\ ただし,\ 一度取り出した玉は元に戻さない.
(1)\ \ 1個目の数字が奇数であったとき,\ 2個目の数字が奇数である確率を求めよ.
(2)\ \ 1個目の数字も2個目の数字も奇数である確率を求めよ.
(3)\ \ 2個目の数字が奇数である確率を求めよ.
(4)\ \ 2個目の数字が奇数であったとき,\ 1個目の数字が奇数である確率を求めよ.
(5)\ \ 1個目の数字よりも2個目の数字が大きかったとき,\ 2個目の数字が奇数で
ある確率を求めよ. \
「\,1個目が奇数」という事象を$A$,\ \ 「\,2個目が奇数」という事象を$B$とする.
1個取り出して奇数の玉とわかった時点で,\ 2個目も奇数の玉である条件付き確率}である.
袋の中に残っている4個の玉のうち奇数の玉は2個であるから,\ 24\,となる.
P_A(B)が直接的かつ容易に求まる場合,\ わざわざ確率の比\,P(A∩ B)}{P(A)}\,を持ち出す必要はない.}
今まで,\ (2回試行したときの確率)=(1回目の確率)×(2回目の確率)\ ・・・\,①を普通に使ってきた.
しかし,\ 実は①はやや不正確であり,\ 正確には1回目と2回目の試行が独立か否かで話が変わる.
もし本問が復元抽出}(取り出した玉を元に戻す)だったならば,\ 1回目と2回目の試行は独立}である.
このとき,\ 何回目でも奇数の玉を取り出す確率は\,35\,なので,\ P(A∩ B)=35×35=9}{25}\,となる.
これが,\ 独立試行の乗法定理\ P(A∩ B)=P(A)P(B)}\ であった.
実際には,\ 本問は非復元抽出}であるから,\ 1回目と2回目の試行は独立ではない.}
この場合,\ 確率の乗法定理\ P(A∩ B)=P(A)P_A(B)}\ を計算しなければならない.
実は,\ 今まで深く考えずに立式してきた\,35×24\,がまさにP(A)P_A(B)である.
24\,の意味を改めて考えてみてほしい.\ これは,\ まだ何もやっていない段階での確率P(B)ではない.
すでに1個目が奇数の玉と分かった段階での条件付き確率P_A(B)である.
1回目と2回目の試行が独立でない場合の①は,\ 正確には次であったというわけである.
(2回試行したときの確率)=(1回目の確率)×(1回目終了時点での2回目の条件付き確率)}
今後は,\ 何となくではなく式の意味合いをしっかり把握した上で計算してほしい.
1回目と2回目が独立ならば,\ P_A(B)=P(B)が成り立つ.
よって,\ 独立試行のP(A∩ B)=P(A)P(B)は,\ P(A∩ B)=P(A)P_A(B)の特殊な場合とみなせる.
本筋からは外れるが,\ 場合の数の比で求める別解も示しておいた.
2個目の数字は5通りが同様に確からしい}から $P(B)=35}$
(1個目,\ 2個目)=(奇数,\ 奇数),\ (偶数,\ 奇数)の2パターンがあり,\ 互いに排反である.
普通に\,35・12+25・34\,と立式できるかもしれないが,\ その意味合いを正確に把握しているだろうか.
.4zw}(1個目奇数の確率)×(1個目奇数がわかった時点での2個目奇数の条件付き確率)}
+\,(1個目偶数の確率)×(1個目偶数がわかった時点での2個目奇数の条件付き確率)}
実は,\ 2個目だけに着目して全事象をとる}と瞬殺できる(別解).
求めるのは,\ まだ何もやっていない時点での確率P(B)である.
この時点では,\ 2回目に何を取り出すかは同様に確からしいはずである.
求めるのは,\ 2個目奇数がわかった時点での1個目奇数の条件付き確率P_B(A)}である.
初学者は時間的逆行に困惑し,\ 題意の理解すら難しいことだろう.
確率を考える上で真に重要なのは,\ 行動したか否かではなく情報を得たか否か}である.
球を取り出しても情報を得ていなければ,\ 確率を考える上では何もしていないのと同じである.
本問の場合,\ 1個目は玉を取り出しただけで数字は見ていない.
そして2個目を取り出し,\ 数字を見て奇数という情報を得た.
2個目が奇数であったという情報を得た時点で,\ 1個目が奇数であった割合を求める}のが本問である.
初学者は,\ 1個目が奇数の確率は「\,2個目は関係ないから\,35\,のはずだ」と考えるかもしれない.
しかし,\ 2個目の情報の有無で1個目奇数の確率が変わる}とするのが条件付き確率の考え方である.
時間的に後に得た情報が先の確率に影響することの納得は,\ 意外にもそこまで難しいことではない.
例えば,\ 本問が「\,2個目の数字が1であったとき,\ 1個目の数字が1である確率」であったとしよう.
2個目の数字が1とわかってもなお,\ 1個目の数字が1である確率が\,15\,だと思えるだろうか.
どう考えても,\ 1個目の数字が1である確率は0であろう.
結局,\ 時間的順序によらず,\ 情報を得たか否かによって確率は変動する}わけである.
P_B(A)のように直接的に求めることが難しい条件付き確率は,\ 定義に従って求める}ことになる.
2個目の情報を得る前は,\ 1個目が奇数である確率は\,35=60\%\,であった.
「\,2個目が奇数」という情報により,\ 1個目が奇数の確率が\,12=50\%に更新された}のである.
仮に1個目が奇数であった場合,\ 2個目に奇数が出にくくなる.
2個目に奇数が出たのならば,\ その分1個目が奇数であった確率は小さくなって当然という話である.
(5)\ \ 「\,1個目の数字よりも2個目の数字が大きくなる」という事象を$C$とする
一見すると,\ (1)のように2個目の数字だけに着目してP_C(B)を求めることができそうな気がする.
しかし,\ 「\,2個目は2,\ 3,\ 4,\ 5の4通り,\ このうち奇数は2通りなので\,24\,」は誤り}である.
誤りの理由は後回しにして,\ とりあえず場合の数の比としてP_C(B)を求める. (1個目,\ 2個目)
C=\{(1,\ 2),\ (1,\ 3),\ (2,\ 3),\ (1,\ 4),\ (2,\ 4),\ (3,\ 4),\ (1,\ 5),\ (2,\ 5),\ (3,\ 5),\ (4,\ 5)\} (10通り)
C∩ B=\{(1,\ 3),\ (2,\ 3),\ (1,\ 5),\ (2,\ 5),\ (3,\ 5),\ (4,\ 5)\} (6通り)
n(C)を求めるだけならば\,C52=10とすると早い(2個選べば,\ 2個目が大きくなる並べ方は1通り).
誤りの理由は,\ 2個目の2,\ 3,\ 4,\ 5の4通りが同様に確からしくない}からである.
実際,\ Cの10通りのうち2個目が2,\ 3,\ 4,\ 5であるのは,\ それぞれ1,\ 2,\ 3,\ 4通りずつある.