仮説検定と反復試行の確率

スポンサーリンク

当ページの内容は2022年新高校1年生から始まった新課程用です。

ある企業が新製品を開発し, 無作為に選ばれた20人に旧製品とどちらを好むかを調査 したところ,\ 14人が「新製品を好む」と回答した.\ \ (1)と(2)のそれぞれの場合におい て,\ 一般に新製品が好まれると判断してよいか.\ なお,\ 以下の表は, 公正な硬貨20枚を 同時に投げて表が出た枚数を記録することを200回行った結果である. 有意水準を0.05とする.      (2)\ \ 有意水準を0.01とする. \\  まずは感覚的に判断してみてほしい.  仮に20人全員が新製品と回答したなら,\ 当然一般にも新製品が好まれると判断するだろう.  では,\ 新製品と回答したのが20人中11人だった場合はどうだろうか.  「これは誤差の範囲で新製品が好まれるとはいえない」と思うのが普通ではないだろうか.  一方,\ 本問のように,\ 20人中14人となると感覚的に判断するのが難しくなる.  以下で,\ 得られたデータが偶然(誤差の範囲)か必然かを統計的に判断する方法を示す.  仮説検定 得られたデータを元に仮説を立て,\ それの妥当性を判定する統計的手法  有意水準 ある出来事が起こる確率が偶然とは考えにくいと判断する基準となる確率       普通0.05とし,\ 慎重を期したい場合には0.01とすることが多い. \\  仮説検定の手順 (仮説:hypothesis)  統計的に正しいか否かを判断したい仮説H$_1}$\,(対立仮説)を立てる. 仮説H$_1}$を否定する仮説H$_0}$\,(帰無仮説)を立てる.  \ [3]\ \ 有意水準をあらかじめ定め,\ 仮説H$_0}$の元で得られたデータが起こる確率$p}$を求める. 確率pが有意水準より小さい\ \ →\ \ 仮説H}_0を棄却し,\ 仮説H}_1が妥当と判断する. 確率pが有意水準以上   \ \,→\ \ 仮説H}_0は棄却されない(結論を保留).仮説H$_1$を「一般に新製品が好まれる」}とする. {仮説H$_0$を「一般に新製品が好まれるとはいえず,\ 等確率で一方が選ばれる」}とする.   仮説H$_0$の元で14人以上が「新製品を好む」と回答するおおよその確率}は,   硬貨投げの試行結果より 仮説H$_0$を棄却し},\ 仮説H$_1}$が正しいと判断してよい.}仮説H$_0$は棄却されず},\ 仮説H$_1}$が正しいとは判断できない.} 対立仮説は,\ 基本的には「差がある」という内容の主張}になる. 本問の場合,\ 「新製品と旧製品には差がある」という主張が正しいか否かを判断したい. しかし,\ 差があることを直接的に示すのは難しい. そこで,\ 差がない(偶然)と仮定し(帰無仮説),\ そのもとで得られたデータが起こる確率pを求める.} 確率pが十分に小さければ,\,差がない(偶然)と考えるのは不自然で,\,差がある(必然)と判断できる.} これは,\ 帰無仮説を棄却し,\ 対立仮説を採択することを意味する. 確率pが大きければ,\ 偶然に起こる可能性を否定できない}ことになる. これは,\ 帰無仮説が棄却されないことを意味する. このとき,\ 棄却されないことが帰無仮説が正しいことをも意味するわけではない}ことに注意する. 偶然に起こる可能性を否定できないだけで,\ 偶然であると断定することはできないわけである. 結局,\ 「対立仮説と帰無仮説のどちらが正しいかはわからない」が最終結論}となる. どれくらいの確率で偶然ではないと判断するかの基準が有意水準であり,\ 先に決めておく必要がある. データを見た後で決めると都合よく操作できてしまうからである. 慣例的に有意水準(統計的に意味が有る差の基準)を0.05や0.01とするが,\ 合理的な理由はない. 本問のように,\ 度数分布表が与えられている場合,\ 相対度数を求めるとおおよその確率がわかる.} 有意水準は上端(または下端)から確率の和}なので,\ 14人\dot{以}\dot{上}の確率}を求めて比較する. 次問のように,\ 度数分布表が与えられていない場合,\ 数 A:確率の知識を用いて計算することになる. (1)\ \ 確率が5\%より小さければ,\ 偶然とは考えにくい珍しいことが起こったと判断する. \ \ 帰無仮説のもとで得られたデータが起こる確率は4\%なので,\ 珍しいことが起こったことになる. \ \ これが実際に起こったと考えるのは不自然なので,\ 帰無仮説を棄却し,\ 対立仮説を採択する. \ \ つまり,\ 「一般に新製品が好まれる」と判断してよい. (2)\ \ 確率が1\%より小さければ,\ 偶然とは考えにくい珍しいことが起こったと判断する. \ \ 帰無仮説のもとで得られたデータが起こる確率は4\%であり,\ これは別に珍しいことではない. \ \ 普通に起こりえることなので,\ 帰無仮説が間違いとは言い切れない(棄却されない). \ \ つまり,\ 十分な証拠がなく,\ 「一般に新製品が好まれる」とは判断できない. \ \ $「新製品が好まれない」と判断できるわけではなく,\ どちらが正しいかはわからないが結論}である.$ 参考までに,\ 仮説検定の際に犯す可能性がある2種類の判断の誤り}をまとめると以下となる. 実際は> & 帰無仮説が正しい & \ 帰無仮説は誤り\ 帰無仮説を棄却する  & 第一種の過誤} & 正しい判断 帰無仮説を棄却しない & 正しい判断 & 第二種の過誤} (1)では,\ 4\%の確率の偶然が実際に起こったと考えるのは不自然として帰無仮説を棄却した. しかし,\ 今回その4\%の確率の偶然が実際に起こってしまった可能性もないとはいえない. この場合,\ 実際には帰無仮説が正しいにもかかわらず,\ 棄却してしまったことになる(第一種の過誤). 有意水準5\%では,\ 5\%未満の確率の偶然が実際に起こってしまうとこの誤りを犯す危険がある. このため,\ 有意水準のことを危険率}ともいう. 第一種の過誤を犯したくないならば,\ (2)のように有意水準をより小さく設定して検定すればよい. このとき,\ 第一種の過誤の危険性は減る一方で,\ 「結論を保留」という結果になる可能性が高くなる. すると,\,実際には帰無仮説が誤りであるのに棄却されない(第二種の過誤)が起こる可能性も高くなる. このように,\ 2つの過誤はトレードオフの関係にあり,\ 両方の確率を小さくすることはできない. あるゲームを1回行うとき,\ 成功する確率は,\ 今までは$13$であった. 対策を行った後, 5回中何回成功すると対策の効果があったと判断してよいか.\ 有意水準を0.05として 考察せよ. (数A:確率) \\ 仮説H$_1$を「対策の効果があった」}とする.   仮説H$_0$を「対策の効果はなく,\ 成功する確率は$13$のままである」}とする.{仮説H$_0$のもとで,\ 5回中4回以上成功する確率}は   仮説H$_0$のもとで,\ 5回中3回以上成功する確率}は   4回以上成功するとき,\ 仮説H$_0}$は棄却され,\ 仮説H$_1}$が正しいと判断してよい.} 帰無仮説 H_0が棄却できれば,\ 対策の効果があったと判断してよい. 有意水準は0.05であるから,\ 帰無仮説のもとで求めた確率が0.05よりも小さくなればよい.} つまり,\ 5回中何回\dot{以}\dot{上}成功すると確率が0.05よりも小さくなるか}を考えることに帰着する. 計算すると,\ 3回以上と4回以上を境目に確率が0.05よりも小さくなるとわかる. 同じ条件での独立な試行の繰り返しであるから,\ 求めるのは反復試行の確率}である.  1回の試行で事象Aの起こる確率をpとする.  この試行をn回繰り返すとき,\ 事象Aがr回起こる確率は C nrp^r(1-p)^{n-r