離散型確率変数と連続型確率変数
これまでに扱ってきた飛び飛びの値をとる確率変数を離散型確率変数}という.
例えば,\ サイコロの出目は1から6までの整数値のみをとるから,\ 離散型確率変数である.
一方,\ 身長など実数のある区間の連続的な値をとる確率変数を連続型確率変数}という.
この連続型確率変数の取り扱いが「確率分布と統計的な推測」分野の主題である.
相対度数のヒストグラムの一般化
ある高校の生徒100人の身長X\,[cm]を調べ,\ 下左の相対度数分布表が得られたとする.
これに対し,\ 長方形全体の面積が1となるようにヒストグラムを作ると下右図となる. このとき,\ 各長方形の面積が相対度数,\ つまりは$X}$の値が各階級に属する確率と一致する.
例えば,\ $150≦ X<170$となる確率は,\ $0.25+0.40=0.65$である.
以上のような考え方により,\ 確率を面積としてとらえることが可能になる.
さて,\ 階級の幅を小さくしていくと,\ ヒストグラムはある曲線$y=f(x)$に近づいていく.
このとき,\ 長方形の面積を$y=f(x)とx軸間の面積}$で近似できる.
上図では,\ 緑の長方形の面積の和と色塗り部分の面積の間にはまだわずかに誤差がある.
しかし,\ この誤差は,\ 階級の幅を限りなく小さくしていくことによってほぼ0にできる.
これは区分求積法(数III:積分法)の考え方であり,\ 積分するということに他ならない.
結局,\ 連続型確率変数がある範囲の値をとる確率は,\ $y=f(x)}$を積分して求められる.
(幅を限りなく小さくした長方形の面積の和)}=連続型確率変数の性質
連続型確率変数$X\ (α≦ X≦β)$に対し,\ 以下の性質をもつ1つの関数$f(x)$が対応する.
[1]\ \ 常に\ \ $f(x)≧0}$
[2]\ \ 確率$P(a≦ X≦ b)$は,\ $y=f(x)$と$x$軸および
[1]}\ \ $x=a,\ x=b$で囲まれた部分の面積に等しい.
(全面積)=1}$ \\
この関数$f(x)$をXの確率密度関数,\ \ $y=f(x)$のグラフをXの分布曲線という. \\
P(X=a)=0\ (Xが特定の値をとる確率が0)は,\ 直感的には以下のように理解できる.
Xを生徒の身長\,[cm]}\,とすると,\ 例えばP(X=170)=0となる.
これは,\ ピッタリ170.0000・・・\,cm}の人が存在する確率が0であることを意味している.
連続型確率変数の平均・分散・標準偏差
$α≦ X≦ β$の範囲にある連続型確率変数Xの確率密度関数が$f(x)$であるとき
平均 $E(X)=m=∫{α}{β}xf(x)\,dx$
分散 $V(X)=∫{α}{β}(x-m)^2f(x)\,dx=E(X^2)-\{E(X)\}^2$
標準偏差 $σ(X)=√{V(X)$ \\
離散型確率変数(右)の場合と比較しておく.
離散型のΣ{}{}とp_k\,がそれぞれ連続型の∫{}{}とf(x)\,dxと対応する. \\[-3.5zh]
離散型 E(X)=x_1p_1+x_2p_2+・・・+x_np_n=Σ{k=1}{n}x_kp_k \\
離散型 V(X)=(x_1-m)^2p_1+(x_2-m)^2p_2+・・・+(x_n-m)^2p_n=Σ{k=1}{n}(x_k-m)^2p_k
離散型と同様,\ 連続型でもV(X)=E(X^2)-\{E(X)\}^2\,が成り立つ.
証明も同様なので,\ できるようにしておくこと.
V(X)=∫{α}{β}(x^2-2mx+m^2)f(x)\,dx=∫{α}{β}x^2f(x)\,dx-2m∫{α}{β}xf(x)+m^2∫{α}{β}f(x)\,dx
V(X)}=E(X^2)-2m・ m+m^2・1=E(X^2)-m^2=E(X^2)-\{E(X)\}^2 \\
連続型確率変数の変換
連続型確率変数Xと定数$a,\ b$に対して,\ 連続型確率変数$Y$を$Y=aX+b$とする.
平均 $E(Y)=E(aX+b)=aE(X)+b$
分散 $V(Y)=V(aX+b)=a^2\,V(X)$ \\
連続型確率変数の変換に対して,\ 離散型確率変数の変換と同様の公式が成り立つ.
証明も同様なので,\ できるようにしておくこと.
連続型確率変数X\ (α≦ x≦β)の確率密度関数をf(x)とする.
E(aX+b)=∫{α}{β}(ax+b)f(x)\,dx=a∫{α}{β}xf(x)\,dx+b∫{α}{β}f(x)\,dx=aE(X)+b・1=aE(X)+b
V(aX+b)=∫{α}{β}\{(ax+b)-E(aX+b)\}^2f(x)\,dx=∫{α}{β}\{(ax+b)-(aE(X)+b)\}^2f(x)\,dx
V(aX+b)}=a^2∫{α}{β}\{x-E(X)\}^2f(x)\,dx=a^2\,V(X)
比較のため,\ 離散型確率変数の場合の証明も示しておく.
E(aX+b)=Σ{k=1}{n}(ax_k+b)p_k=aΣ{k=1}{n}x_kp_k+bΣ{k=1}{n}p_k=aE(X)+b・1=aE(X)+b
V(aX+b)=Σ{k=1}{n}\{(ax_k+b)-E(aX+b)\}^2p_k=Σ{k=1}{n}\{(ax_k+b)-(aE(X)+b)\}^2p_k
V(aX+b)}=a^2Σ{k=1}{n}\{x_k-E(X)\}^2p_k=a^2\,V(X)
確率変数Xのとりうる値の範囲が$0≦ X≦1$であり,\ その確率密度関数$f(x)$は
2次関数で,\ $f(0)=f(1)=0$を満たす.
(1)\ \ 確率密度関数$f(x)$を求めよ.
(2)\ \ Xの平均$E(X)$,\ 分散$V(X)$,\ 標準偏差$σ(X)$を求めよ.
(3)\ \ $X-E(X)}≦σ(X)$となる確率を求めよ. \\
(1)\ \ f(x)が確率密度関数であるための条件f(x)≧0}かつ(全面積)=1}を考慮する.
\ \ 2点(α,\ 0),\ (β,\ 0)を通る2次関数は,\ y=a(x-α)(x-β)\ (分解形)と設定できた(数I}).
\ \ 0≦ x≦1においてf(x)≧0より,\ a<0\ (上に凸)である.
\ \ 整式の積分(数II})で次の\,16\,公式を習得済みならば,\ 別解のように計算できる.
16\,公式 ∫{α}{β}(x-α)(x-β)\,dx=-16(β-α)^3}
\ \ 2次関数と直線に囲まれた部分の面積を求める場合,\ 必然的に\,16\,公式の形が現れるのであった.
(2)\ \ f(x)の対称性を考慮すると,\ 計算せずともE(X)=12\,であるとわかる(検算用).}
\ \ V(X)は,\ 定義式よりも別公式で計算するほうが楽である(別解).
\ \ 定積分の計算式が仰々しいが,\ 多くの項が差で消えるので見た目よりは計算が楽である.
\ \ (a± b)^3=a^3±3a^2b+3ab^2± b^3\ (複号同順)
\ \ 本問は,\ Xの値が平均を基準として±σ\,までの範囲内になる確率を求める}ものである.
\ \ 今後,\ このような視点が非常に重要になる.\ ちなみに,\ 7√5}{25}≒63\%である.
\ \ 答えだけならば,\ 上右図のように分割して次の裏技\, a6\,公式(数II})を用いるのが早い.
\ \ 2次関数y=ax^2+・・・ とx=α,\ β\,で交わる直線間の面積 S= a}{6}(β-α)^3 (裏技)
\ \ (上側)+(下側)
確率変数Xのとりうる値の範囲が$0≦ X≦8$であり,\ その確率密度関数は
(1)\ \ 定数$k$の値を求めよ.
(2)\ \ Xの平均$E(X)$,\ 分散$V(X)$を求めよ.
(3)\ \ $Y=3X-1$とするとき,\ $Y$の平均$E(Y)$と分散$V(Y)$を求めよ. \\
(1)\ \ 絶対値は,\ 中身が0以上のときそのまま,\ 0以下のとき-をつけてはずすのであった(数 I).
\ \ f(x)が直線的なので,\ まともに積分計算せずとも三角形の面積として求めれば済む.
(2)\ \ 確率変数Xの平均E(X)は,\ 領域の重心のx座標と一致する.}
\ \ 領域が三角形ならば,\ 三角形の重心のx座標の公式\,x_1+x_2+x_3}{3}\ (数II})でE(X)が求まる.
\ \ 三角形の3頂点(0,\ 0),\ 2,\ 14,\ (8,\ 0)より\ \ E(X)=0+2+8}{3}=10}{3}\ \ (検算用)
(3)\ \ 変数変換の公式E(aX+b)=aE(X)+b,\ V(aX+b)=a^2\,V(X)を適用する.