2つのデータを合わせたデータの分散

スポンサーリンク

数学の試験を行ったところ,\ 以下の結果になった.\ 全体の平均点と分散を求めよ.
本問は次の2つの知識を習得済みであることが前提である. 個数$mのデータの平均が x,\ 個数nのデータの平均が y$}のとき (分散)=(2乗の平均)-(平均の2乗)
は公式として暗記する類のものではない.
{(全体の平均)={(全体の数値の合計)}{(全体の個数)\ という意味合いが重要である.
平均60点の男子が12人いるから,\ 男子の総合点は6012=720点である.
平均50点の女子が8人いるから,\ 女子の総合点は508=400点である.
全体の総合点が720+400=1120点となり,\ 全体の人数20人で割れば全体の平均点が求まる.
さて,\ 全体の分散を求めるには,\ 公式\ s²={x²}-( x)²\ を活用する.
目標は全体の分散\ {s_z}²\ を求めることである.を求めることに帰着する.
z\ はすでに求めたので,\ 後は\ {z²}\ を求めればよい.
ここで,\ 分散の公式は\ {分散}と{2乗の平均}と{普通の平均}を結びつけるものである.
普通の平均と分散が与えられているから,\ この公式を用いて2乗の平均を求めることができる.
つまり,\ 男子12人の点数の2乗の平均\ {x²}\ と女子8人の点数の2乗の平均\ {y²}\ が求まる.
後は,\ 全体20人の2乗の平均\ {z²}\ を{(20人の2乗の平均)={(20人の2乗の合計)}{(20人)\ で求める.
全体の平均\ と同様に全体の分散を\で求める{誤り}が多い.
なぜ誤りなのか,\ またなぜ分散の定義式ではなく別公式を用いるのかを確認しておく.
まず,\ 平均値を一般的に表すと,
ここで,\ 分散の定義式も平均の定義式と同様,\ 総和を個数で割ったものである.
よって,\ 単純には全体の分散も全体の平均と同様にして求めることができそうな気がする.
試しに分散の定義式\ で平均と同様に考えてみる.
定義式より
{s_z}²=(偏差の2乗の平均)={(全体の偏差の2乗の合計)}{(全体の個数)}
こうして全体の分散\ {s_z}²\ が導かれる(?).\ 一見すると正しいようにも思えるがこれは{誤り}である.
正しいのは次の式である.\ つまり,\ 分子は{全体の平均値 zとの偏差の2乗の合計}である. では求まらないし,\ 定義式を使う意味もないので別公式を用いることになる.