代表値① 平均値と仮平均法

次のデータの平均値を求めよ.
階級0以上10未満 合計
度数
データ全体の特徴を1つの数値だけで表すとき,\ その数値を代表値という.
代表値には平均値・中央値・最頻値があり,\ データの種類や状況に応じて使い分ける.
ここではまず平均値について学習する.  $n$個のデータの値を$x₁,\ x₂,\ x₃,\ ,\ x_n$とするとき (データの数値の合計)}{(データの個数)}仮平均法}仮平均を仮定し,\ 各値と仮平均の差を求める.
その差の平均を求め,\ 仮平均に足す.
複数の数値の総和は,\ {一の位が0になるものを組合せる}とよい.
は仮平均法が楽である.\ まず,\ 与えられたデータを見る限り,\ 平均は170付近と予想できる.
よって,\ 170を仮平均として各値と仮平均の差を求め,\ その差の平均を仮平均に足せばよい.
仮平均法の原理を数式で確認しておく.
仮平均をx₀とすると,\ 各値との差は  を計算することになる.
このように,\ 仮平均法における式は普通に平均値を求める式と一致している.
常にのように仮平均法が効果的なわけではない.
2桁程度の数値ならば,\ いちいち差を計算するよりも普通に求めた方が速いことも多い.
また,\ 各値のばらつきが大きい場合は差の絶対値も大きくなるので結局面倒な計算になる.
例えば,\ で仮平均を50として差を計算すると,\ -27,+48,+4,-13,+12\ である.
ここからさらに平均を求めて仮平均に足すくらいならば普通に求めた方が速いだろう.
結局,\ のように{桁数が多く,\ 各値が近い場合}に仮平均法が有効である.
度数分布表からは個々の正確な値はわからない.
そこで,\ {度数分布表が与えられた場合,\ 各階級内の値がすべて階級値}であると考える.
例えば,\ 階級0~10の度数は2なので,\ 階級値5が2個あると考える.
つまり,\ {(階級値)(度数)の総和がデータの数値の合計}であり,\ これをデータの個数で割る.
仮平均との差が簡潔になるため,\ {階級値を用いて平均値を求める場合も仮平均法が有効である.}
別解では仮平均を25として平均値を求めた.
{平}らに{均}(なら)した値をデータの代表値と考えることは合理的に思える.
しかし,\ 平均値が常に代表値として適切なわけではない.
例えば,5人の高校生のお小遣いが1,\ 1,\ 1,\ 1,\ 100\ (万円)}\ であるとしよう.
平均値は\ ${1+1+1+1+100}{5}=20.8\ (万円)}$\ となるが,\ 一般的な感覚からはかけ離れる.
100のように他の値に比べて大きすぎたり小さすぎたりする値を外れ値という.
外れ値を含むデータの代表値として,\ 外れ値に影響されやすい平均値は不適切なのである. 1クラス40人に対して数学の試験を行い,\ 男子20人の平均点は60点,\ 女子20人
の平均点は50点であった.\ クラス全員の平均点を求めよ.
1クラス40人に対して数学の試験を行い,\ 男子25人の平均点は60点,\ 女子15人
の平均点は50点であった.\ クラス全員の平均点を求めよ.
平均点を求めるのに必要なのは点数の合計と人数であり,\ 個人の点数は必要ない.
平均60点の男子が20人いれば,\ その点数の合計は6020点である.
同様に女子の点数の合計は5020であり,\ 男子と合わせて全員の点数の合計となる.
これを総人数40人で割ると全員の平均点を求めることができる.\ も同様である.
数IIB}の知識を要するが,\ 本問を一般的に考えてみる.
個数mのデータの平均がx,\ 個数nのデータの平均がyであるとする.
このとき,\ 全体の平均は\ {mx+ny}{m+n}\ となる.
{mx+ny}{n+m}\ と見ると,\ {xとyをn:mに内分する点の公式の形}である.
つまり,\ {各平均点xとyを人数の逆比n:mに内分して全体の平均点を求められる}のである.
の別解は,\ 男女の人数比5:3より,\ 60点と50点を3:5(逆比)に内分するものである.
また,\ 特にm:n=1:1のとき平均は\ {x+y}{2}\ (中点)\ である. →\
とりわけ重要なのは,\ {データの個数の比だけで全体の平均が決まる}ことである.
例えばでは,\ 総人数が40人でも60人でも男女比が1:1であれば全体の平均点は同じになる.
次の表は男子20人分の身長の度数分布表である.\ 平均値のとりうる値の範囲を 次の表はクラス20人分の数学の試験の点数の度数分布表である.\ 平均値のとり うる値の範囲を求めよ.\ ただし,\ 試験の点数は整数値であるとする.
次の表はクラス20人分の小テストの点数の度数分布表である.\ 平均値のとりうる
平均値の下限は 平均値の上限は
最大のときの点数は最小のときの点数に比べてそれぞれ9点ずつ大きいから \
度数分布表から求まる平均値と真の平均値との間には誤差が生じる.
個々の値のとりうる範囲を考慮することで,\ 真の平均値のとりうる値の範囲を求められる.
まず,\ 身長150~160cm}の人は4人いる.
身長の合計は,\ 4人とも150cm}のときが下限,\ 4人とも160cm}のときが上限となる.
同様に各階級ごとに下限と上限を考え,\ その下限と上限の平均値を求めればよい.
平均値のとりうる値の範囲に173.5cm}は含まれないことに注意.
また,\ 上限を求めるときは下限に10を足せば済む(別解).
詳細は別項目で述べるが,\ 各値が10増えると平均値も10増えるのは直感的に納得できる.
一見するとと同様の問題に見えるが,\ 身長とは異なり点数は整数値しかとらない.
よって,\ 40点以上50点未満の階級における最大値は49である.\ 他階級も同様.
度数が不明な箇所があるので,\ 自分で文字を設定して数式を作成する.
{未知のものを一旦文字でおいてとりあえず立式する}というのはこの分野でも重要である.
度数の総和が20であることから,\ まず1つ等式が作成できる.
次に平均の式を立式する.\ さらに,\ 等式1つにつき文字1つ消去できるから,\ yを消去した.
普通は等式1つだけで2変数x,\ yを特定することはできない.
しかし,\ 本問の場合{人数x,\ yは0以上の整数値}である.
よって,\ xは0 x5を満たす整数であり,\ それぞれ代入して各場合の平均点が求められる.
タイトルとURLをコピーしました