検索用コード
次のデータの中央値を求めよ. 中央値(メジアン)}}}} \\\\
平均値には,\ たった1つの外れ値のせいで大きく変化してしまうという弱点があった. \\[.2zh] ならば,\ \textbf{\textcolor{magenta}{単に小さい順に並べたときの中央の値を代表値}}とすればよい.\ これが\textbf{\textcolor{blue}{中央値}}である. \\[.2zh] \textbf{\textcolor[named]{ForestGreen}{中央値は外れ値に影響されにくい}}ため,\ 外れ値をもつデータの代表値として適切である. \\\\中央値}\ \ \begin{cases}
データの数が\textcolor{cyan}{奇数個}  & \textcolor{cyan}{ちょうど真ん中の値} \\[.2zh] データの数が\textcolor{red}{偶数個} & \textcolor{red}{真ん中の2つの値の平均値}
中央値は結果的に外れ値を無視することにもつながる. \\[.2zh] よって,\ 外れ値に影響されにくいといえるが,\ 外れ値の無視が常にベストなわけではない. \\[.2zh] 外れ値を考慮するべきか否かはデータの種類や目的によって常に変化する. \\[.2zh] ゆえに,\ 外れ値がなければ平均値,\ あれば中央値のような絶対的な使い分けがあるわけではない. \\[.2zh] なお,\ 小さい順に並べ替えたときは\bm{データの個数が問題と一致しているかを確認}すること.
次の表は男子の身長の度数分布表である.\ 中央値をそれぞれ求めよ.
階級 150以上160未満合計 \\\hline
階級値
度数(人)小さいほうから6人目が真ん中}であるから 中央値は\ $\bm{175\ (\textbf{cm})}$ \\[1zh] (2)\ \ \textcolor{red}{小さいほうから5人目の165と6人目の175が真ん中}である.
度数分布表が与えられた場合,\ 階級内の値はすべて階級値であるとみなす. \\[.2zh] 例えば,\ 150\,\text{cm}以上160\,\text{cm}未満の度数は2なので,\ 階級値155\,\text{cm}が2人いるとみなす. \\[1zh] (1)\ \ データの個数が\bm{奇数個}であるからちょうど真ん中の値が存在する. \\[.2zh] \phantom{(1)}\ \ 総数が11個ならば,\ 6番目がちょうど真ん中である. \\[.2zh] \phantom{(1)}\ \ よって,\ \bm{大きさ順に並べたときに6番目の値がある階級を考える.} \\[.2zh] \phantom{(1)}\ \ 150\,~\,170に2+2=4人,\ 150\,~\,180に2+2+4=8人いる. \\[.2zh] \phantom{(1)}\ \ ゆえに,\ \bm{階級170\,~\,180に6人目がいる.}\ 結局,\ この階級値175が中央値となる. \\[.2zh] \phantom{(1)}\ \ 実際に11人分の身長を小さい順に書き並べてみると次のようになる.
(2)\ \ データの個数が\bm{偶数個}であるからちょうど真ん中の値は存在しない. \\[.2zh] \phantom{(1)}\ \ 総数が10個ならば,\ 5番目と6番目が真ん中2つになる. \\[.2zh] \phantom{(1)}\ \ 150\,~\,170に2+3=5人,\ 150\,~\,180に2+3+3=8人いる. \\[.2zh] \phantom{(1)}\ \ よって,\ \bm{階級160\,~\,170に5人目,\ 階級170\,~\,180に6人目がいる.} \\[.2zh] \phantom{(1)}\ \ そして,\ 5人目の身長は階級値165\,\text{cm},\ 6人目の身長は階級値175\,\text{cm}となる. \\[.2zh] \phantom{(1)}\ \ この2人の平均が中央値である.\ 実際に10人分を書き並べると次のようになる. $x$を自然数とする.\ 以下のデータの中央値は何通り考えられるか.
(1)\ \ x以外を小さい順に並べ,\ その両端と間にxを入れて中央値がどうなるかを考える. \\[.2zh] \phantom{(1)}\ \ x以外が4個あるから,\ その両端と間は5ヶ所ある. \\[.2zh] \phantom{(1)}\ \ xが13の左または13と25の間に入る,\ つまりx\leqq25のとき,\ 中央値は25になる. \\[.2zh] \phantom{(1)}\ \ xが25と39の間に入る,\ つまり26\leqq x\leqq38のとき,\ 中央値はxになる. \\[.2zh] \phantom{(1)}\ \ xが39と51の間または51の右に入る,\ つまりx\geqq39のとき,\ 中央値は39になる. \\[.2zh] \phantom{(1)}\ \ このように,\ \bm{x以外が偶数個}あるとき,\ \bm{真ん中2個の値を境に場合分け}することになる. \\[.2zh] \phantom{(1)}\ \ 以上から,\ \bm{25,\ 39,\ および26\leqq x\leqq38を満たすすべての整数xが中央値の候補}である. \\[.2zh] \phantom{(1)}\ \ 個数を求めるとき,\ 38-26とすると26も引かれてしまうので,\ 忘れずに+\,1をする. \\[1zh] (2)\ \ x以外が5個あるから,\ その両端と間は6ヶ所ある. \\[.2zh] \phantom{(1)}\ \ xが14の左または14と22の間に入る(x\leqq22)とき,\ 中央値は22と29の平均値. \\[.2zh] \phantom{(1)}\ \ xが22と29または29と35の間に入る(23\leqq x\leqq34)のとき,\ 中央値はxと29の平均値. \\[.2zh] \phantom{(1)}\ \ xが35と41の間または41の右に入る(x\geqq35)のとき,\ 中央値は29と35の平均値. \\[.2zh] \phantom{(1)}\ \ このように,\ \bm{x以外が奇数個}あるとき,\ \bm{真ん中の値の両端の値を境に場合分け}することになる.
最頻値(モード)}}}} \\\\
高校生7人の勉強時間が\ 0,\ 0,\ 0,\ 5,\ 10,\ 10,\ 10\ (時間)であるとする. \\[.2zh] このデータの平均値は5,\ 中央値も5だが,\ 代表値として適切かは疑問である. \\[.2zh] この場合,\ \textbf{\textcolor{magenta}{単純に最も個数が多い0と10を代表値}}とするのがよい.
また,\ 数量だけで考える平均値・中央値に対し,\ 最頻値は質的な傾向も探る}}ことができる. \\[.2zh] 例えば,\ 5人の好きな色「赤,\ 赤,\ 赤,\ 白,\ 青」から,\ 最も人気なのは赤といえる. \\[1zh] 最頻値は,\ \textbf{\textcolor{purple}{データの個数が少ない場合や値がばらついている場合には使えない.}} \\[.2zh] 例えば,\ 「\ 2,\ \ 3,\ \ 3,\ \ 5\ 」や「\ 3,\ \ 4,\ \ 6,\ \ 7\ 」というデータの最頻値はあまり意味がない. \\\\[1zh] (2)\ \ \textcolor{red}{最も度数が多い階級の階級値が最頻値}であるから
(1)\ \ 小さい順に並べ替えたときは\bm{データの個数が問題と一致しているかを確認}すること. \\[.2zh] \phantom{(1)}\ \ 最頻値を求めるだけならば,\ 小さい順に並べるよりも度数分布表を作るとわかりやすい. \\[.2zh] \phantom{(1)}\ \ 問題全体の流れを見て,\ 並べ替えと度数分布表のどちらが必要かを考えるのがよいだろう. \\[.2zh] \phantom{(1)}\ \ \bm{最も度数が多い階級(階級値)が最頻値}である.\ 度数の3を間違えて答えないよう注意する. \\[.2zh] \phantom{(1)}\ \ 度数分布表を作成したときも\bm{度数の総和がデータの総数と一致しているかを確認}すること. \\[1zh] (2)\ \ 最も度数が多い階級は2\,~\,3である.\ この階級に含まれる値はすべて階級値2.5とみなす.