数学1 データの分析 問題 7 解説

方針・初手
集団全体の平均値は、各グループのデータの総和を求めて全体の個数で割ることで得られる。 集団全体の分散については、「(分散)=(2乗の平均)-(平均の2乗)」の関係式を利用し、各グループのデータの2乗の総和を求めてから全体の分散を計算するのが定石である。または、全体の分散が「各グループの分散の加重平均」と「各グループの平均値の分散(グループ間の分散)」の和として表されることを利用してもよい。
解法1
グループAのデータの個数を $n_A = 20$、平均値を $\overline{x}_A = 16$、分散を $s_A^2 = 24$ とする。 グループBのデータの個数を $n_B = 60$、平均値を $\overline{x}_B = 12$、分散を $s_B^2 = 28$ とする。
集団全体の個数 $n$ は、
$$n = n_A + n_B = 20 + 60 = 80$$
集団全体のデータの総和は、グループAとグループBのデータの総和の和であるから、集団全体の平均値 $\overline{x}$ は、
$$\overline{x} = \frac{n_A \overline{x}_A + n_B \overline{x}_B}{n_A + n_B} = \frac{20 \times 16 + 60 \times 12}{80} = \frac{320 + 720}{80} = \frac{1040}{80} = 13$$
次に、分散を求める。「(分散)=(2乗の平均)-(平均の2乗)」より、「(2乗の平均)=(分散)+(平均の2乗)」である。
グループAのデータの2乗の平均を $\overline{x_A^2}$ とすると、
$$\overline{x_A^2} = s_A^2 + (\overline{x}_A)^2 = 24 + 16^2 = 24 + 256 = 280$$
よって、グループAのデータの2乗の総和は、
$$n_A \overline{x_A^2} = 20 \times 280 = 5600$$
グループBのデータの2乗の平均を $\overline{x_B^2}$ とすると、
$$\overline{x_B^2} = s_B^2 + (\overline{x}_B)^2 = 28 + 12^2 = 28 + 144 = 172$$
よって、グループBのデータの2乗の総和は、
$$n_B \overline{x_B^2} = 60 \times 172 = 10320$$
集団全体のデータの2乗の総和は、
$$5600 + 10320 = 15920$$
であるから、集団全体のデータの2乗の平均は、
$$\frac{15920}{80} = 199$$
したがって、集団全体の分散 $s^2$ は、
$$s^2 = 199 - (\overline{x})^2 = 199 - 13^2 = 199 - 169 = 30$$
解法2
全体の平均値 $\overline{x} = 13$ を求める過程は解法1と同様である。
全体の分散は、「各グループ内の分散の加重平均」と「各グループの平均値の、全体平均からの分散(グループ間の分散)」の和になるという性質を利用する。
各グループ内の分散の加重平均を $s_{W}^2$ とすると、
$$s_{W}^2 = \frac{n_A s_A^2 + n_B s_B^2}{n_A + n_B} = \frac{20 \times 24 + 60 \times 28}{80} = \frac{480 + 1680}{80} = \frac{2160}{80} = 27$$
グループ間の分散を $s_{B}^2$ とすると、これは各グループの平均値 $\overline{x}_A, \overline{x}_B$ と全体平均 $\overline{x}$ との偏差の平方の加重平均であるから、
$$s_{B}^2 = \frac{n_A (\overline{x}_A - \overline{x})^2 + n_B (\overline{x}_B - \overline{x})^2}{n_A + n_B} = \frac{20 (16 - 13)^2 + 60 (12 - 13)^2}{80} = \frac{20 \times 3^2 + 60 \times (-1)^2}{80} = \frac{180 + 60}{80} = \frac{240}{80} = 3$$
したがって、集団全体の分散 $s^2$ は、
$$s^2 = s_{W}^2 + s_{B}^2 = 27 + 3 = 30$$
解説
複数のグループを統合した集団の平均値と分散を求める、データの分析における典型問題である。 全体の平均値は単に個数による加重平均を計算すればよい。 全体の分散を求める際、単純に各グループの分散を足して割るなどの誤りを犯しやすい。解法1のように「データの2乗の和」に着目して全体を再構成する手法が最も確実で汎用性が高い。解法2の「全体の分散=(グループ内分散)+(グループ間分散)」という関係を知っていると、計算量を大幅に減らし、見通しよく解くことができる。
答え
ウ 13
エ 30
自分の記録
誤りを報告
解説の誤り、誤字、表示崩れに気づいた場合は送信してください。ログイン不要です。