トップ 基礎問題 数学1 データの分析 データの分析 問題 7

数学1 データの分析 問題 7 解説

数学1 データの分析 問題 7 解説

方針・初手

集団全体の平均値は、各グループのデータの総和を求めて全体の個数で割ることで得られる。 集団全体の分散については、「(分散)=(2乗の平均)-(平均の2乗)」の関係式を利用し、各グループのデータの2乗の総和を求めてから全体の分散を計算するのが定石である。または、全体の分散が「各グループの分散の加重平均」と「各グループの平均値の分散(グループ間の分散)」の和として表されることを利用してもよい。

解法1

グループAのデータの個数を $n_A = 20$、平均値を $\overline{x}_A = 16$、分散を $s_A^2 = 24$ とする。 グループBのデータの個数を $n_B = 60$、平均値を $\overline{x}_B = 12$、分散を $s_B^2 = 28$ とする。

集団全体の個数 $n$ は、

$$n = n_A + n_B = 20 + 60 = 80$$

集団全体のデータの総和は、グループAとグループBのデータの総和の和であるから、集団全体の平均値 $\overline{x}$ は、

$$\overline{x} = \frac{n_A \overline{x}_A + n_B \overline{x}_B}{n_A + n_B} = \frac{20 \times 16 + 60 \times 12}{80} = \frac{320 + 720}{80} = \frac{1040}{80} = 13$$

次に、分散を求める。「(分散)=(2乗の平均)-(平均の2乗)」より、「(2乗の平均)=(分散)+(平均の2乗)」である。

グループAのデータの2乗の平均を $\overline{x_A^2}$ とすると、

$$\overline{x_A^2} = s_A^2 + (\overline{x}_A)^2 = 24 + 16^2 = 24 + 256 = 280$$

よって、グループAのデータの2乗の総和は、

$$n_A \overline{x_A^2} = 20 \times 280 = 5600$$

グループBのデータの2乗の平均を $\overline{x_B^2}$ とすると、

$$\overline{x_B^2} = s_B^2 + (\overline{x}_B)^2 = 28 + 12^2 = 28 + 144 = 172$$

よって、グループBのデータの2乗の総和は、

$$n_B \overline{x_B^2} = 60 \times 172 = 10320$$

集団全体のデータの2乗の総和は、

$$5600 + 10320 = 15920$$

であるから、集団全体のデータの2乗の平均は、

$$\frac{15920}{80} = 199$$

したがって、集団全体の分散 $s^2$ は、

$$s^2 = 199 - (\overline{x})^2 = 199 - 13^2 = 199 - 169 = 30$$

解法2

全体の平均値 $\overline{x} = 13$ を求める過程は解法1と同様である。

全体の分散は、「各グループ内の分散の加重平均」と「各グループの平均値の、全体平均からの分散(グループ間の分散)」の和になるという性質を利用する。

各グループ内の分散の加重平均を $s_{W}^2$ とすると、

$$s_{W}^2 = \frac{n_A s_A^2 + n_B s_B^2}{n_A + n_B} = \frac{20 \times 24 + 60 \times 28}{80} = \frac{480 + 1680}{80} = \frac{2160}{80} = 27$$

グループ間の分散を $s_{B}^2$ とすると、これは各グループの平均値 $\overline{x}_A, \overline{x}_B$ と全体平均 $\overline{x}$ との偏差の平方の加重平均であるから、

$$s_{B}^2 = \frac{n_A (\overline{x}_A - \overline{x})^2 + n_B (\overline{x}_B - \overline{x})^2}{n_A + n_B} = \frac{20 (16 - 13)^2 + 60 (12 - 13)^2}{80} = \frac{20 \times 3^2 + 60 \times (-1)^2}{80} = \frac{180 + 60}{80} = \frac{240}{80} = 3$$

したがって、集団全体の分散 $s^2$ は、

$$s^2 = s_{W}^2 + s_{B}^2 = 27 + 3 = 30$$

解説

複数のグループを統合した集団の平均値と分散を求める、データの分析における典型問題である。 全体の平均値は単に個数による加重平均を計算すればよい。 全体の分散を求める際、単純に各グループの分散を足して割るなどの誤りを犯しやすい。解法1のように「データの2乗の和」に着目して全体を再構成する手法が最も確実で汎用性が高い。解法2の「全体の分散=(グループ内分散)+(グループ間分散)」という関係を知っていると、計算量を大幅に減らし、見通しよく解くことができる。

答え

ウ 13

エ 30

自分の記録

ログインすると保存できます。

誤りを報告

解説の誤り、誤字、表示崩れに気づいた場合は送信してください。ログイン不要です。