トップ 基礎問題 数学1 データの分析 データの分析 問題 1

数学1 データの分析 問題 1 解説

数学1 データの分析 問題 1 解説

方針・初手

データの平均、分散、共分散、および変量の変換(1次変換)に関する基本的な定義と性質を確認する問題である。 (1) は定義通りに平均を計算し、変換された変量の平均については $\overline{z} = a\overline{x} + b$ の関係を用いる。 (2) は分散と共分散の定義式を展開し、「(分散)=(2乗の平均)ー(平均の2乗)」などの公式を導出する過程を記述する。 (3)(2) で示した等式を利用して共分散を求め、さらに分散を求めて相関係数を計算する。変換後の変量については、共分散と相関係数の性質 $s_{zw} = ac \cdot s_{xy}$、$r_{zw} = \frac{ac}{|ac|} r_{xy}$ (ただし $z=ax+b, w=cy+d$)を利用する。

解法1

(1)

与えられたデータの和から、変量 $x, y$ の平均 $\overline{x}, \overline{y}$ はそれぞれ定義より

$$\overline{x} = \frac{1}{10} (x_1 + x_2 + \cdots + x_{10}) = \frac{55}{10} = \frac{11}{2}$$

$$\overline{y} = \frac{1}{10} (y_1 + y_2 + \cdots + y_{10}) = \frac{75}{10} = \frac{15}{2}$$

である。 また、変量 $z, w$ について、$z_i = 2x_i + 3, w_i = y_i - 4$ であるから、その平均 $\overline{z}, \overline{w}$ は

$$\overline{z} = 2\overline{x} + 3 = 2 \cdot \frac{11}{2} + 3 = 14$$

$$\overline{w} = \overline{y} - 4 = \frac{15}{2} - 4 = \frac{7}{2}$$

となる。

(2)

和の記号 $\sum$ を用いて記述する。データの個数は $10$ である。 分散 $s_x^2$ の定義式より

$$s_x^2 = \frac{1}{10} \sum_{i=1}^{10} (x_i - \overline{x})^2$$

$$= \frac{1}{10} \sum_{i=1}^{10} (x_i^2 - 2\overline{x}x_i + \overline{x}^2)$$

$$= \frac{1}{10} \left( \sum_{i=1}^{10} x_i^2 - 2\overline{x} \sum_{i=1}^{10} x_i + \sum_{i=1}^{10} \overline{x}^2 \right)$$

ここで、$\sum_{i=1}^{10} x_i = 10\overline{x}$、$\sum_{i=1}^{10} \overline{x}^2 = 10\overline{x}^2$ であるから

$$s_x^2 = \frac{1}{10} \left( \sum_{i=1}^{10} x_i^2 - 20\overline{x}^2 + 10\overline{x}^2 \right)$$

$$= \frac{1}{10} \sum_{i=1}^{10} x_i^2 - \overline{x}^2$$

両辺に $10$ を掛けて移項すると

$$\sum_{i=1}^{10} x_i^2 = 10(s_x^2 + \overline{x}^2)$$

すなわち、$x_1^2 + x_2^2 + \cdots + x_{10}^2 = 10(s_x^2 + \overline{x}^2)$ が成り立つ。

同様に、共分散 $s_{xy}$ の定義式より

$$s_{xy} = \frac{1}{10} \sum_{i=1}^{10} (x_i - \overline{x})(y_i - \overline{y})$$

$$= \frac{1}{10} \sum_{i=1}^{10} (x_iy_i - \overline{x}y_i - \overline{y}x_i + \overline{x}\overline{y})$$

$$= \frac{1}{10} \left( \sum_{i=1}^{10} x_iy_i - \overline{x}\sum_{i=1}^{10} y_i - \overline{y}\sum_{i=1}^{10} x_i + \sum_{i=1}^{10} \overline{x}\overline{y} \right)$$

ここで、$\sum_{i=1}^{10} y_i = 10\overline{y}$、$\sum_{i=1}^{10} x_i = 10\overline{x}$、$\sum_{i=1}^{10} \overline{x}\overline{y} = 10\overline{x}\overline{y}$ であるから

$$s_{xy} = \frac{1}{10} \left( \sum_{i=1}^{10} x_iy_i - 10\overline{x}\overline{y} - 10\overline{x}\overline{y} + 10\overline{x}\overline{y} \right)$$

$$= \frac{1}{10} \sum_{i=1}^{10} x_iy_i - \overline{x}\overline{y}$$

両辺に $10$ を掛けて移項すると

$$\sum_{i=1}^{10} x_iy_i = 10(s_{xy} + \overline{x}\overline{y})$$

すなわち、$x_1y_1 + x_2y_2 + \cdots + x_{10}y_{10} = 10(s_{xy} + \overline{x}\overline{y})$ が成り立つ。

(3)

(2) で示した式 $x_1y_1 + x_2y_2 + \cdots + x_{10}y_{10} = 10(s_{xy} + \overline{x}\overline{y})$ に与えられた値を代入すると

$$445 = 10 \left( s_{xy} + \frac{11}{2} \cdot \frac{15}{2} \right)$$

$$44.5 = s_{xy} + 41.25$$

$$s_{xy} = 44.5 - 41.25 = 3.25 = \frac{13}{4}$$

次に、相関係数 $r_{xy} = \frac{s_{xy}}{s_x s_y}$ を計算するために、$x$ と $y$ の標準偏差 $s_x, s_y$ を求める。 (2) の等式 $x_1^2 + x_2^2 + \cdots + x_{10}^2 = 10(s_x^2 + \overline{x}^2)$ に値を代入して

$$385 = 10 \left( s_x^2 + \left(\frac{11}{2}\right)^2 \right)$$

$$38.5 = s_x^2 + 30.25$$

$$s_x^2 = 38.5 - 30.25 = 8.25 = \frac{33}{4}$$

よって、$s_x = \frac{\sqrt{33}}{2}$ である。 $y$ についても同様の等式 $y_1^2 + y_2^2 + \cdots + y_{10}^2 = 10(s_y^2 + \overline{y}^2)$ が成り立つため、

$$645 = 10 \left( s_y^2 + \left(\frac{15}{2}\right)^2 \right)$$

$$64.5 = s_y^2 + 56.25$$

$$s_y^2 = 64.5 - 56.25 = 8.25 = \frac{33}{4}$$

よって、$s_y = \frac{\sqrt{33}}{2}$ である。 以上より、$x$ と $y$ の相関係数 $r_{xy}$ は

$$r_{xy} = \frac{s_{xy}}{s_x s_y} = \frac{\frac{13}{4}}{\frac{\sqrt{33}}{2} \cdot \frac{\sqrt{33}}{2}} = \frac{\frac{13}{4}}{\frac{33}{4}} = \frac{13}{33}$$

続いて、$z$ と $w$ の共分散と相関係数を求める。 一般に、変量 $u, v$ が $u = ax + b, v = cy + d$ ($a, b, c, d$ は定数)と表されるとき、共分散 $s_{uv}$ と相関係数 $r_{uv}$ はそれぞれ $s_{uv} = ac \cdot s_{xy}$、$r_{uv} = \frac{ac}{|ac|} r_{xy}$ となる。 今回は $z = 2x + 3, w = 1 \cdot y - 4$ であるから、$a=2, c=1$ に該当する。 したがって、$z$ と $w$ の共分散 $s_{zw}$ は

$$s_{zw} = 2 \cdot 1 \cdot s_{xy} = 2 \cdot \frac{13}{4} = \frac{13}{2}$$

また、$z$ と $w$ の相関係数 $r_{zw}$ は

$$r_{zw} = \frac{2 \cdot 1}{|2| \cdot |1|} r_{xy} = 1 \cdot r_{xy} = \frac{13}{33}$$

となる。

解説

データの分析における「分散・共分散の計算公式の導出」と「変量の変換」を問う標準的な問題である。 (2) の等式は、よく知られた公式「(分散)=(2乗の平均)ー(平均の2乗)」や「(共分散)=(積の平均)ー(平均の積)」を変形したものである。本問のようにシグマ記号 $\sum$ を用いて展開することで、正確に証明を記述できる。 (3) では、変量を定数倍・平行移動した際の共分散と相関係数の変化に関する性質を用いる。平行移動(定数の加減)は分散や共分散に影響を与えず、定数倍は共分散にはそのまま掛けられ、相関係数には定数倍の符号のみが影響することを理解しておく必要がある。

答え

(1) $\overline{x} = \frac{11}{2}, \overline{y} = \frac{15}{2}, \overline{z} = 14, \overline{w} = \frac{7}{2}$

(2) 解法1の通り証明された。

(3) $s_{xy} = \frac{13}{4}, r_{xy} = \frac{13}{33}, s_{zw} = \frac{13}{2}, r_{zw} = \frac{13}{33}$

自分の記録

ログインすると保存できます。

誤りを報告

解説の誤り、誤字、表示崩れに気づいた場合は送信してください。ログイン不要です。