トップ 基礎問題 数学1 データの分析 データの分析 問題 2

数学1 データの分析 問題 2 解説

数学1 データの分析 問題 2 解説

方針・初手

変量 $x$ の分散は、データの数が $5$ 個と少なく、値も計算しやすい整数であるため、平均を求めてから定義に従って計算するか、公式を用いて計算する。

変量 $9-x$ と $x$ の相関係数については、一方が他方の $1$ 次式で表される関係にあることに着目し、相関係数の性質を利用すると計算を省略できる。

解法1

与えられたデータ $x$ の値は $3, 9, 1, 7, 5$ である。

まず、$x$ の平均値 $\bar{x}$ を求める。

$$\bar{x} = \frac{3 + 9 + 1 + 7 + 5}{5} = \frac{25}{5} = 5$$

各データから平均値 $\bar{x}$ を引いた偏差 $x - \bar{x}$ は、順に以下のようになる。

$$-2, \quad 4, \quad -4, \quad 2, \quad 0$$

分散 $s_x^2$ は偏差の $2$ 乗の平均であるから、次のように計算できる。

$$\begin{aligned} s_x^2 &= \frac{(-2)^2 + 4^2 + (-4)^2 + 2^2 + 0^2}{5} \\ &= \frac{4 + 16 + 16 + 4 + 0}{5} \\ &= \frac{40}{5} \\ &= 8 \end{aligned}$$

したがって、[ オ ] に当てはまる値は $8$ である。

次に、変量 $y = 9 - x$ とおく。

これは $y = -x + 9$ と表すことができ、変量 $y$ は変量 $x$ の $1$ 次式である。

一般に、変量 $y = ax + b$ ($a, b$ は定数で $a \neq 0$)と変量 $x$ の相関係数 $r$ は、$a > 0$ のとき $r = 1$、$a < 0$ のとき $r = -1$ となる性質がある。

今回は $a = -1 < 0$ であるから、$y$ と $x$ の相関係数は $-1$ である。

したがって、[ カ ] に当てはまる値は $-1$ である。

解法2

分散を「($2$ 乗の平均)$-$(平均の $2$ 乗)」の公式を用いて計算し、相関係数を共分散から定義通りに計算する。

$x$ の平均値 $\bar{x}$ は解法1と同様に $5$ である。

$x^2$ の値は、順に以下のようになる。

$$9, \quad 81, \quad 1, \quad 49, \quad 25$$

$x^2$ の平均値 $\overline{x^2}$ を求める。

$$\overline{x^2} = \frac{9 + 81 + 1 + 49 + 25}{5} = \frac{165}{5} = 33$$

したがって、分散 $s_x^2$ は次のように計算できる。

$$\begin{aligned} s_x^2 &= \overline{x^2} - (\bar{x})^2 \\ &= 33 - 5^2 \\ &= 33 - 25 \\ &= 8 \end{aligned}$$

次に、変量 $y = 9 - x$ と $x$ の共分散 $s_{xy}$ を求める。

$y$ の平均値 $\bar{y}$ は、変量の変換の性質から次のように求まる。

$$\bar{y} = 9 - \bar{x} = 9 - 5 = 4$$

$y$ の偏差 $y - \bar{y}$ は、$(9 - x) - 4 = 5 - x$ であるから、順に以下のようになる。

$$2, \quad -4, \quad 4, \quad -2, \quad 0$$

$x$ の偏差 $x - \bar{x}$ は、解法1より $-2, 4, -4, 2, 0$ である。

共分散 $s_{xy}$ は、それぞれの偏差の積の平均であるから、次のように計算できる。

$$\begin{aligned} s_{xy} &= \frac{-2 \cdot 2 + 4 \cdot (-4) + (-4) \cdot 4 + 2 \cdot (-2) + 0 \cdot 0}{5} \\ &= \frac{-4 - 16 - 16 - 4 + 0}{5} \\ &= \frac{-40}{5} \\ &= -8 \end{aligned}$$

また、$y = -x + 9$ であるから、$y$ の分散 $s_y^2$ は $s_y^2 = (-1)^2 s_x^2 = 8$ となる。

したがって、$y$ の標準偏差 $s_y$ は $\sqrt{8}$ であり、$x$ の標準偏差 $s_x$ も $\sqrt{8}$ である。

求める相関係数 $r$ は、次のように計算できる。

$$r = \frac{s_{xy}}{s_x s_y} = \frac{-8}{\sqrt{8} \sqrt{8}} = \frac{-8}{8} = -1$$

解説

データの分析における基本的な計算問題である。分散の求め方には、定義通り「偏差の $2$ 乗の平均」を計算する方法と、「($2$ 乗の平均)$-$(平均の $2$ 乗)」を利用する方法の $2$ 通りがあり、データの値によって計算しやすい方を選択できるようにしておきたい。本問のように平均値が整数の場合は、定義通りに計算した方が早いことが多い。

また、変量の変換 $y = ax + b$ に関する性質は頻出である。 平均:$\bar{y} = a\bar{x} + b$ 分散:$s_y^2 = a^2 s_x^2$ 標準偏差:$s_y = |a|s_x$ 相関係数:$a$ の符号のみに依存し、$a > 0$ ならば $1$、$a < 0$ ならば $-1$

これらを暗記しておくと、相関係数の計算などの手間を大幅に省くことができる。

答え

オ:$8$

カ:$-1$

自分の記録

ログインすると保存できます。

誤りを報告

解説の誤り、誤字、表示崩れに気づいた場合は送信してください。ログイン不要です。