トップ 基礎問題 数学1 データの分析 データの分析 問題 10

数学1 データの分析 問題 10 解説

数学1 データの分析 問題 10 解説

方針・初手

分散や共分散の定義に従い、A~Dの4名のデータについて平均、偏差平方和、偏差積和を計算して相関係数を求める。 (2)では、データの追加に伴う平均や分散の変化を追う。分散は $\text{(2乗の平均)} - \text{(平均の2乗)}$、共分散は $\text{(積の平均)} - \text{(平均の積)}$ を用いて計算すると整理しやすい。また、データの追加による偏差平方和の更新公式を用いると、計算量を減らすことができる。得点は0と10の間の整数値であることに注意して、方程式の整数解を絞り込む。

解法1

(1)

A~Dの4名の数学の得点をそれぞれ $x_i$、英語の得点を $y_i$ $(i=1,2,3,4)$ とする。 数学の得点の平均値 $\bar{x}$ と英語の得点の平均値 $\bar{y}$ は、

$$\bar{x} = \frac{1+3+6+10}{4} = 5$$

$$\bar{y} = \frac{3+7+2+8}{4} = 5$$

各生徒の偏差 $(x_i - \bar{x})$ と $(y_i - \bar{y})$ は以下のようになる。 数学の偏差: $-4, -2, 1, 5$ 英語の偏差: $-2, 2, -3, 3$

これより、数学の偏差平方和 $S_{xx}$、英語の偏差平方和 $S_{yy}$、数学と英語の偏差積和 $S_{xy}$ は、

$$S_{xx} = (-4)^2 + (-2)^2 + 1^2 + 5^2 = 16 + 4 + 1 + 25 = 46$$

$$S_{yy} = (-2)^2 + 2^2 + (-3)^2 + 3^2 = 4 + 4 + 9 + 9 = 26$$

$$S_{xy} = (-4)\cdot(-2) + (-2)\cdot 2 + 1\cdot(-3) + 5\cdot 3 = 8 - 4 - 3 + 15 = 16$$

したがって、求める相関係数 $r_4$ は、

$$r_4 = \frac{S_{xy}}{\sqrt{S_{xx}}\sqrt{S_{yy}}} = \frac{16}{\sqrt{46}\sqrt{26}} = \frac{16}{2\sqrt{299}} = \frac{8}{\sqrt{299}}$$

(2)

Eを加えた5名のデータについて考える。 5名の数学の得点の2乗の和と、平均値は以下の通りである。

$$\sum_{i=1}^5 x_i^2 = (1^2 + 3^2 + 6^2 + 10^2) + x^2 = 146 + x^2$$

$$\bar{x}_5 = \frac{20+x}{5}$$

数学の分散 $s_x^2$ は、$\text{(2乗の平均)} - \text{(平均の2乗)}$ より、

$$s_x^2 = \frac{146+x^2}{5} - \left(\frac{20+x}{5}\right)^2 = \frac{5(146+x^2) - (400+40x+x^2)}{25} = \frac{4x^2-40x+330}{25}$$

同様に、英語の得点の2乗の和と、平均値は以下の通りである。

$$\sum_{i=1}^5 y_i^2 = (3^2 + 7^2 + 2^2 + 8^2) + y^2 = 126 + y^2$$

$$\bar{y}_5 = \frac{20+y}{5}$$

英語の分散 $s_y^2$ は、

$$s_y^2 = \frac{126+y^2}{5} - \left(\frac{20+y}{5}\right)^2 = \frac{5(126+y^2) - (400+40y+y^2)}{25} = \frac{4y^2-40y+230}{25}$$

数学と英語の得点の積の和は、

$$\sum_{i=1}^5 x_i y_i = (1\cdot3 + 3\cdot7 + 6\cdot2 + 10\cdot8) + xy = 116 + xy$$

共分散 $s_{xy}$ は、$\text{(積の平均)} - \text{(平均の積)}$ より、

$$s_{xy} = \frac{116+xy}{5} - \left(\frac{20+x}{5}\right)\left(\frac{20+y}{5}\right) = \frac{5(116+xy) - (400+20x+20y+xy)}{25} = \frac{4xy-20x-20y+180}{25}$$

これらを用いて、5名の相関係数 $r$ を求めると、

$$r = \frac{s_{xy}}{s_x s_y} = \frac{ \frac{4xy-20x-20y+180}{25} }{ \sqrt{\frac{4x^2-40x+330}{25}} \sqrt{\frac{4y^2-40y+230}{25}} } = \frac{4xy-20x-20y+180}{\sqrt{4x^2-40x+330}\sqrt{4y^2-40y+230}}$$

多項式は各項の係数が整数となるように設定されているため、分子および分母の根号内の式がそれぞれエ、オ、カに該当する。

次に、$x$ がA~Dの数学の平均値 $5$ に等しく、$y$ が英語の平均値 $5$ に等しいとき、$x=5, y=5$ を代入すると、

$$r = \frac{4(25) - 20(5) - 20(5) + 180}{\sqrt{4(25) - 40(5) + 330}\sqrt{4(25) - 40(5) + 230}} = \frac{100 - 100 - 100 + 180}{\sqrt{100 - 200 + 330}\sqrt{100 - 200 + 230}} = \frac{80}{\sqrt{230}\sqrt{130}} = \frac{80}{10\sqrt{299}} = \frac{8}{\sqrt{299}}$$

相関係数 $r$ の値が $0$ となるとき、分子が $0$ となるため、

$$4xy - 20x - 20y + 180 = 0$$

両辺を $4$ で割り、因数分解しやすい形に変形する。

$$xy - 5x - 5y + 45 = 0$$

$$(x-5)(y-5) - 25 + 45 = 0$$

$$(x-5)(y-5) = -20$$

得点は $0$ と $10$ の間の整数値($0$ 以上 $10$ 以下の整数)であるため、$x-5$ および $y-5$ は $-5$ 以上 $5$ 以下の整数である。積が $-20$ になる組 $(x-5, y-5)$ は以下の4通りである。

$$(-5, 4), (-4, 5), (4, -5), (5, -4)$$

よって、$r=0$ となる $(x, y)$ の組は $4$ 通りある。 それぞれの $(x, y)$ の組と $x+y$ の値は、 ・$(-5, 4)$ のとき $(0, 9)$、和は $9$ ・$(-4, 5)$ のとき $(1, 10)$、和は $11$ ・$(4, -5)$ のとき $(9, 0)$、和は $9$ ・$(5, -4)$ のとき $(10, 1)$、和は $11$

$x+y$ が最大となるのは $(1, 10)$ と $(10, 1)$ のときである。$x$ と $y$ の大小関係より、大きい方の値は $10$、小さい方の値は $1$ である。

最後に、$x$ と $y$ がいずれも $10$ に等しいとき、$x=10, y=10$ を代入すると、

$$r = \frac{4(100) - 20(10) - 20(10) + 180}{\sqrt{4(100) - 40(10) + 330}\sqrt{4(100) - 40(10) + 230}} = \frac{400 - 200 - 200 + 180}{\sqrt{400 - 400 + 330}\sqrt{400 - 400 + 230}} = \frac{180}{\sqrt{330}\sqrt{230}} = \frac{180}{10\sqrt{759}} = \frac{18}{\sqrt{759}}$$

解説

(2)におけるデータの追加に伴う分散・共分散の計算は、定義通りに「2乗の平均-平均の2乗」から導く以外にも、偏差平方和に着目した以下の更新公式を知っていると見通しが良くなる。 データ数が $n$ から $n+1$ に増え、追加されたデータが $x$、元のデータの平均値が $\bar{x}$ であった場合、新しい偏差平方和 $S'_{xx}$ は次のように表される。

$$S'_{xx} = S_{xx} + \frac{n}{n+1}(x - \bar{x})^2$$

本問において、数学の得点について $S_{xx}=46, \bar{x}=5, n=4$ を代入すると、

$$S'_{xx} = 46 + \frac{4}{5}(x - 5)^2 = \frac{230 + 4(x^2 - 10x + 25)}{5} = \frac{4x^2 - 40x + 330}{5}$$

分散はこれをデータ数の $5$ で割るため、$\frac{4x^2-40x+330}{25}$ が即座に得られる。共分散についても同様に公式が適用でき、試験本番での計算の負担とミスを大幅に減らすことができる。

また、方程式 $(x-5)(y-5) = -20$ を解く際、「得点は $0$ 以上 $10$ 以下の整数」という条件から変域を $-5 \leqq x-5 \leqq 5$ に絞り込む手順は、整数問題における典型的な処理である。

答え

ア:$\frac{8}{\sqrt{299}}$

イ:$\frac{4x^2-40x+330}{25}$

ウ:$\frac{4y^2-40y+230}{25}$

エ:$4xy-20x-20y+180$

オ:$4x^2-40x+330$

カ:$4y^2-40y+230$

キ:$\frac{8}{\sqrt{299}}$

ク:$4$

ケ:$10$

コ:$1$

サ:$\frac{18}{\sqrt{759}}$

自分の記録

ログインすると保存できます。

誤りを報告

解説の誤り、誤字、表示崩れに気づいた場合は送信してください。ログイン不要です。