数学1 データの分析 問題 6 解説

方針・初手
分散の定義式から、各データの偏差の平方和が $15s^2$ になることを利用する。条件を満たすデータが存在すると仮定して背理法を用い、偏差の平方和が全体の分散から決まる値($15s^2$)をオーバーしてしまうことを示す。
解法1
データの平均値を $\overline{x}$、標準偏差を $s$ とするので、分散 $s^2$ は次のように定義される。
$$s^2 = \frac{1}{15} \sum_{j=1}^{15} (x_j - \overline{x})^2$$
両辺を $15$ 倍して、偏差の平方和の形にする。
$$15s^2 = \sum_{j=1}^{15} (x_j - \overline{x})^2$$
各 $j$ について $(x_j - \overline{x})^2 \ge 0$ であることに注意する。
(1)
$|x_i - \overline{x}| > 4s$ をみたす $x_i$ が少なくとも1つ存在すると仮定する。
そのデータを $x_k$ とすると、両辺を2乗して $(x_k - \overline{x})^2 > 16s^2$ である。
このとき、偏差の平方和を $x_k$ とそれ以外のデータに分けて評価する。
$$\sum_{j=1}^{15} (x_j - \overline{x})^2 = (x_k - \overline{x})^2 + \sum_{j \neq k} (x_j - \overline{x})^2$$
残りの14個のデータの偏差の平方和は $\sum_{j \neq k} (x_j - \overline{x})^2 \ge 0$ であるから、次が成り立つ。
$$\sum_{j=1}^{15} (x_j - \overline{x})^2 \ge (x_k - \overline{x})^2 > 16s^2$$
元の式から左辺は $15s^2$ であるため、次を得る。
$$15s^2 > 16s^2$$
これを整理すると $s^2 < 0$ となるが、分散は $s^2 \ge 0$ でなければならないため、これは矛盾である。
したがって、$|x_i - \overline{x}| > 4s$ をみたす $x_i$ は存在しない。
(2)
$|x_i - \overline{x}| > 2s$ をみたす $x_i$ の個数が4個以上であると仮定する。
条件を満たすデータのうちの4つを取り出し、$x_{k_1}, x_{k_2}, x_{k_3}, x_{k_4}$ とする。
これらのデータについては、$(x_{k_m} - \overline{x})^2 > 4s^2 \ (m=1, 2, 3, 4)$ が成り立つ。
偏差の平方和を、この4つのデータと残りの11個のデータに分けて評価する。
$$\sum_{j=1}^{15} (x_j - \overline{x})^2 = \sum_{m=1}^{4} (x_{k_m} - \overline{x})^2 + \sum_{j \neq k_1, \cdots, k_4} (x_j - \overline{x})^2$$
残りの11個のデータの偏差の平方和も0以上であるから、次が成り立つ。
$$\sum_{j=1}^{15} (x_j - \overline{x})^2 \ge \sum_{m=1}^{4} (x_{k_m} - \overline{x})^2$$
右辺は $4s^2$ より大きい項が4つあるので、さらに下から評価できる。
$$\sum_{m=1}^{4} (x_{k_m} - \overline{x})^2 > 4 \times 4s^2 = 16s^2$$
これらをまとめると、次を得る。
$$15s^2 > 16s^2$$
(1) と同様に $s^2 < 0$ を導くため、$s^2 \ge 0$ に矛盾する。
したがって、$|x_i - \overline{x}| > 2s$ をみたす $x_i$ の個数は3以下である。
解説
データ分析の分野において、分散や標準偏差の定義式に立ち返り、各データの偏差との関係を不等式で評価する問題である。
大学数学で学ぶ「チェビシェフの不等式」の証明と同じ考え方を背景としている。全体の和(この場合は平方和)が定まっているとき、極端に大きい要素の個数は全体量によって制限されるという原理を数式で表現している。高校数学においては、定義式に従って和を分割し、0以上である残りの項を切り捨てることで下から評価する手法(背理法などと組み合わせる)が定石である。
答え
(1) 題意の命題は証明された。
(2) 題意の命題は証明された。
自分の記録
誤りを報告
解説の誤り、誤字、表示崩れに気づいた場合は送信してください。ログイン不要です。