トップ 基礎問題 数学B 確率分布・統計的推測 標本平均の分布 問題 1

数学B 標本平均の分布 問題 1 解説

数学B 標本平均の分布 問題 1 解説

方針・初手

不良品であるかどうかは各製品ごとに確率 $p$ のベルヌーイ試行である。したがって、不良品数 $X$ は二項分布に従う。

$n$ が大きいときは、二項分布を平均 $np$、分散 $np(1-p)$ の正規分布で近似する。また、整数値をとる $X$ を連続分布で近似するので、確率計算では連続補正を用いる。

解法1

(1)

$n$ 個を無作為に抽出し、それぞれが不良品である確率を $p$ とする。各製品について「不良品である」という事象は確率 $p$ で起こるので、不良品の個数 $X$ は二項分布

$$ X \sim B(n,p) $$

に従う。

二項分布 $B(n,p)$ の平均と分散はそれぞれ

$$ E(X)=np,\qquad V(X)=np(1-p) $$

である。

$n$ が大きいとき、二項分布は正規分布で近似できるから、

$$ X \fallingdotseq N{np,\ np(1-p)} $$

である。

すなわち、標準化すると

$$ Z=\frac{X-np}{\sqrt{np(1-p)}} $$

は標準正規分布 $N(0,1)$ に従うものとして近似できる。

(2)

標本不良率を $p_0$ とする。信頼度 $95%$ の信頼区間は、標準正規分布について

$$ P(|Z|\leqq 1.96)=0.95 $$

を用いて、

$$ p_0-1.96\sqrt{\frac{p_0(1-p_0)}{n}} \leqq p \leqq p_0+1.96\sqrt{\frac{p_0(1-p_0)}{n}} $$

と表される。

この信頼区間の半幅は

$$ 1.96\sqrt{\frac{p_0(1-p_0)}{n}} $$

である。

標本不良率 $p_0$ が同じ値で得られるとすると、信頼区間の半幅は $1/\sqrt{n}$ に比例する。標本の大きさを $N$ に増やしたとき、信頼区間の半幅をもとの半分にするには

$$ \frac{1}{\sqrt{N}}=\frac{1}{2}\cdot \frac{1}{\sqrt{n}} $$

となればよい。

両辺を整理すると、

$$ \sqrt{N}=2\sqrt{n} $$

より、

$$ N=4n $$

である。

したがって、標本の大きさをもとの $4$ 倍にすればよい。

(3)

$p=0.05,\ n=1900$ であるから、

$$ X \sim B(1900,0.05) $$

である。

このとき平均と分散は

$$ E(X)=1900\cdot 0.05=95 $$

であり、

$$ V(X)=1900\cdot 0.05\cdot 0.95=90.25 $$

である。したがって、標準偏差は

$$ \sqrt{90.25}=9.5 $$

である。

よって、$X$ は近似的に

$$ X \fallingdotseq N(95,90.25) $$

に従う。

求める確率は

$$ P(76\leqq X\leqq 114) $$

である。$X$ は整数値をとるので、正規分布で近似する際には連続補正を用いて

$$ P(76\leqq X\leqq 114) \fallingdotseq P(75.5\leqq X\leqq 114.5) $$

とする。

標準化すると、

$$ \begin{aligned} P(75.5\leqq X\leqq 114.5) &= P\left( \frac{75.5-95}{9.5}\leqq Z\leqq \frac{114.5-95}{9.5} \right) \end{aligned} $$

である。

ここで、

$$ \begin{aligned} \frac{75.5-95}{9.5} &= \frac{-19.5}{9.5} \fallingdotseq -2.1 \end{aligned} $$

また、

$$ \begin{aligned} \frac{114.5-95}{9.5} &= \frac{19.5}{9.5} \fallingdotseq 2.1 \end{aligned} $$

である。

したがって、

$$ P(76\leqq X\leqq 114) \fallingdotseq P(-2.1\leqq Z\leqq 2.1) $$

となる。

標準正規分布の対称性より、

$$ \begin{aligned} P(-2.1\leqq Z\leqq 2.1) &= 2P(0\leqq Z\leqq 2.1) \end{aligned} $$

である。

問題文より

$$ P(0\leqq Z\leqq 2.1)=0.4821 $$

なので、

$$ \begin{aligned} P(-2.1\leqq Z\leqq 2.1) &= 2\cdot 0.4821 \\ 0.9642 \end{aligned} $$

である。

よって、

$$ P(76\leqq X\leqq 114)\fallingdotseq 0.9642 $$

である。

解説

この問題の中心は、二項分布と正規分布近似の関係である。二項分布 $B(n,p)$ は、$n$ が大きいとき

$$ N{np,\ np(1-p)} $$

で近似できる。

特に、$X$ は整数値をとる離散型確率変数であるのに対し、正規分布は連続型確率分布である。そのため、$P(76\leqq X\leqq 114)$ を正規分布で近似するときは、端点を $75.5$ と $114.5$ にずらす連続補正を用いるのが自然である。

また、信頼区間の幅は標本の大きさ $n$ の平方根に反比例する。したがって、信頼区間の幅を半分にするには、標本数を $2$ 倍ではなく $4$ 倍にする必要がある。

答え

(1)

$$ X\sim B(n,p) $$

$n$ が大きいとき、

$$ X\fallingdotseq N{np,\ np(1-p)} $$

で近似される。

(2)

標本の大きさを

$$ 4n $$

にすればよい。

(3)

$$ P(76\leqq X\leqq 114)\fallingdotseq 0.9642 $$

自分の記録

ログインすると保存できます。

誤りを報告

解説の誤り、誤字、表示崩れに気づいた場合は送信してください。ログイン不要です。