数学B 標本平均の分布 問題 1 解説

方針・初手
不良品であるかどうかは各製品ごとに確率 $p$ のベルヌーイ試行である。したがって、不良品数 $X$ は二項分布に従う。
$n$ が大きいときは、二項分布を平均 $np$、分散 $np(1-p)$ の正規分布で近似する。また、整数値をとる $X$ を連続分布で近似するので、確率計算では連続補正を用いる。
解法1
(1)
$n$ 個を無作為に抽出し、それぞれが不良品である確率を $p$ とする。各製品について「不良品である」という事象は確率 $p$ で起こるので、不良品の個数 $X$ は二項分布
$$ X \sim B(n,p) $$
に従う。
二項分布 $B(n,p)$ の平均と分散はそれぞれ
$$ E(X)=np,\qquad V(X)=np(1-p) $$
である。
$n$ が大きいとき、二項分布は正規分布で近似できるから、
$$ X \fallingdotseq N{np,\ np(1-p)} $$
である。
すなわち、標準化すると
$$ Z=\frac{X-np}{\sqrt{np(1-p)}} $$
は標準正規分布 $N(0,1)$ に従うものとして近似できる。
(2)
標本不良率を $p_0$ とする。信頼度 $95%$ の信頼区間は、標準正規分布について
$$ P(|Z|\leqq 1.96)=0.95 $$
を用いて、
$$ p_0-1.96\sqrt{\frac{p_0(1-p_0)}{n}} \leqq p \leqq p_0+1.96\sqrt{\frac{p_0(1-p_0)}{n}} $$
と表される。
この信頼区間の半幅は
$$ 1.96\sqrt{\frac{p_0(1-p_0)}{n}} $$
である。
標本不良率 $p_0$ が同じ値で得られるとすると、信頼区間の半幅は $1/\sqrt{n}$ に比例する。標本の大きさを $N$ に増やしたとき、信頼区間の半幅をもとの半分にするには
$$ \frac{1}{\sqrt{N}}=\frac{1}{2}\cdot \frac{1}{\sqrt{n}} $$
となればよい。
両辺を整理すると、
$$ \sqrt{N}=2\sqrt{n} $$
より、
$$ N=4n $$
である。
したがって、標本の大きさをもとの $4$ 倍にすればよい。
(3)
$p=0.05,\ n=1900$ であるから、
$$ X \sim B(1900,0.05) $$
である。
このとき平均と分散は
$$ E(X)=1900\cdot 0.05=95 $$
であり、
$$ V(X)=1900\cdot 0.05\cdot 0.95=90.25 $$
である。したがって、標準偏差は
$$ \sqrt{90.25}=9.5 $$
である。
よって、$X$ は近似的に
$$ X \fallingdotseq N(95,90.25) $$
に従う。
求める確率は
$$ P(76\leqq X\leqq 114) $$
である。$X$ は整数値をとるので、正規分布で近似する際には連続補正を用いて
$$ P(76\leqq X\leqq 114) \fallingdotseq P(75.5\leqq X\leqq 114.5) $$
とする。
標準化すると、
$$ \begin{aligned} P(75.5\leqq X\leqq 114.5) &= P\left( \frac{75.5-95}{9.5}\leqq Z\leqq \frac{114.5-95}{9.5} \right) \end{aligned} $$
である。
ここで、
$$ \begin{aligned} \frac{75.5-95}{9.5} &= \frac{-19.5}{9.5} \fallingdotseq -2.1 \end{aligned} $$
また、
$$ \begin{aligned} \frac{114.5-95}{9.5} &= \frac{19.5}{9.5} \fallingdotseq 2.1 \end{aligned} $$
である。
したがって、
$$ P(76\leqq X\leqq 114) \fallingdotseq P(-2.1\leqq Z\leqq 2.1) $$
となる。
標準正規分布の対称性より、
$$ \begin{aligned} P(-2.1\leqq Z\leqq 2.1) &= 2P(0\leqq Z\leqq 2.1) \end{aligned} $$
である。
問題文より
$$ P(0\leqq Z\leqq 2.1)=0.4821 $$
なので、
$$ \begin{aligned} P(-2.1\leqq Z\leqq 2.1) &= 2\cdot 0.4821 \\ 0.9642 \end{aligned} $$
である。
よって、
$$ P(76\leqq X\leqq 114)\fallingdotseq 0.9642 $$
である。
解説
この問題の中心は、二項分布と正規分布近似の関係である。二項分布 $B(n,p)$ は、$n$ が大きいとき
$$ N{np,\ np(1-p)} $$
で近似できる。
特に、$X$ は整数値をとる離散型確率変数であるのに対し、正規分布は連続型確率分布である。そのため、$P(76\leqq X\leqq 114)$ を正規分布で近似するときは、端点を $75.5$ と $114.5$ にずらす連続補正を用いるのが自然である。
また、信頼区間の幅は標本の大きさ $n$ の平方根に反比例する。したがって、信頼区間の幅を半分にするには、標本数を $2$ 倍ではなく $4$ 倍にする必要がある。
答え
(1)
$$ X\sim B(n,p) $$
$n$ が大きいとき、
$$ X\fallingdotseq N{np,\ np(1-p)} $$
で近似される。
(2)
標本の大きさを
$$ 4n $$
にすればよい。
(3)
$$ P(76\leqq X\leqq 114)\fallingdotseq 0.9642 $$
自分の記録
誤りを報告
解説の誤り、誤字、表示崩れに気づいた場合は送信してください。ログイン不要です。