九州大学 2010年 理系 第2問 解説

方針・初手
サイコロを振る試行を順に追い、ルールに従って各事象の確率と得点を計算する。 (1) はすべての事象($36$ 通り)に対して得点を計算し、その期待値を求める。 (2) は1回目の目によって行動が変わるため、1回目の目が $6$ の場合と $5$ 以下の場合に分けて期待値を計算する。 (3) は、1回目の目の値ごとに「2回目を振る場合の得点の期待値」と「2回目を振らない場合の確定した得点」を比較し、より大きくなる選択肢を採用すればよい。
解法1
(1)
サイコロを2回振るときの目の出方は全部で $36$ 通りあり、これらは同様に確からしい。 1回目の目を $X$、2回目の目を $Y$ とする。 題意より、得点が $0$ でないのは合計が $6$ 以下のとき、すなわち $X+Y \leqq 6$ のときであり、そのときの得点は $X+Y$ である。 得点が $k$ ($2 \leqq k \leqq 6$) となる $(X, Y)$ の組の数を調べる。
- $k=2$ となるのは $(1, 1)$ の $1$ 通り
- $k=3$ となるのは $(1, 2), (2, 1)$ の $2$ 通り
- $k=4$ となるのは $(1, 3), (2, 2), (3, 1)$ の $3$ 通り
- $k=5$ となるのは $(1, 4), (2, 3), (3, 2), (4, 1)$ の $4$ 通り
- $k=6$ となるのは $(1, 5), (2, 4), (3, 3), (4, 2), (5, 1)$ の $5$ 通り
これら以外の目の出方($X+Y \geqq 7$)のとき、得点は $0$ である。 したがって、求める期待値 $E_1$ は以下のようになる。
$$ \begin{aligned} E_1 &= \frac{1}{36} (2 \times 1 + 3 \times 2 + 4 \times 3 + 5 \times 4 + 6 \times 5) \\ &= \frac{1}{36} (2 + 6 + 12 + 20 + 30) \\ &= \frac{70}{36} \\ &= \frac{35}{18} \end{aligned} $$
(2)
1回目の目 $X$ の値で場合分けして考える。
(i) $X=6$ のとき 2回目を振らず、そのまま得点は $6$ となる。この事象が起こる確率は $\frac{1}{6}$ である。
(ii) $X \leqq 5$ のとき 2回目を振る。このときの得点は、(1) のルールに従って決定される。 ここで、(1) で求めた期待値 $E_1$ の計算において、$X=6$ の場合は常に $X+Y \geqq 7$ となり得点が $0$ であった。 つまり、$X \leqq 5$ の場合に2回目を振ったときの得点の期待値の総和は、(1) で求めた全体の得点の総和と等しく、その期待値への寄与は $\frac{35}{18}$ のままである。
これらより、求める期待値 $E_2$ は以下のようになる。
$$ \begin{aligned} E_2 &= 6 \times \frac{1}{6} + \frac{35}{18} \\ &= 1 + \frac{35}{18} \\ &= \frac{53}{18} \end{aligned} $$
(3)
1回目の目 $X$ が $i$ ($1 \leqq i \leqq 6$) のとき、2回目を振った場合に得られる得点の期待値を $e_i$ とおく。
- $i=1$ のとき、2回目の目 $Y$ が $1 \sim 5$ なら得点 $1+Y$、$Y=6$ なら得点 $0$ となる。
$$ e_1 = \frac{1}{6} (2+3+4+5+6) = \frac{20}{6} = \frac{10}{3} $$
- $i=2$ のとき、$Y$ が $1 \sim 4$ なら得点 $2+Y$、$Y \geqq 5$ なら得点 $0$ となる。
$$ e_2 = \frac{1}{6} (3+4+5+6) = \frac{18}{6} = 3 $$
- $i=3$ のとき、$Y$ が $1 \sim 3$ なら得点 $3+Y$、$Y \geqq 4$ なら得点 $0$ となる。
$$ e_3 = \frac{1}{6} (4+5+6) = \frac{15}{6} = \frac{5}{2} $$
- $i=4$ のとき、$Y$ が $1, 2$ なら得点 $4+Y$、$Y \geqq 3$ なら得点 $0$ となる。
$$ e_4 = \frac{1}{6} (5+6) = \frac{11}{6} $$
- $i=5$ のとき、$Y=1$ なら得点 $6$、$Y \geqq 2$ なら得点 $0$ となる。
$$ e_5 = \frac{1}{6} \times 6 = 1 $$
- $i=6$ のとき、2回目を振ると合計が必ず $7$ 以上になるので得点 $0$ となる。
$$ e_6 = 0 $$
得点の期待値を最大にするためには、最初の目 $i$ に対し、2回目を振らない場合の確定得点 $i$ と、2回目を振った場合の期待値 $e_i$ を比較し、値が大きい方の行動を選択すればよい。
- $i=1$ のとき、$e_1 = \frac{10}{3} > 1$ より、2回目を振る方がよい。
- $i=2$ のとき、$e_2 = 3 > 2$ より、2回目を振る方がよい。
- $i=3$ のとき、$e_3 = \frac{5}{2} < 3$ より、2回目を振らない方がよい。
- $i=4$ のとき、$e_4 = \frac{11}{6} < 4$ より、2回目を振らない方がよい。
- $i=5$ のとき、$e_5 = 1 < 5$ より、2回目を振らない方がよい。
- $i=6$ のとき、$e_6 = 0 < 6$ より、2回目を振らない方がよい。
以上より、2回目を振るとよいのは最初の目が $1$ または $2$ のときである。
解説
期待値の基本的な計算と、条件つきでの期待値の比較を問う問題である。 (1) は単純な反復試行の期待値であるが、和が $7$ 以上で $0$ 点になるという条件の処理を正確に行う必要がある。 (2) は「場合分けされた事象の期待値の和が、全体の期待値となる」という性質を利用すると計算を大幅に省略できる。直接場合分けして計算しても手間はそれほどかからない。 (3) は「情報が与えられた後での最適な意思決定」を問う問題である。各事象が起こったという条件のもとでの条件付き期待値を計算し、現在の確定している利益(そのままの得点)と比較するという、動的計画法やゲーム理論の基本的な考え方に基づいている。
答え
(1) $\frac{35}{18}$
(2) $\frac{53}{18}$
(3) $1$ 以上 $2$ 以下(または $1$ と $2$ のとき)
自分の記録
誤りを報告
解説の誤り、誤字、表示崩れに気づいた場合は送信してください。ログイン不要です。











