トップ› 京都大学› 1973年› 理系第6問

京都大学 1973年理系第6問解説

方針・初手

A君、B君、C君のそれぞれについて、最終的な合計得点の分布を求め、ルールに従って報酬の期待値を計算する。その後、得られた期待値を $p$ の関数として捉え、$0 < p < 1$ の範囲で大小比較を行う。最大となる期待値をもつ人物が「一番有利」となる。

解法1

A君、B君、C君の報酬の期待値をそれぞれ $E_A, E_B, E_C$ とする。くじは当たる確率が $p$、外れる確率が $1-p$ であり、初期得点は1である。報酬は、最終的な合計得点が0以下の場合は0、正の場合はその得点となる。

（i） A君の期待値 $E_A$

一度もくじを引かないため、合計得点は初期得点の1のままである。合計得点1は正なので、報酬は1となる。したがって、

$$ E_A = 1 $$

（ii） B君の期待値 $E_B$

B君は一度引き、当たれば止め、外れればもう一度引く。起こり得る事象と確率は以下の通りである。

1回目に当たる場合（確率 $p$）：合計得点は $1 + 1 = 2$ となり、ここでやめる。報酬は $2$。
1回目に外れ、2回目に当たる場合（確率 $(1-p)p$）： 1回目終了時の得点は $1 - 1 = 0$ であり、2回目を引く。2回目で当たるため合計得点は $0 + 1 = 1$ となる。報酬は $1$。
1回目に外れ、2回目も外れる場合（確率 $(1-p)^2$）：合計得点は $1 - 1 - 1 = -1$ となる。負であるため、報酬は $0$。

したがって、B君の報酬の期待値は、

$$ \begin{aligned} E_B &= 2 \cdot p + 1 \cdot (1-p)p + 0 \cdot (1-p)^2 \\ &= 2p + p - p^2 \\ &= -p^2 + 3p \end{aligned} $$

（iii） C君の期待値 $E_C$

C君は当たる当たらないにかかわらず2回引く。起こり得る事象と確率は以下の通りである。

2回とも当たる場合（確率 $p^2$）：合計得点は $1 + 1 + 1 = 3$。報酬は $3$。
1回当たり、1回外れる場合（確率 ${}_2\mathrm{C}_{1} p(1-p) = 2p(1-p)$）：合計得点は $1 + 1 - 1 = 1$。報酬は $1$。
2回とも外れる場合（確率 $(1-p)^2$）：合計得点は $1 - 1 - 1 = -1$。負であるため、報酬は $0$。

したがって、C君の報酬の期待値は、

$$ \begin{aligned} E_C &= 3 \cdot p^2 + 1 \cdot 2p(1-p) + 0 \cdot (1-p)^2 \\ &= 3p^2 + 2p - 2p^2 \\ &= p^2 + 2p \end{aligned} $$

（iv）期待値の大小比較

$E_A, E_B, E_C$ の差を計算し、大小が入れ替わる境界の $p$ の値を調べる。

$E_B - E_A = -p^2 + 3p - 1$ であり、$E_B - E_A = 0$ となる $p$ は、

$$ p = \frac{-3 \pm \sqrt{9 - 4 \cdot (-1) \cdot (-1)}}{-2} = \frac{3 \pm \sqrt{5}}{2} $$

$0 < p < 1$ の範囲にあるのは $p = \frac{3-\sqrt{5}}{2}$ である。

$E_C - E_A = p^2 + 2p - 1$ であり、$E_C - E_A = 0$ となる $p$ は、

$$ p = \frac{-2 \pm \sqrt{4 - 4 \cdot 1 \cdot (-1)}}{2} = -1 \pm \sqrt{2} $$

$0 < p < 1$ の範囲にあるのは $p = \sqrt{2}-1$ である。

$E_B - E_C = (-p^2 + 3p) - (p^2 + 2p) = -2p^2 + p = p(1 - 2p)$ であり、$E_B - E_C = 0$ となる $0 < p < 1$ の値は $p = \frac{1}{2}$ である。

ここで、求めた境界値 $\frac{3-\sqrt{5}}{2}$, $\sqrt{2}-1$, $\frac{1}{2}$ の大小関係を調べる。

$$ \frac{3-\sqrt{5}}{2} < \sqrt{2}-1 \iff 5 < 2\sqrt{2} + \sqrt{5} $$

両辺は正なので2乗して比較すると、$25 < 8 + 5 + 4\sqrt{10} \iff 3 < \sqrt{10}$ となり成立する。

$$ \sqrt{2}-1 < \frac{1}{2} \iff \sqrt{2} < \frac{3}{2} \iff 2 < \frac{9}{4} $$

これも成立する。したがって、大小関係は以下のようになる。

$$ 0 < \frac{3-\sqrt{5}}{2} < \sqrt{2}-1 < \frac{1}{2} < 1 $$

一番有利な人物を判定するため、各区間において最大の期待値を調べる。

$0 < p < \frac{3-\sqrt{5}}{2}$ のとき： $E_B - E_A < 0$ より $E_A > E_B$ また、$p < \frac{1}{2}$ なので $E_B > E_C$ よって $E_A > E_B > E_C$ となり、最大の期待値は $E_A$ である。
$p = \frac{3-\sqrt{5}}{2}$ のとき： $E_A = E_B > E_C$ となり、最大の期待値は $E_A$ と $E_B$ である。
$\frac{3-\sqrt{5}}{2} < p < \frac{1}{2}$ のとき： $E_B - E_A > 0$ より $E_B > E_A$ また、$E_B - E_C > 0$ より $E_B > E_C$ よって最大の期待値は $E_B$ である。
$p = \frac{1}{2}$ のとき： $E_B = E_C > E_A$ となり、最大の期待値は $E_B$ と $E_C$ である。
$\frac{1}{2} < p < 1$ のとき： $E_B - E_C < 0$ より $E_C > E_B$ $E_C - E_A > 0$ より $E_C > E_A$ よって最大の期待値は $E_C$ である。

解説

それぞれの戦略に基づく期待値を立式する過程では、マイナスになった得点がそのままマイナスの報酬になるのではなく、「負または0ならば報酬0」となる点に注意が必要だ。期待値の関数が求まった後は、3つの2次関数（および定数関数）の最大値を区間ごとに求める問題に帰着する。交点の $p$ 座標である無理数の大小比較を正確に行うことがポイントだ。