聖ペテルスブルグのパラドックス

提供: Yourpedia
2007年6月22日 (金) 03:32時点におけるキリカ (トーク | 投稿記録)による版

(差分) ←前の版 | 最新版 (差分) | 次の版→ (差分)
移動: 案内検索
ファイル:Plan of Peter Paul Fortress.jpg
18世紀のサンクトペテルブルク
ファイル:Danielbernoulli.jpg
ダニエル・ベルヌーイ

聖ペテルスブルグのパラドックス(サンクトペテルスブルクのパラドックス、St. Petersburg paradox)は、意思決定理論における逆説(パラドックス)の1つである。極めて少ない確率で極めて大きな利益が得られるような事例では期待値が発散する場合があるが、このような時に生まれる逆説である。

1738年サンクトペテルブルクに住んでいたダニエル・ベルヌーイが、学術雑誌『ペテルブルグ帝国アカデミー論集』の論文「リスクの測定に関する新しい理論」で発表した。なお、ダニエル・ベルヌーイはベルヌーイの定理で知られる数学者物理学者で、ベルヌーイ数大数の法則で知られるヤコブ・ベルヌーイである。

どのような逆説か[編集]

偏りのないコインを表が出るまで投げ続け、表がでたときに、賞金をもらえるゲームがあるとする。もらえる賞金は1回目に表がでたら1円(通貨単位は本質ではなく、どんなものでもいい。ベルヌーイの原論文ではダカット金貨で、現在の約500日本円相当だった)、1回目は裏で2回目に表がでれば倍の2円、2回目まで裏で3回目が表ならまたその倍の4円というふうに倍々でふえる。つまり表が出るまでに投げた回数をnとすると、2(n-1)円もらえるのである。10回目に表が出れば512円、20回目に出れば52万4288円、30回目なら5億3687万0912円である。ここで、このゲームには賭け金が必要であるとしたら、賭け金の金額が何円までなら払っても損ではないと言えるだろうか? (なお、掛け金に応じて賞金が変わるわけではないことに注意)

多くの場合、この種の問題では賞金の期待値を算出して、賭け金がそれ以下であれば良いとする。ところが、この問題で実際に賞金の期待値を計算してみると、その数値は無限大に発散してしまうのである。すなわち期待値をWとすると、

<math> W = \sum_{k=1}^\infty \left( \frac {1}{2^k} \cdot 2^{k-1} \right) = 1/2 + 1/2 + 1/2 + 1/2 + \ldots = \infty</math>

従って、期待値によって判断するならば、賭け金として有り金を残らず注ぎ込んででも参加すべきであるということになる。

ところが実際には、このゲームでは1/2の確率で1円、1/4の確率で2円、1/1024の確率で512円の賞金が得られるに過ぎないのである。従って、そんなに得であるはずがないことは直観的に分かる。にも関わらず、それと矛盾する結論が期待値の計算で得られている。ゆえにこれはパラドックスなのである。

現実的な回答[編集]

現実には、賞金には上限がある。たとえば、ある回数 <math>n_\max</math> を上限とし、<math>n_\max</math> 回表が出なかったら一定額の賞金を支払うというルールが考えられる(客を納得させるためには、その賞金額は <math>n_\max + 1</math> 回目に表が出たときの賞金より高い必要があるだろう)。現実には、たとえ事前にこのようなルールが明示的されていなくても、裏を出し続ける客は、あの手この手で賭をうち切るよう働きかけられるだろう。また、かりに胴元が誠実で巨額の支払いを受け入れたとしても、胴元が破産し、胴元の資産以下の賞金を受け取れるだけである。

しかし、思考実験として「胴元が無限の支払い能力を持っている」と仮定することはでき、そのばあいでも、全財産を賭に払うべきではないと多くの人は考える。そのため、パラドックスは完全には解決していない。

効用による回答[編集]

ファイル:Graph of common logarithm.png
対数曲線。この図では底は10。

ベルヌーイは、主観的価値とでも言える「効用」を定義して、このパラドックスを回避した。誰にとっても一定の「価値」に対し、効用は、効用を評価する人の個別の事情に左右される。そして、例外はあるがほとんどの場合、金額が大きくなるほど、効用の増加具合は緩やかになる。つまり、100万円が200万円になるときの効用は、1000万円が1100万円になるときの効用より大きい。これは現在の経済学における限界効用逓減と同じ考えである。

ベルヌーイさらに、効用は、金額の対数(底は何でもいいので、以下では単に <math>\log</math> と書く)で得られるとした。つまり、100万円が200万円になるときの効用と、1000万円が2000万円になるときの効用とは等しい。対数関数で得られる効用を「対数関数的効用」という。このモデルは、(小さな)資産の増加による効用は資産の総量に反比例するということでもあり、これを「ベルヌーイの規則」と呼ぶ。また、金額の期待値が金額の重み付け算術平均なのに対し、効用の期待値は、金額の重み付け幾何平均の効用となる。相加相乗の法則から、効用の期待値は、金額の期待値の効用より、ほとんどの場合小さい(例外として、賞金額が常に一定ならば等しい)。

ギャンブラーの総資産を <math>a</math>、賭の価格を <math>b</math> とすると、賭終了後の総資産は

<math> \sum_{k=1}^\infty \left\{ \frac {1}{2^k} \left( a - b + 2^{k-1} \right) \right\} = \infty</math>

と発散するのは先に見たとおりだが、効用の期待値は

<math> \sum_{k=1}^\infty \left\{ \frac {1}{2^k} \log \left( a - b + {2^{k-1}} \right) \right\} </math>

となり、この値は有限にとどまる。

単純なケースとして <math>a = b </math> (有り金全て賭ける)とすると、

<math> \sum_{k=1}^\infty \left( \frac {1}{2^k} \log {2^{k-1}} \right) = \log2 \cdot \sum_{k=1}^\infty \frac {k}{2^{k+1}} = \log2</math>

となる。つまり、総資産2円(効用 <math> \log 2 </math>)以下なら、賭により効用は増えるので、有り金全て賭けてでも賭に参加すべきである。なお、総資産2円という状況はイメージしにくいので、賞金のスタートを1円から200万円に引き上げると、有り金全て賭けてでも賭に参加すべき資産は400万円(日本家庭の金融資産中央値がこのていどである)以下となる。

しかし、総資産が2円より多いなら、2円と総資産の間のどこかに、賭けるべきか賭けるべきかの境目となる <math> b_0 </math> がある。<math> b_0 </math> を求めるには方程式

<math> \sum_{k=1}^\infty \left\{ \frac {1}{2^k} \log \left( a - b_0 + {2^{k-1}} \right) \right\} = \log a</math>

を解けばいい。たとえば、400万円に対しては約12円となり、かなり実感に近くなる。

ファイル:Menger.jpg
カール・メンガー

ただし、以上のような対数関数的効用は、パラドックスの完全な解決にはならない。カール・メンガーは、1回裏を出すごとに賞金が2倍になるのではなく、2乗になるような賭では、(賞金が資産を十分上回った後には)効用は2倍になり、期待値は発散することを指摘した。これに対しては、効用の増加具合を自然対数より緩やか(恣意的な例ではではあるが、対数の対数など)にすれば対応できる。これは、100万円が200万円になる効用より100億円が200億円になる効用のほうが少ないと言うことであり、「使い切れない」ということを考えれば妥当なモデルである。しかし、効用の増加がどれだけ緩やかでも、1回裏を出すごとに「効用が2倍になる」ように賞金額を設定すれば、効用の期待値はやはり発散する。

これを完全に防ぐためには、効用には上限(正確には上界)があると考える必要がある。つまり、ある金額を超えれば、効用はそれ以上増えない(あるいは、ほとんど増えず、上界を超えることがない)。これにより、どれだけ急激に賞金が増えても、効用の期待値は有限にとどまる。効用の上限は、金で買える全ての欲望を満たした状態を意味し、これを「至福水準」と呼ぶ。

発展的話題[編集]

このゲームが現実社会で行われないのは、数学的にも理由がある。

先に述べたように、賞金の期待値<math>W</math>は発散する。 それは以下のことを意味する。 第<math>n</math>回目の獲得賞金(<math>n</math>回コインを投げるという意味ではないことに注意。 <math>n</math>はこのゲームに何回参加したかを示す。)を<math>X_n</math>とすると、 <math>\forall W \in \real</math>に対して、

<math> \lim_{n \to \infty}P( |\frac{X_1+X_2+\ldots+X_n}{n}-W|<\epsilon )=1</math>

を満たす<math>\epsilon(>0)</math>は存在しない。

ではこの問題を拡張して、<math>\forall \epsilon>0</math>に対し、

<math> \lim_{n \to \infty}P( |\frac{X_1+X_2+\ldots+X_n}{f(n)}-W|<\epsilon )=1</math>

となるような関数<math>f</math>は存在しないのだろうか。実は、 <math>W=1</math>とすると、<math>f(n)=n log_2 n</math>ととることができることが知られている。 つまり、<math>\frac{X_1+X_2+\ldots+X_n}{n}</math>は<math>log_2 n</math>のように発散していく。 したがって、このゲームを公平に設定したければ、参加者は最初に何回このゲームに参加したいか を申告してもらい、その回数<math>n</math>に応じて参加費を<math>n log_2 n</math>とすればよいということになる。 このゲームは、参加費が非線形に、それも<math>n</math>が増加する以上に増加する特殊な財である。

具体的に考えてみよう。<math>n</math>は十分大きくなくてはならないので、仮に<math>n=1000</math> とする。 このゲームの販売店は、ゲーム1000回分をワンセットとして販売するのである。 このときの価格は、<math>10240(=1000 log_2 1000)</math>円程度になる。 一方、ゲーム参加権はまとめ買いするよりもバラで買ったほうが得なので、 消費者はバラで買おうとするだろう。すると、 販売店側としてはせっかく参加費を非線形化した意味がなくなってしまい、 やはりこの販売店は倒産してしまうのである。