ナッシュ均衡 - 暇つぶしWikipedia

ナッシュ均衡

出典は列挙するだけでなく、脚注などを用いてどの記述の情報源であるかを明記してください。記事の信頼性向上にご協力をお願いいたします。（2016年5月）

ナッシュ均衡（ナッシュきんこう、英: Nash equilibrium）は、ゲーム理論における非協力ゲームの解の一種であり、いくつかの解の概念の中で最も基本的な概念である。数学者のジョン・フォーブス・ナッシュにちなんで名付けられた。

ナッシュ均衡は、他のプレーヤーの戦略を所与とした場合、どのプレーヤーも自分の戦略を変更することによってより高い利得を得ることができない戦略の組み合わせである。ナッシュ均衡の下では、どのプレーヤーも戦略を変更する誘因を持たない。

ナッシュ均衡は必ずしもパレート効率的ではない。その代表例が囚人のジレンマである。目次

 1 定義

 2 純粋戦略ゲームにおけるナッシュ均衡

 2.1 支配戦略均衡

 2.2 逐次消去による均衡

 2.3 純粋戦略ナッシュ均衡

 3 混合戦略ゲームにおけるナッシュ均衡

 4 参考文献

 4.1 論文

 4.2 書籍

 5 関連項目

 6 外部リンク

 定義

形式的な定義は次の通りである。標準型ゲーム G = (N, S, u) （N はプレーヤーの集合、 S = ∏ i ∈ N S i {\displaystyle S=\prod _{i\in N}S_{i}} は戦略の組の集合、 u = ( u i ) i ∈ N ( u i : S → R ) {\displaystyle u=(u_{i})_{i\in N}\;(u_{i}:S\rightarrow \mathbb {R} )} は効用の組）において、戦略の組 s ∗ ∈ S {\displaystyle s^{*}\in S} がナッシュ均衡であるとは、全てのプレーヤー i ∈ N {\displaystyle i\in N} と、全ての s i ∈ S i {\displaystyle s_{i}\in S_{i}} に対して、 u i ( s ∗ ) ≥ u i ( s i , s − i ∗ ) {\displaystyle u_{i}(s^{*})\geq u_{i}(s_{i},s_{-i}^{*})}

を満たすことである。

ただし、s−i は、i 以外のプレーヤーの戦略の組をさす。
純粋戦略ゲームにおけるナッシュ均衡
 支配戦略均衡「囚人のジレンマ」も参照

純粋戦略ゲーム (Pure strategy game) とは、参加者 (プレーヤー) が必ずどれかの戦略を選ぶゲームである。例えば、以下の表は、二人のプレーヤー Pa と Pb がそれぞれ戦略（A1 または A2）と（B1 または B2）を選べるときの、それぞれの利得を示す。並んだ数字の左側は Pa の利得、右側は Pb の利得である。

Pa/PbB1B2
A15, 22, 4
A24, 61, 6

まず Pa の利得に注目すると、Pb がどちらの戦略を選ぼうが、Pa は A1 戦略を選んだ方がより大きな利得を得ることができる。このような関係が成り立つとき、A1 は強支配戦略であると表現する。支配するとは、ある戦略を選ぶことが他方の戦略を選ぶより有利であるという意味である。

次に Pb の利得に注目すると、Pa がどちらに戦略を選んでも、B2 戦略を選んだ方が B1 戦略のとき以上の利得を得られる。Pa が A2 戦略を選んだ場合には B1 と B2 は同等になるので、このような関係のとき B2 は弱支配戦略であるという。

結果として、Pa にとっての最適戦略は A1、Pb にとっての最適戦略は B2 となり、両者ともここから戦略を変更しても利得は減る。この組み合わせ (A1, B2) が支配戦略均衡となる。

Pa、Pb が (A1, B2) という戦略をとった場合、Paは戦略を変更して A2 をとれば利得が 2 から 1 へ減少してしまうため、戦略を変更する誘因を持たない。同様に Pb も、戦略を変更して B1 をとれば利得が 4 から 2 へ減少してしまうため、戦略を変更する誘因を持たない。従ってこの例では支配戦略均衡はナッシュ均衡である。

なお、Pa、Pb が (A2, B1) という戦略をとった場合の利得は (4, 6) となり、ナッシュ均衡における利得と比べて Pa、Pb ともにより大きな利得を得ることができる。この場合、Pa がより大きな 5 の利得を得るため A1 に戦略を変更する誘因を持つため、ナッシュ均衡ではない。すなわち、このゲームは囚人のジレンマゲームである。

Size:32 KB
出典: フリー百科事典『ウィキペディア（Wikipedia）』
担当:undef