二項分布
[Wikipedia|▼Menu]

二項分布確率質量関数

累積分布関数

色は上図と同じ
母数 n ≥ 0 {\displaystyle n\geq 0} 試行回数(整数)
0 ≤ p ≤ 1 {\displaystyle 0\leq p\leq 1} 成功確率(実数)
{ 0 , … , n } {\displaystyle \{0,\dotsc ,n\}}
確率質量関数 ( n k ) p k ( 1 − p ) n − k {\displaystyle {\binom {n}{k}}p^{k}(1-p)^{n-k}}
累積分布関数 I 1 − p ( n − ⌊ k ⌋ , 1 + ⌊ k ⌋ ) {\displaystyle I_{1-p}{\bigl (}n-\lfloor k\rfloor ,1+\lfloor k\rfloor {\bigr )}}
(ただし I ( − ) ( − , − ) {\displaystyle I_{(-)}(-,-)} は正則化不完全ベータ関数
期待値 n p {\displaystyle np}
最頻値 { { ( n + 1 ) p − 1 , ( n + 1 ) p } ∩ { 0 , … , n } ( n + 1 ) p が 整 数 の 時 ⌊ ( n + 1 ) p ⌋ そ れ 以 外 {\displaystyle {\begin{cases}\{(n+1)p-1,(n+1)p\}\\\qquad \cap \{0,\dotsc ,n\}&(n+1)p{\text{が 整 数 の 時}}\\{\bigl \lfloor }(n+1)p{\bigr \rfloor }&{\text{そ れ 以 外}}\end{cases}}}
分散 n p ( 1 − p ) {\displaystyle np(1-p)}
歪度 1 − 2 p n p ( 1 − p ) {\displaystyle {\frac {1-2p}{\sqrt {np(1-p)}}}}
尖度 1 − 6 p ( 1 − p ) n p ( 1 − p ) {\displaystyle {\frac {1-6p(1-p)}{np(1-p)}}}
モーメント母関数 ( 1 − p + p e t ) n {\displaystyle (1-p+p\,e^{t})^{n}}
特性関数 ( 1 − p + p e i t ) n {\displaystyle (1-p+p\,e^{it})^{n}}
テンプレートを表示

数学において、二項分布(にこうぶんぷ、: binomial distribution)は、成功確率 p で成功か失敗のいずれかの結果となる試行ベルヌーイ試行と呼ばれる)を独立に n 回行ったときの成功回数を確率変数Xとする離散確率分布である。

二項分布に基づく統計的有意性の検定は、二項検定と呼ばれている。

二項分布の典型例を次に示す。全住民の5%がある感染症に罹患しており、その全住民の中から無作為に500人を抽出する。ただし住民は500人よりずっと多いとする。このとき、抽出された集団の中に罹患者が30人以上いる確率はどれくらいだろうか。

500人のうちの感染症患者の分布は、大抵の場合は全住民のうちの患者の分布(真の分布)とおおよそ似通っていると考えられる。しかし、低確率ではあるが、選んだ500人の中に1人も患者が含まれないような真の分布とかけ離れた分布が得られる場合もある。直観的には、真の分布に近い分布が得られる確率は、真の分布から遠い分布が得られる確率より大きい。たとえば、500人中の患者の数が500×0.05=25人である確率は、24人や26人である確率より大きいだろうと思われる。しかし、その確率は定量的にどれほどだろうか。 これを定量的に表すことのできる分布が二項分布である。

抽出された集団の中に含まれる罹患者数を確率変数 X で表すとき、X は n = 500, p = 0.05 の二項分布に近似的に従う。ここで、罹患者が30人以上いる確率は Pr[X ? 30] である。
定義

単純な定義としては、成功確率pの試行を独立にn回行い、成功回数を横軸にとってヒストグラムを作成した時のグラフの形である。このグラフの関数は下記の性質を持つ。

2つの母数p(0 ? p ? 1となる実数), n(自然数)に対して、0 以上の整数を値としてとる確率変数Xを定める。このとき、Xは試行の成功回数なので、(0 ? X ? n)である。

そして、X = xとなるような確率についての関数(確率質量関数)fX(x)について、 f X ( x ) = ( n x ) p x ( 1 − p ) n − x {\displaystyle f_{X}(x)={\binom {n}{x}}p^{x}(1-p)^{n-x}}

となることが性質よりわかる。

また、fX(x)は確率であるため、 ∑ x = 0 n f X ( x ) = 1 {\displaystyle \sum _{x=0}^{n}f_{X}(x)=1}

も明らかである。

上記を定義として、xをkに書き換え、 f X ( k ) = P ( X = k ) = ( n k ) p k ( 1 − p ) n − k {\displaystyle f_{X}(k)=P(X=k)={\binom {n}{k}}p^{k}(1-p)^{n-k}}

で与えられるとき、Xは二項分布B(n, p)に従う、という。これはX ? B(n, p)と表記される[1]

ここで、 ( n k ) = n C k = n ! k ! ( n − k ) ! {\displaystyle {\binom {n}{k}}={}_{n}\!\mathrm {C} _{k}={\frac {n!}{k!\,(n-k)!}}}

は n 個から k 個を選ぶ組合せの数、すなわち二項係数を表す。二項分布という名前は、この二項係数に由来している。

n = 1 の場合を特に、ベルヌーイ分布と呼ぶ。

上の定義式は次のように解釈することができる。1回の試行において成功する確率が p であるとき、pk は k 回成功する確率を表し、(1 − p)n−k は n − k 回失敗する確率を表している。ただし、k 回の成功は n 回の試行の中のどこかで発生したものであるから、nCk 通りの発生順序がある。これら全てを掛けると、n 回の独立な試行を行ったときの成功回数が k となる確率を求めることができる。
性質の導出
期待値・分散

二項分布 B(n, p) に従う確率変数 X に対し、X の期待値 E[X] を求めると E [ X ] = ∑ k = 0 n k f X ( k ) = ∑ k = 0 n k ( n k ) p k ( 1 − p ) n − k = ∑ k = 1 n k ( n k ) p k ( 1 − p ) n − k = ∑ k = 1 n k n ! ( n − k ) ! k ! p k ( 1 − p ) n − k = ∑ k = 1 n n ! ( n − k ) ! ( k − 1 ) ! p k ( 1 − p ) n − k = ∑ k = 1 n n ( n − 1 ) ! ( n − k ) ! ( k − 1 ) ! p p k − 1 ( 1 − p ) n − k = n p ∑ k = 1 n ( n − 1 ) ! ( n − k ) ! ( k − 1 ) ! p k − 1 ( 1 − p ) n − k {\displaystyle {\begin{aligned}E[X]&=\sum _{k=0}^{n}kf_{X}(k)\\&=\sum _{k=0}^{n}k{\binom {n}{k}}p^{k}(1-p)^{n-k}\\&=\sum _{k=1}^{n}k{\binom {n}{k}}p^{k}(1-p)^{n-k}\\&=\sum _{k=1}^{n}k{\frac {n!}{(n-k)!\,k!}}p^{k}(1-p)^{n-k}\\&=\sum _{k=1}^{n}{\frac {n!}{(n-k)!\,(k-1)!}}p^{k}(1-p)^{n-k}\\&=\sum _{k=1}^{n}n{\frac {(n-1)!}{(n-k)!\,(k-1)!}}pp^{k-1}(1-p)^{n-k}\\&=np\sum _{k=1}^{n}{\frac {(n-1)!}{(n-k)!\,(k-1)!}}p^{k-1}(1-p)^{n-k}\\\end{aligned}}}


次ページ
記事の検索
おまかせリスト
▼オプションを表示
ブックマーク登録
mixiチェック!
Twitterに投稿
オプション/リンク一覧
話題のニュース
列車運行情報
暇つぶしWikipedia

Size:66 KB
出典: フリー百科事典『ウィキペディア(Wikipedia)
担当:undef