この記事は検証可能な参考文献や出典が全く示されていないか、不十分です。出典を追加して記事の信頼性向上にご協力ください。(このテンプレートの使い方)
出典検索?: "確率分布"
確率分布(かくりつぶんぷ、英: probability distribution)は、確率変数に対して、各々の値をとる確率全体を表したものである。日本産業規格では、「確率変数がある値となる確率,又はある集合に属する確率を与える関数」と定義している[1]。 例えば、「サイコロ2個を振ったときの出た目の和」は確率変数である。この確率変数 X に対する分布は次の表のようになる。 X の取る値 n23456789101112 すなわち、離散型確率変数である場合は、確率分布とは確率変数の値にその確率(確率質量)を対応させる関数(確率質量関数)のことであると言うこともできる。しかし、例えば「次に電話がなるまでの時間」といった、連続型確率変数の場合は、確率変数値での確率が全て 0 となり、確率分布を確率質量関数で表すことができない。 「次に電話がなるまでの時間」は確率変数である。この確率変数 X の分布が次のようになったとする。 X の値が取る範囲 I1時間以内1?2時間後2?3時間後3?4時間後4時間以上先 この場合の確率を全て表すには、全ての連続区間での確率を求めることになる。次の電話が a - b 時間後になる確率は次の式で表せる: P ( a < X ≤ b ) = ( 1 2 ) a − ( 1 2 ) b {\displaystyle P(a<X\leq b)=\left({\frac {1}{2}}\right)^{a}-\left({\frac {1}{2}}\right)^{b}} 累積分布関数 FX を F X ( t ) = P ( X ≤ t ) = { 1 − ( 1 2 ) t , t ≥ 0 0 , t < 0 {\displaystyle F_{X}(t)=P(X\leq t)={\begin{cases}1-\left({\frac {1}{2}}\right)^{t},&t\geq 0\\0,&t<0\end{cases}}} で定めれば、 P ( a < X ≤ b ) = F X ( b ) − F X ( a ) {\displaystyle P(a<X\leq b)=F_{X}(b)-F_{X}(a)} のように、一変数関数で分布を表現できるので便利である。さらに、FX の導関数 fX は確率密度関数と呼ばれ、確率は積分を用いて P ( a < X ≤ b ) = ∫ a b f X ( t ) d t {\displaystyle P(a<X\leq b)=\int _{a}^{b}f_{X}(t)\,dt} と書ける。 通常、連続値をとる確率変数の分布は確率密度関数を用いて記述される。なぜなら、確率密度関数は初等関数で書けるが、累積分布関数は書けない場合が多いからである。
概要
P(X の値が n を取る).mw-parser-output .sfrac{white-space:nowrap}.mw-parser-output .sfrac.tion,.mw-parser-output .sfrac .tion{display:inline-block;vertical-align:-0.5em;font-size:85%;text-align:center}.mw-parser-output .sfrac .num,.mw-parser-output .sfrac .den{display:block;line-height:1em;margin:0 0.1em}.mw-parser-output .sfrac .den{border-top:1px solid}.mw-parser-output .sr-only{border:0;clip:rect(0,0,0,0);height:1px;margin:-1px;overflow:hidden;padding:0;position:absolute;width:1px}1/362/363/364/365/366/365/364/363/362/361/36
P(X が I の範囲の値を取る)1/21/41/81/161/16
単に確率分布というときは、d次元ユークリッド空間などのよく使われる可測空間上で定義された確率測度のことをいう。ただの確率測度と違って空間に散らばっている様子がグラフなどの目に見える形で表現できるので「分布」と呼ばれる。
確率論で、確率変数の分布を考えるのは、その変数だけを確率論的な議論の対象にしたい場合である。例えば、確率変数がある値を取る確率や、期待値、分散といった量は変数の分布が分かれば計算できる量である。逆に分布を考えることによって隠れた変数 ω[注 1] と確率変数との対応関係は失われてしまい、他の確率変数との関連性も不明になる。例えば、確率変数 X と Y の分布がそれぞれ PX と PY のように与えられたとしても、2つの変数の関連性は分からないので、X + Y がある値を取る確率や、積 XY の期待値、X + Y の分散といった量は計算できない。このような量を計算したいときは、X と Y の同時確率分布 PX,Y が必要となる。
よく使われる確率分布には、それぞれ名前がついており、性質がよく研究されている。このような分布をもつ確率変数に対して、研究の結果を利用することができる。例えば、確率変数の分布が平均 0、分散 1 の正規分布だった場合、その変数が 2 以上の値を取る確率は数表から 2.28% である。
定義
確率分布
1次元確率分布とは可測空間 ( R , B ( R ) ) {\displaystyle (\mathbb {R} ,{\mathcal {B}}(\mathbb {R} ))} 上で定義された確率測度のことである。
同様に d 次元確率分布とは ( R d , B ( R d ) ) {\displaystyle (\mathbb {R} ^{d},{\mathcal {B}}(\mathbb {R} ^{d}))} 上で定義された確率測度のことである。
なお、 B ( R d ) {\displaystyle {\mathcal {B}}(\mathbb {R} ^{d})} は R d {\displaystyle \mathbb {R} ^{d}} 上のボレル集合族(集合演算で閉じた部分集合族の一種)である。 実数値確率変数 X の確率分布 P X : B ( R ) → [ 0 , 1 ] {\displaystyle P_{X}:{\mathcal {B}}(\mathbb {R} )\to [0,1]} を P X ( A ) = P ( X ∈ A ) , A ∈ B ( R ) {\displaystyle P_{X}(A)=P(X\in A),\ \ \ A\in {\mathcal {B}}(\mathbb {R} )} で定義する。PX は確率測度(像測度
確率変数の確率分布
同様に R d {\displaystyle \mathbb {R} ^{d}} 値確率変数 X の確率分布 P X : B ( R d ) → [ 0 , 1 ] {\displaystyle P_{X}:{\mathcal {B}}(\mathbb {R} ^{d})\to [0,1]} は P X ( A ) = P ( X ∈ A ) , A ∈ B ( R d ) {\displaystyle P_{X}(A)=P(X\in A),\ \ \ A\in {\mathcal {B}}(\mathbb {R} ^{d})}
で定義される確率測度である。
確率変数 X の確率分布が μ であるとき、X は μ に従う確率変数であるといい、記号で X ~ μ と書く[2]。