確率密度関数
[Wikipedia|▼Menu]
標準正規分布箱ひげ図および確率密度関数 N(0, σ2)

確率密度関数(かくりつみつどかんすう、(: probability density function、PDF)とは、確率論において、連続型確率変数がある値をとるという事象の確率密度を記述する関数である。確率変数がある範囲の値をとる確率を、その範囲にわたって確率密度関数を積分することにより得ることができるよう定義される。確率密度関数の値域は非負の実数であり、定義域全体を積分すると1である。

例えば単変数の確率密度関数を平面上のグラフに表現して、x軸に確率変数の値を、y軸に確率密度を採った場合、求めたい範囲(x値)の下限値と上限値での垂直線と、変数グラフ曲線と y = 0 の直線とで囲まれる範囲の面積が確率になる。

「確率分布関数」 (probability distribution function)[1] あるいは「確率関数」 (probability function)[2] という用語は、具体的に何を指しているか現時点でも定義が曖昧であり、確率論研究者や統計学者の間では、その意味が標準的でないとされる場合がある。

他の資料に拠れば「確率密度関数」は値の集合に対する関数として定義されたり、累積分布関数との関係で言及されたり、確率質量関数の意味で使われたりする。さらには、密度関数 (density function) という用語が確率質量関数の意味で用いられている場合もある[3]

例として、寿命が4?6時間程度のバクテリアがいると仮定する。この時、特定のバクテリアが丁度 5時間で死亡する確率はどれ位だろうか? 答えは0%である。およそ5時間で寿命を迎えるバクテリアはたくさん居るが、正確に5.0000000000…時間で死ぬことはない。

一方で、5?5.01時間で死亡する確率はどうだろうか? 例えば、これが2%だとする。では、その.mw-parser-output .sfrac{white-space:nowrap}.mw-parser-output .sfrac.tion,.mw-parser-output .sfrac .tion{display:inline-block;vertical-align:-0.5em;font-size:85%;text-align:center}.mw-parser-output .sfrac .num,.mw-parser-output .sfrac .den{display:block;line-height:1em;margin:0 0.1em}.mw-parser-output .sfrac .den{border-top:1px solid}.mw-parser-output .sr-only{border:0;clip:rect(0,0,0,0);height:1px;margin:-1px;overflow:hidden;padding:0;position:absolute;width:1px}1/10の範囲の5?5.001時間である確率は? 答えはおよそ 2% × 1/10 = 0.2% となる。さらにその 1/10 の範囲の5?5.0001時間である確率は、およそ0.02%である。

上記の3例において、『「特定の時間範囲内に死亡する確率」を「その範囲の長さ」で割った値』に着目すると、1時間につき 2 に定まることが分かる。例えば、5?5.01時間の0.01時間の範囲でバクテリアが死亡する確率は0.02であり、確率 0.02 ÷ 0.01時間 = 2時間−1 である。この2時間−1(毎時200%)という量を、5時間時点での確率密度と呼ぶ。

従って、「バクテリアの寿命が5時間である確率」を問われた時、真の答えは0%であるが、より実用的には、2時間−1 dt であると言える。これは、無限小の時間範囲 dt 内で、バクテリアが死亡する確率である。例えば、丁度5時間?5時間 + 1ナノ秒の寿命である確率は、2時間−1 × 1ナノ秒 ? 6 × 10−13 である。

これを確率密度関数 f を用いて、f(5時間)= 2時間−1 と表現することができる。f を任意の時間範囲(微小に限らない)で積分することで、当該時間範囲内でバクテリアの寿命が尽きる確率を求めることができる。
絶対連続確率分布での定義「連続確率分布」も参照

絶対連続確率分布では確率密度関数が存在する。確率変数 X の確率密度関数 fX を考え、fX が非負のルベーグ可積分な関数であるとする。ここで、 P ⁡ ( a ≤ X ≤ b ) = ∫ a b f X ( x ) d x {\displaystyle \operatorname {P} (a\leq X\leq b)=\int _{a}^{b}f_{X}(x)\,dx}

である。従って、もし FX を X の累積分布関数とすると、 F X ( x ) = ∫ − ∞ x f X ( u ) d u {\displaystyle F_{X}(x)=\int _{-\infty }^{x}f_{X}(u)\,du}

となり、 f X ( x ) = d d x F X ( x ) {\displaystyle f_{X}(x)={\frac {d}{dx}}F_{X}(x)}

となる。直観的に、微小区間 [x, x + dx] に含まれる値を X がとる確率は fX(x)dx であると分かる。
正式な定義(この定義は確率の公理によりあらゆる確率分布に拡張できる。)

完全加法族 ( X , A ) {\displaystyle ({\mathcal {X}},{\mathcal {A}})} (通常、Rn に可測集合としてボレル集合を考えたもの)中に存在する確率変数 X は、 ( X , A ) {\displaystyle ({\mathcal {X}},{\mathcal {A}})} 中に測度 X?P で確率分布する。 ( X , A ) {\displaystyle ({\mathcal {X}},{\mathcal {A}})} 中の標準測度 μ に関する X の密度は、ラドン=ニコディムの定理より f = d X ∗ P d μ {\displaystyle f={\frac {dX_{*}P}{d\mu }}}


次ページ
記事の検索
おまかせリスト
▼オプションを表示
ブックマーク登録
mixiチェック!
Twitterに投稿
オプション/リンク一覧
話題のニュース
列車運行情報
暇つぶしWikipedia

Size:71 KB
出典: フリー百科事典『ウィキペディア(Wikipedia)
担当:undef