分位数
[Wikipedia|▼Menu]

分位数(ぶんいすう)、分位点(ぶんいてん)、分位値(ぶんいち)、クォンタイル (: quantile) は、統計の代表値の1種である。

実数 q ∈ [ 0 , 1 ] {\displaystyle q\in [0,1]} に対し、q 分位数 (q-quantile) は、分布を q : 1 − q {\displaystyle q:1-q} に分割する値である。

ある種の正の整数 m {\displaystyle m} に対し、分布を m {\displaystyle m} 等分する m − 1 {\displaystyle m-1} 個の値、つまり、 i = 1 , … , m − 1 {\displaystyle i=1,\dotsc ,m-1} に対する i / m {\displaystyle i/m} 分位数を、m 分位数(ただし m {\displaystyle m} は漢数字)という。 i = 1 , … , m − 1 {\displaystyle i=1,\dotsc ,m-1} 番目の m 分位数を第 i m 分位数といい、また、 m {\displaystyle m} 等分された分布の k = 1 , … , m {\displaystyle k=1,\dotsc ,m} 番目の部分を、第 k m 分位、または単に第 k 分位という。

ただし、英語のquantileには、等分割する値(value)の意味と、そのようにして分割された群(group)の二つの意味がある[1]
定義
変量統計における分位数

n {\displaystyle n} 個のデータ x {\displaystyle x} に対する q 分位数 Q q {\displaystyle Q_{q}} は、昇順にソートしたデータを x 1 ≤ x 2 ≤ ⋯ ≤ x n {\displaystyle x_{1}\leq x_{2}\leq \dotsb \leq x_{n}} とすると、 Q q = x ( 1 − q + q n ) x ( t ) = { x t , if  t ∈ N ( ⌈ t ⌉ − t ) x ⌊ t ⌋ + ( t − ⌊ t ⌋ ) x ⌈ t ⌉ , if  t ∉ N {\displaystyle {\begin{aligned}Q_{q}&=x(1-q+qn)\\x(t)&={\begin{cases}x_{t},&{\text{if }}t\in \mathbb {N} \\(\lceil t\rceil -t)x_{\lfloor t\rfloor }+(t-\lfloor t\rfloor )x_{\lceil t\rceil },&{\text{if }}t\notin \mathbb {N} \end{cases}}\end{aligned}}}

と定義される。ここで、 ⌊ ⋅ ⌋ {\displaystyle \lfloor \cdot \rfloor } は床関数、 ⌈ ⋅ ⌉ {\displaystyle \lceil \cdot \rceil } は天井関数、 N {\displaystyle \mathbb {N} } は自然数の集合である。

関数 x ( t ) ,   1 ≤ t ≤ n {\displaystyle x(t),\ 1\leq t\leq n} は、数列 x 1 , … , n {\displaystyle x_{1,\dotsc ,n}} の線形内挿数関数への拡張である。関数 x ( ⋅ ) {\displaystyle x(\cdot )} の引数 1 − q + q n {\displaystyle 1-q+qn} は、範囲 [ 1 , n ] {\displaystyle [1,n]} を q : 1 − q {\displaystyle q:1-q} に内分している。
確率分布の分位数

1次元確率分布 f ( x ) {\displaystyle f(x)} に対する q 分位数 Q q {\displaystyle Q_{q}} は ∫ − ∞ Q q f ( x ) d x ≥ q ,   ∫ Q q ∞ f ( x ) d x ≥ 1 − q {\displaystyle \int _{-\infty }^{Q_{q}}f(x)dx\geq q,\ \int _{Q_{q}}^{\infty }f(x)dx\geq 1-q}

を満たす値として定義される。この式は、累積分布関数 F ( x ) {\displaystyle F(x)} または確率 P ( X ) {\displaystyle P(X)} を使って、 ∫ − ∞ Q q d F ( x )   ≥ q ,   ∫ Q q ∞ d F ( x )   ≥ 1 − q {\displaystyle \int _{-\infty }^{Q_{q}}dF(x)\ \geq q,\ \int _{Q_{q}}^{\infty }dF(x)\ \geq 1-q}

または P ( X ≤ Q q ) ≥ q ,   P ( X ≥ Q q ) ≥ 1 − q {\displaystyle P(X\leq Q_{q})\geq q,\ P(X\geq Q_{q})\geq 1-q}

とも表せる[2]


次ページ
記事の検索
おまかせリスト
▼オプションを表示
ブックマーク登録
mixiチェック!
Twitterに投稿
オプション/リンク一覧
話題のニュース
列車運行情報
暇つぶしWikipedia

Size:40 KB
出典: フリー百科事典『ウィキペディア(Wikipedia)
担当:undef