標準偏差
[Wikipedia|▼Menu]
平均は同じであるが標準偏差が大きく異なるデータヒストグラムの例。赤で示されたデータの方が青で示されたデータよりも標準偏差が小さい。平均 0, 標準偏差 σ の正規分布確率密度関数。この分布に従う確率変数が 0 ± σ の間に値をとる確率はおよそ 68% であることが読み取れる。

標準偏差(ひょうじゅんへんさ、(: standard deviation, SD)とは、データ確率変数の、平均値からの散らばり具合(ばらつき)を表す指標の一つである。偏差ベクトルと、値が標準偏差のみであるベクトルは、ユークリッドノルムが等しくなる。

標準偏差を2乗したのが分散であり、従って、標準偏差は分散の非負の平方根である[1]。標準偏差が 0 であることは、データの値が全て等しいことと同値である。

母集団や確率変数の標準偏差を σ で、標本の標準偏差を s で表すことがある。

二乗平均平方根 (RMS) を用いると、標準偏差は偏差の二乗平均平方根に等しくなる。
概要

データ x1, x2, …, xn の平均値からの散らばり具合を数値にした標準偏差は、次の式で定義される: s = 1 n ∑ i = 1 n ( x i − x ¯ ) 2 {\displaystyle s={\sqrt {{\frac {1}{n}}\textstyle \sum \limits _{i=1}^{n}(x_{i}-{\overline {x}})^{2}}}}

ここで x は平均値を表す。この定義は、データを数ベクトルと見て、「散らばり具合」を偏差ベクトルのユークリッドノルムととらえる考えに基づく(このことより平均偏差でなく自乗平均をとる)。もとのデータ x を、平均値、「散らばり具合」を変えず、偏差が全て同じであるように取り直したデータ y を考える。x の大きさが奇数のときは、x を、自分自身2個を併せたデータ(大きさは偶数)に取り直す(そうしても平均値、「散らばり具合」は変わらない)。y の偏差ベクトルは (±s, ±s, …, ±s) (s ? 0) の形になる。x と y の「散らばり具合」が等しいことから、 ‖ x − x ¯ ‖ = ‖ ( ± s , ⋯ , ± s ) ‖ {\displaystyle \|{\boldsymbol {x}}-{\overline {\boldsymbol {x}}}\|=\|(\pm s,\cdots ,\pm s)\|} n s 2 = ∑ i = 1 n ( x i − x ¯ ) 2 {\displaystyle ns^{2}=\textstyle \sum \limits _{i=1}^{n}(x_{i}-{\overline {x}})^{2}} s = 1 n ∑ i = 1 n ( x i − x ¯ ) 2 {\displaystyle s={\sqrt {{\frac {1}{n}}\textstyle \sum \limits _{i=1}^{n}(x_{i}-{\overline {x}})^{2}}}} //

標準偏差は平方根を取るため、簡単な計算法則が成り立ちにくいという特徴がある。そこで分散 s2 を s 2 = 1 n ∑ i = 1 n ( x i − x ¯ ) 2 {\displaystyle s^{2}={\frac {1}{n}}\textstyle \sum \limits _{i=1}^{n}(x_{i}-{\overline {x}})^{2}}

で定義する。分散には簡単な計算法則がいくつか成り立つことから、種々の標準偏差ができるようになる。詳細は「分散 (統計学)」を参照

標準偏差の概念は、イギリス統計学フランシス・ゴルトンにより、親子の身長の相関関係を調べる中で初めて見出された[2]


次ページ
記事の検索
おまかせリスト
▼オプションを表示
ブックマーク登録
mixiチェック!
Twitterに投稿
オプション/リンク一覧
話題のニュース
列車運行情報
暇つぶしWikipedia

Size:65 KB
出典: フリー百科事典『ウィキペディア(Wikipedia)
担当:undef