この記事は検証可能な参考文献や出典が全く示されていないか、不十分です。出典を追加して記事の信頼性向上にご協力ください。(このテンプレートの使い方)
出典検索?: "仮説検定"
仮説検定(かせつけんてい、英: hypothesis testing)あるいは統計的仮説検定 (statistical hypothesis testing)[補 1] とは、母集団分布の母数に関する仮説を標本から検証する統計学的方法の一つ。日本産業規格では、仮説 (statistical hypothesis) を「母数又は確率分布についての宣言。帰無仮説と対立仮説がある。」と定義している[1]。検定 (statistical test) を「帰無仮説を棄却し対立仮説を支持するか、又は帰無仮説を棄却しないかを観測値に基づいて決めるための統計的手続き。その手続きは、帰無仮説が成立しているにもかかわらず棄却する確率が α 以下になるように決められる。この α を有意水準という。」と定義している[2]。
統計的仮説検定の方法論は、イェジ・ネイマンとエゴン・ピアソン流の頻度主義統計学に基づくもの[補 2]と、ベイズ主義統計学に基づくものとの二つに大きく分けられる[3]。ただし「仮説検定」という場合、前者だけを指すことがある。本項では前者および日本産業規格での定義を説明する。 統計的仮説検定においては、仮説が正しいと仮定した上で、それに従う母集団から、実際に観察された標本が抽出される確率を求め、その値により判断を行う。その確率が十分に(予め決めておいた値より)小さければ、その仮説を棄却する(すなわち仮説は成り立ちそうもないと判断する)。 統計的仮説検定は次のような手順で実施する。 仮説が正しいと仮定した場合にその標本が観察される確率を算出できるように、仮説を統計学的に表現する。検定は下記の二者択一となり、帰無仮説[補 3]を棄却できるかどうかを調べる。 例として、偽薬(プラセボ)に対する薬の試験(「薬の効果を有意的に主張できるか」を調べる)を例にとれば、 標本データから、仮説に関係した情報を要約する検定統計量を計算する。下記のように十分性を持つ統計量(十分統計量)が存在すればそれを計算する。単純二仮説の場合は、尤度比が仮説検定の十分統計量となる。 母数に対応する十分統計量は、母集団の確率分布が指数型分布族である場合にのみ存在する[要出典]。例で言えば、指数型分布族で、2つの標本平均の差 m1 − m2 は十分統計量である。 帰無仮説に基づき、検定統計量の確率分布を明らかにする。 例では、標本平均の差は正規分布に従い、その標準偏差は母標準偏差に 1 n 1 + 1 n 2 {\displaystyle {\sqrt {{\frac {1}{n_{1}}}+{\frac {1}{n_{2}}}}}} をかけたもの(ここで n1 と n2 は各標本のサイズ)である。 可能な全ての値の集合の中で、帰無仮説に反する極端な範囲(分布関数をグラフ表示した場合には、裾に当たる部分)を選ぶ。これは検定統計量の危険域
統計的仮説検定の手順
仮説の設定
帰無仮説
価値がない[4]、何の関係もない、差異はみられない、仮説などそもそもなかった、などを意味するもの。普通 H0 と書く[5]。
対立仮説(英語版
帰無仮説に対立するので、対立仮説と呼ばれる。帰無仮説が棄却された際に採択される。普通仮説を意味する [hypothesis] の頭文字を用いて H1 と書く[6]。帰無仮説の正しさを求めるように検定を進めるが、成り立つか知りたいのはこちらの方である。
仮説の設定例
帰無仮説は、「薬の効果を主張できない」に当たり、下記のように仮説を立てる。
「薬に対する反応の平均がプラセボに対するそれと等しい。」[補 4]
対立仮説は、「薬の効果を主張できる」に当たり、下記の仮説に相当する。
「薬に対する反応の平均がプラセボに対するそれとは異なる。」
統計量の算出
統計量の確率分布
危険域の設定
Size:49 KB
出典: フリー百科事典『ウィキペディア(Wikipedia)』
担当:undef