真陰性
[Wikipedia|▼Menu]

第一種過誤(だいいっしゅかご、: Type I error)または偽陽性(ぎようせい、: False positive[1])と第二種過誤(だいにしゅかご、: Type II error)または偽陰性(ぎいんせい、: False negative[2])は、仮説検定において過誤を表す用語である。第一種過誤をα過誤(α error)やあわてものの誤り[3]、第二種過誤をβ過誤(β error)やぼんやりものの誤り[3]とも呼ぶ。なお「過誤」とは、誤差によって二項分類などの分類を間違うことを意味する。
目次

1 統計的過誤とシステム的過誤

2 統計的過誤: 第一種と第二種

2.1 第一種過誤

2.2 第二種過誤

2.3 過誤の具体例


3 解説

4 語源

5 統計学的扱い

5.1 定義

5.1.1 第一種過誤と第二種過誤

5.1.2 偽陽性率・第一種過誤

5.1.3 偽陰性率・第二種過誤



6 過誤種別拡張の提案

6.1 David

6.2 Mosteller

6.3 Kaiser

6.4 Kimball

6.5 MitroffとFeatheringham

6.6 Raiffa

6.7 MarascuiloとLevin


7 具体例

7.1 コンピュータ

7.2 スクリーニング

7.3 臨床検査

7.4 超常現象の調査


8 脚注

9 参考文献

10 関連項目

11 外部リンク

統計的過誤とシステム的過誤

過誤は次の2種類がある[4]
統計的過誤(Statistical error)
計算や計測で得られた値と真の理論上の値との誤差が、無作為で本質的に予測不可能な変動によって生じている場合[5]
システム的過誤(Systematic error)
計算や計測で得られた値と真の理論上の値との誤差が、未知のソースによる無作為でない影響であり(不確かさ参照)、そのソースが特定されれば排除できる[5]
統計的過誤: 第一種と第二種

統計学において、証拠を無に帰するような「帰無仮説」がある。例えば、個人が病気ではないとか、被告人が無実であるとか、潜在的なログイン対象が認可されていないことなどを表す。

一方で、帰無仮説と全く逆の状況に対応する「対立仮説」がある。すなわち、個人が病気にかかっているとか、被告人が有罪であるとか、ログイン対象が許可されたユーザであるといったことを表す。

目標は、偽である仮説が棄却されて真である仮説が採用されるようにすることである。ある種のテスト(血液検査、裁判、ログイン試み)を実施し、データを得る。

テストの結果は、陰性かもしれない(つまり、病気でない、有罪でない、ログインが許されない)。一方、それは陽性かもしれない(つまり、病気、有罪、ログイン成功)。

テストの結果と実際の状態が一致していないなら過誤が発生したことになる。テストの結果と実際の状態が一致しているなら、判断は正しいことになる。どちらの仮説を誤って採用してしまったかによって、過誤を「第一種過誤」と「第二種過誤」に分類する。
第一種過誤

第一種過誤(α過誤、偽陽性)は、帰無仮説が実際には真であるのに棄却してしまう過誤である。つまり、偽がヒットすることによるエラーである。
第二種過誤

第二種過誤(β過誤、偽陰性)は、対立仮説が実際には真であるのに帰無仮説を採用してしまう過誤である。つまり、真が抜け落ちることによるエラーである。対立仮説が正しい時に対立仮説を採択しない誤りのこと。
過誤の具体例

「真犯人を逮捕すること」を「帰無仮説を棄却すること」に例える。第一種過誤は「一般市民を冤罪で逮捕してしまうこと」である。第二種過誤は「真犯人を取り逃がすこと」を意味している。

刑事訴訟法336条で、「被告事件が罪とならないとき、又は被告事件について犯罪の証明がないときは、判決で無罪の言渡をしなければならない」と定めている。これは疑わしきは罰せずとも言う。第一種過誤を避けるような手法を採用することを推奨している[6]。他の分類については後述の過誤種別拡張の提案を参照されたい。
解説

仮説検定は、2つの標本の分布の違いが無作為な偶然性で説明できるかどうかを判定する技法である。2つの分布に有意な差があると結論付ける場合、その差異が無作為な偶然性では説明できないことを十分注意して判断する必要がある。真ではない仮説を採用する可能性をなるべく小さくするよう注意を払わなければならない。一般に第一種過誤となる確率を .05 か .01 に設定する。これはつまり100例のうち5例か1例で過誤が発生することを意味する。これを「有意水準」と呼ぶ。100例のうち5例というのが十分かどうかは一概には言えないため、有意水準の選択には細心の注意が必要である。例えば、シックス・シグマの品質管理を採用する工場では標準偏差の6倍の幅(±6σ)を管理限界とする(これを外れるのは極めて珍しい)。

統計的手法の利点は無作為な標本抽出にある。つまり、2つの分布の差が治療の前後でどう変化するかを無作為抽出で追跡可能である。しかし、現実がそれほど単純でないのは明らかである。無作為標本を取り出したとき、全く同じ分布となる可能性は極めて小さい。たとえ同じ分布であったとしても、それが偶然の産物なのか、それとも常にそうなるのかは判断できない。
語源

1928年、著名な統計学者のイェジ・ネイマン(1894年 - 1981年)とエゴン・ピアソン(1895年 - 1980年)は「特定の標本が、ある個体群から無作為に選ばれたと判断できるかどうかの判定」という問題を議論した[7]。そして、Davidは「'無作為な'という形容詞は標本の抽出方法に対するもので、標本そのものにかかるのではない」と指摘した[8]

彼らは「過誤の2つの源泉」を次のように表した:

(a) 採択すべき仮説を棄却する過誤

(b) 棄却すべき仮説を採択する過誤[9]

1930年、彼らは「過誤の2つの源泉」の概念を次のように練り直した:

…仮説検定では次の2点を常に考慮しなければならない。(1) 我々は、真の仮説を棄却してしまう可能性を必要に応じて低く抑えることができなければならない。(2) 偽と思われる仮説が棄却されるような検定でなければならない。 [10]

1933年、彼らはこれらの「問題は、仮説の真偽が確信を持って断言できるような場合には存在しない」と述べた[11]。彼らはまた、「対立仮説群」[12]から特定の仮説を棄却または採用する決定において、過誤が容易に発生するとした。

…(そして)それらの過誤は以下の2種類に分けられる:

(I) Ho(すなわち検定対象の仮説)が真であるのに棄却する。

(II) 代替の仮説 Hi が真であるのに Ho を採択した[11]

ネイマンとピアソンの共同執筆論文では、Ho が常に「検定対象仮説」を表[13]。添え字は "O" であってゼロではない(「オリジナル」の意)。

同じ論文[14]で、彼らは「2つの過誤の源泉」を第一種の過誤(errors of type I)および第二種の過誤(errors of type II)と呼んでいる[15]
統計学的扱い
定義
第一種過誤と第二種過誤

ネイマンとピアソンによる過誤の定義は広く採用され、第一種過誤と第二種過誤として知られている。また、分かり易さから、これらをそれぞれ偽陽性と偽陰性とも呼ぶことが多い。これらの用語は本来の定義から拡大解釈され、様々な場面で使われるようになっている。例えば、

第一種過誤(偽陽性): 受諾(受理)されるべき帰無仮説を拒絶(却下)する過誤。例えば、無実の人物を有罪にすること。

第二種過誤(偽陰性): 拒絶(却下)されるべき帰無仮説を受諾(受理)する過誤。例えば、真犯人を無罪にすること。

上の例は、この拡大された定義での曖昧さを示している。ここでは「無罪であること」を中心に考えているが、当然ながら「有罪であること」を中心に考えることもできる。以下の表で条件を示す。

 実際の状態
有無
テスト
 結果 陽性状態「有」 + 結果「陽性」
= 真陽性状態「無」 + 結果「陽性」
= 偽陽性
第一種過誤
 陰性 状態「有」 + 結果「陰性」
= 偽陰性


次ページ
記事の検索
おまかせリスト
▼オプションを表示
ブックマーク登録
mixiチェック!
Twitterに投稿
オプション/リンク一覧
話題のニュース
列車運行情報
暇つぶしWikipedia

Size:59 KB
出典: フリー百科事典『ウィキペディア(Wikipedia)
担当:undef