偽陽性 - 暇つぶしWikipedia

偽陽性

.mw-parser-output .pathnavbox{clear:both;border:1px outset #eef;padding:0.3em 0.6em;margin:0 0 0.5em 0;background-color:#eef;font-size:90%}.mw-parser-output .pathnavbox ul{list-style:none none;margin-top:0;margin-bottom:0}.mw-parser-output .pathnavbox>ul{margin:0}.mw-parser-output .pathnavbox ul li{margin:0}

データサイエンス > 統計学 > 頻度主義統計学 > 仮説検定 > 第一種過誤と第二種過誤

データサイエンス > 機械学習 > 評価指標 > 第一種過誤と第二種過誤

第一種過誤（だいいっしゅかご、英: Type I error）または偽陽性（ぎようせい、英: False positive [1]）と第二種過誤（だいにしゅかご、英: Type II error）または偽陰性（ぎいんせい、英: False negative [2]）は、仮説検定において過誤を表す統計学用語である。第一種過誤をα過誤（α error）やあわてものの誤り [3]、第二種過誤をβ過誤（β error）やぼんやりものの誤り [3]とも呼ぶ。なお「過誤」とは、誤差によって二項分類などの分類を間違うことを意味する。
統計的過誤とシステム的過誤

過誤は次の2種類がある [4]。
統計的過誤（Statistical error）
計算や計測で得られた値と真の理論上の値との誤差が、無作為で本質的に予測不可能な変動によって生じている場合 [5]。
システム的過誤（Systematic error）
計算や計測で得られた値と真の理論上の値との誤差が、未知のソースによる無作為でない影響であり（不確かさ参照）、そのソースが特定されれば排除できる [5]。
統計的過誤: 第一種と第二種

統計学において、証拠を無に帰するような「帰無仮説」を置いて検証を進める。帰無仮説の例には、「個人は病気ではない」とか、「被告人は無実である」とか、「潜在的なログイン対象が認可されていない」などが挙げられる。

一方で、帰無仮説と全く逆の状況に対応する「対立仮説」がある(こちらが証明したい事象に対応する)。すなわち、「個人が病気にかかっている」とか、「被告人が有罪である」とか、「ログイン対象が許可されたユーザである」といったことを表す。

目標は、偽である帰無仮説が棄却されて真である対立仮説が採用されることである。ある種のテスト(血液検査、裁判、ログイン試み)を実施し、データを得る。

テストの結果は、陰性かもしれない（つまり、病気でない、有罪でない、ログインが許されない）。一方、それは陽性かもしれない（つまり、病気、有罪、ログイン成功）。

テストの結果と実際の状態が一致していないなら過誤が発生したことになる。テストの結果と実際の状態が一致しているなら、判断は正しいことになる。どちらの仮説を誤って採用してしまったかによって、過誤を「第一種過誤」と「第二種過誤」に分類する。
第一種過誤

第一種過誤（α過誤、偽陽性）は、帰無仮説が実際には真であるのに棄却してしまう過誤である。つまり、偽がヒットすることによるエラーである。先ほどの例で言えば「個人は病気ではない」のにも関わらず「個人が病気である」と判断してしまうことに相当する。
第二種過誤

第二種過誤（β過誤、偽陰性）は、対立仮説が実際には真であるのに帰無仮説を採用してしまう過誤である。つまり、真が抜け落ちることによるエラーである。対立仮説が正しい時に対立仮説を採択しない誤りのこと。先ほどの例で言えば「個人が病気である」のに「個人は病気でない」と判断してしまう事に相当する。
過誤の具体例

「真犯人を逮捕すること」を「帰無仮説を棄却すること」に例える。第一種過誤は「一般市民を冤罪で逮捕してしまうこと」である。第二種過誤は「真犯人を取り逃がすこと」を意味している。

刑事訴訟法336条で、「被告事件が罪とならないとき、又は被告事件について犯罪の証明がないときは、判決で無罪の言渡をしなければならない」と定めている。これは疑わしきは罰せずとも言う。第一種過誤を避けるような手法を採用することを推奨している [6]。他の分類については後述の過誤種別拡張の提案を参照されたい。
解説

仮説検定は、2つの標本の分布の違いが無作為な偶然性で説明できるかどうかを判定する技法である。2つの分布に有意な差があると結論付ける場合、その差異が無作為な偶然性では説明できないことを十分注意して判断する必要がある。真ではない仮説を採用する可能性をなるべく小さくするよう注意を払わなければならない。一般に第一種過誤となる確率を .05 か .01 に設定する。これはつまり100例のうち5例か1例で過誤が発生することを意味する。これを「有意水準」と呼ぶ。100例のうち5例というのが十分かどうかは一概には言えないため、有意水準の選択には細心の注意が必要である。例えば、シックス・シグマの品質管理を採用する工場では標準偏差の6倍の幅（±6σ）を管理限界とする（これを外れるのは極めて珍しい）。

統計的手法の利点は無作為な標本抽出にある。つまり、2つの分布の差が治療の前後でどう変化するかを無作為抽出で追跡可能である。しかし、現実がそれほど単純でないのは明らかである。無作為標本を取り出したとき、全く同じ分布となる可能性は極めて小さい。たとえ同じ分布であったとしても、それが偶然の産物なのか、それとも常にそうなるのかは判断できない。
語源

1928年、著名な統計学者のイェジ・ネイマン（1894年 - 1981年）とエゴン・ピアソン（1895年 - 1980年）は「特定の標本が、ある個体群から無作為に選ばれたと判断できるかどうかの判定」という問題を議論した [7]。そして、Davidは「'無作為な'という形容詞は標本の抽出方法に対するもので、標本そのものにかかるのではない」と指摘した [8]。

彼らは「過誤の2つの源泉」を次のように表した:

(a) 採択すべき仮説を棄却する過誤

(b) 棄却すべき仮説を採択する過誤 [9]

1930年、彼らは「過誤の2つの源泉」の概念を次のように練り直した:

…仮説検定では次の2点を常に考慮しなければならない。(1) 我々は、真の仮説を棄却してしまう可能性を必要に応じて低く抑えることができなければならない。(2) 偽と思われる仮説が棄却されるような検定でなければならない。 [10]

1933年、彼らはこれらの「問題は、仮説の真偽が確信を持って断言できるような場合には存在しない」と述べた [11]。

Size:58 KB
出典: フリー百科事典『ウィキペディア（Wikipedia）』
担当:undef