層化抽出法 - 暇つぶしWikipedia

層化抽出法

この記事は検証可能な参考文献や出典が全く示されていないか、不十分です。出典を追加して記事の信頼性向上にご協力ください。（このテンプレートの使い方）
出典検索?: "層化抽出法" ? ニュース・書籍・スカラー・ CiNii ・ J-STAGE ・ NDL ・ dlib.jp ・ジャパンサーチ・ TWL（2023年12月）

層化抽出法（そうかちゅうしゅつほう、英: stratified sampling）とは、統計学における母集団からの標本調査の手法のひとつ。
概要

部分母集団が互いに大きく異なるとき、各部分母集団（層）毎にサンプルを抽出することに意味がある。層化(Stratification)とは、母集団を相対的に同質なグループに分けるプロセスであり、サンプリングの前に行われる。層は相互排他的である。すなわち母集団の要素はいずれか1つの層にのみ属する。層は集合的網羅的でもある。すなわち各要素は必ずいずれかの層に属する。各層からの抽出は無作為あるいは機械的に行われる。層化抽出法はしばしば標本誤差を減らし、サンプルの質を高める。単純な無作為抽出で得られる算術平均よりも変動の少ない加重平均を生成することができる。

以下のような戦略がある:
比例割当: 母集団と各層の比率と比例する抽出数を各層に割り当てる。ある母集団で男性が60%、女性が40%だったとき、この比率に合わせて男性と女性の抽出数を決定する。

最適割当: 母集団の各層をある変数の標準偏差で分ける。そして、分散の大きい層の抽出数を多くする。

層化抽出法を使った実例としてアメリカの政治世論調査がある。アメリカ合衆国の市民の多様性を反映するような調査結果を得るため、人種や宗教など様々な少数グループを含むようサンプルが抽出される必要がある。そのため層化抽出法による調査は単純無作為抽出法や系統的抽出法よりも民意を反映していると言われる。

同様に、ある地域の人口密度のばらつきが大きい場合、層化抽出法によって地域ごとの同等の正確さで推定することを保証できる。例えば、オンタリオ州は南北で人口密度に大きな差がある（南部が高密度）。このため単純に無作為抽出すると北部からは意味のある標本数が得られない可能性がある。最適割当による層化抽出法を使えば、北部の抽出率を高くするなどの手法が採れるだろう。
長所

重要な部分母集団に集中し、無関係なものを無視できる。

推定の正確さを高めることができる。

効率が良い。

各層の仮説検定の検定力を同等にするために、サイズの異なる各層から同数のサンプルを抽出するなどの手法もある。

短所

適切な層化変数（層を分ける基準）を選びづらい場合がある。

サブグループ内が同質といえない場合、有益でない。

コストがかかる可能性がある。

母集団に関する正確な情報を必要とし、さもなくば偏りを生じる。

各層のサンプル数の選択