層化抽出法
[Wikipedia|▼Menu]
.mw-parser-output .ambox{border:1px solid #a2a9b1;border-left:10px solid #36c;background-color:#fbfbfb;box-sizing:border-box}.mw-parser-output .ambox+link+.ambox,.mw-parser-output .ambox+link+style+.ambox,.mw-parser-output .ambox+link+link+.ambox,.mw-parser-output .ambox+.mw-empty-elt+link+.ambox,.mw-parser-output .ambox+.mw-empty-elt+link+style+.ambox,.mw-parser-output .ambox+.mw-empty-elt+link+link+.ambox{margin-top:-1px}html body.mediawiki .mw-parser-output .ambox.mbox-small-left{margin:4px 1em 4px 0;overflow:hidden;width:238px;border-collapse:collapse;font-size:88%;line-height:1.25em}.mw-parser-output .ambox-speedy{border-left:10px solid #b32424;background-color:#fee7e6}.mw-parser-output .ambox-delete{border-left:10px solid #b32424}.mw-parser-output .ambox-content{border-left:10px solid #f28500}.mw-parser-output .ambox-style{border-left:10px solid #fc3}.mw-parser-output .ambox-move{border-left:10px solid #9932cc}.mw-parser-output .ambox-protection{border-left:10px solid #a2a9b1}.mw-parser-output .ambox .mbox-text{border:none;padding:0.25em 0.5em;width:100%;font-size:90%}.mw-parser-output .ambox .mbox-image{border:none;padding:2px 0 2px 0.5em;text-align:center}.mw-parser-output .ambox .mbox-imageright{border:none;padding:2px 0.5em 2px 0;text-align:center}.mw-parser-output .ambox .mbox-empty-cell{border:none;padding:0;width:1px}.mw-parser-output .ambox .mbox-image-div{width:52px}html.client-js body.skin-minerva .mw-parser-output .mbox-text-span{margin-left:23px!important}@media(min-width:720px){.mw-parser-output .ambox{margin:0 10%}}

この記事は検証可能参考文献や出典が全く示されていないか、不十分です。出典を追加して記事の信頼性向上にご協力ください。(このテンプレートの使い方
出典検索?: "層化抽出法" ? ニュース ・ 書籍 ・ スカラー ・ CiNii ・ J-STAGE ・ NDL ・ dlib.jp ・ ジャパンサーチ ・ TWL(2023年12月)

層化抽出法(そうかちゅうしゅつほう、: stratified sampling)とは、統計学における母集団からの標本調査の手法のひとつ。
概要

部分母集団が互いに大きく異なるとき、各部分母集団()毎にサンプルを抽出することに意味がある。層化(Stratification)とは、母集団を相対的に同質なグループに分けるプロセスであり、サンプリングの前に行われる。層は相互排他的である。すなわち母集団の要素はいずれか1つの層にのみ属する。層は集合的網羅的でもある。すなわち各要素は必ずいずれかの層に属する。各層からの抽出は無作為あるいは機械的に行われる。層化抽出法はしばしば標本誤差を減らし、サンプルの質を高める。単純な無作為抽出で得られる算術平均よりも変動の少ない加重平均を生成することができる。

以下のような戦略がある:
比例割当: 母集団と各層の比率と比例する抽出数を各層に割り当てる。ある母集団で男性が60%、女性が40%だったとき、この比率に合わせて男性と女性の抽出数を決定する。

最適割当: 母集団の各層をある変数の標準偏差で分ける。そして、分散の大きい層の抽出数を多くする。

層化抽出法を使った実例としてアメリカの政治世論調査がある。アメリカ合衆国の市民の多様性を反映するような調査結果を得るため、人種や宗教など様々な少数グループを含むようサンプルが抽出される必要がある。そのため層化抽出法による調査は単純無作為抽出法や系統的抽出法よりも民意を反映していると言われる。

同様に、ある地域の人口密度のばらつきが大きい場合、層化抽出法によって地域ごとの同等の正確さで推定することを保証できる。例えば、オンタリオ州は南北で人口密度に大きな差がある(南部が高密度)。このため単純に無作為抽出すると北部からは意味のある標本数が得られない可能性がある。最適割当による層化抽出法を使えば、北部の抽出率を高くするなどの手法が採れるだろう。
長所

重要な部分母集団に集中し、無関係なものを無視できる。

推定の正確さを高めることができる。

効率が良い。

各層の
仮説検定の検定力を同等にするために、サイズの異なる各層から同数のサンプルを抽出するなどの手法もある。

短所

適切な層化変数(層を分ける基準)を選びづらい場合がある。

サブグループ内が同質といえない場合、有益でない。

コストがかかる可能性がある。

母集団に関する正確な情報を必要とし、さもなくば偏りを生じる。

各層のサンプル数の選択

一般に各層のサンプル数は層のサイズに比例して設定される。これを比例割当と呼ぶ。ある会社の従業員が以下のような構成になっていたとしよう。

男性正社員: 90人

男性パート従業員: 18人

女性正社員: 9人

女性パート従業員: 63人

合計: 180人

ここで、上記の分類を層とし、40人の従業員のサンプルをとるよう依頼されたとする。

まず、全従業員数(180)から各層のパーセンテージを計算する。

男性正社員比率 = ( 90 / 180 ) x 100 = 0.5 x 100 = 50%

男性パート社員比率 = ( 18 / 180 ) x100 = 0.1 x 100 = 10%

女性正社員比率 = (9 / 180 ) x 100 = 0.05 x 100 = 5%

女性パート社員比率 = (63/180)x100 = 0.35 x 100 = 35%

これにより40人のサンプルの各層への割り当ては

50% は男性正社員

10% は男性パート社員

5% は女性正社員

35% は女性パート社員

となる。従って、以下のような人数となる。

40人の 50% は 20人

40人の 10% は 4人

40人の 5% は 2人

40人の 35% は 14人

層によっては他よりも変動性が大きい場合がある。そのような層からは多くのサンプルを抽出すべきである。
関連項目

世論調査










統計学
標本調査

標本

母集団

無作為抽出

層化抽出法

要約統計量

連続確率分布

位置

平均

算術

幾何

調和


中央値

分位数

順序統計量


最頻値

階級値

分散

範囲

偏差

偏差値


次ページ
記事の検索
おまかせリスト
▼オプションを表示
ブックマーク登録
mixiチェック!
Twitterに投稿
オプション/リンク一覧
話題のニュース
列車運行情報
暇つぶしWikipedia

Size:25 KB
出典: フリー百科事典『ウィキペディア(Wikipedia)
担当:undef