この記事は検証可能な参考文献や出典が全く示されていないか、不十分です。出典を追加して記事の信頼性向上にご協力ください。(このテンプレートの使い方)
出典検索?: "無作為抽出"
無作為抽出(むさくいちゅうしゅつ)やランダム・サンプリング(英: random sampling)とは、ある集団から標本(サンプル)を無作為(ランダム)に抽出(サンプリング)する行為のことである。日本工業規格では、「無作為標本」の項で、「無作為な選択方法によって選んだ標本」と定義している[1]。
概要カードゲームやボードゲームなどのアナログゲームにおける無作為抽出で使用される、多面ダイス割りばしで自作した抽選機。精度の低い抽選機を使うと、無作為性が低い抽出となる
その名の通り、ある集団から要素を抽出するのに、作為的な手順を使わないことが特徴である。そのため、無作為抽出法によるサンプリングを行うと、集団の全ての要素が同じ確率で抽出されることになる。
標本調査における標本の抽出法には、全体から無作為に抽出する「無作為抽出」の他に、全体から作為的に抽出する「有意抽出」がある。例えばクラスの掃除当番を選ぶ場合、「出席簿からくじで無作為に抽出した出席番号の生徒を掃除当番に任命する」のが無作為抽出で、「先生が気に入った奴を掃除当番に任命する」のが有意抽出である。無作為抽出の方が客観的な公平性が担保でき、「段ボールで自作したルーレット」や「印刷に失敗したプリント用紙の裏紙で自作した抽選箱」など割と簡単に道具を作れるので、民間でも割とカジュアルに行われている。仮に「無作為抽出」と称していても、客観的な無作為性が担保できない場合、例えば「出席簿でたまたま目についた奴を何名か無作為に掃除当番に任命する」などは、先生が気に入った奴を有意抽出している可能性が客観的に排除できないので、無作為抽出ではない。
統計調査にも使われる。「割りばしで自作したので特定の番号の物がいつもささくれで引っかかる抽選機」などの精度の低い乱数発生器を使用したことによる無作為性(ランダムネス)の低さは、「掃除当番を選ぶ」などの場合は単に「クジ運が悪い」として我慢してもらえば問題にならないものの(それでも限度があり、あまり悪いと有意抽出と同様にクジ運ではなく先生が恨まれることになる)、統計調査などの学術的調査では標本誤差の元となるので、問題となる。「有意抽出」や、「無作為性の低い無作為抽出」では、正確な統計調査にならない。なので、統計調査として行われる標本調査では、有意抽出ではなく、かならず無作為抽出が使われる。また、人力で調査を行うことによるコストや労力との兼ね合いを取りながら、なるべく無作為性が高くなるように様々な手法が工夫されている。
工業製品の「抜き取り検査」でも、無作為性が低いと不良品の率が正確に解らず、自社検査にパスしたのに出荷先の検査で段ボールの底の方から不良品が大量に見つかって会社の信用がピンチになるので、たとえコストがかかっても無作為性を確保することは重要である。特に、倉庫や段ボールの奥の方に積まれたものを検査するのがマンパワー的に難しく、完全な無作為抽出をせずに上の方だけ適当に検査する事があるので、製品全体の無作為抽出が楽にできるような工夫が必要である。
カードゲームなどのテーブルゲームでも、無作為抽出であることは重要である。ゲームで無作為抽出のように見せかけて自分の欲しい手札を引く「イカサマ」と言うテクニックがある。アナログのゲームにおける無作為抽出は、コンピューターゲームとは違ってコンピューターを使った無作為抽出を行わず、全て人力で行うことが特徴なので、その分イカサマがしやすいが、絶対に行ってはいけない。
手品でも、タネも仕掛けもない無作為抽出であることが強調されるが、実はタネも仕掛けも仕込まれているので無作為抽出ではない。
無作為抽出の手法
乱数生成器(ランダマイザー)麻雀牌を人間の手でランダマイズランダマイザーと標本抽出枠(豊川稲荷のおみくじ)
直接、ある集団の全ての要素を無作為に配列(ランダマイズ)し、そこから任意の要素を抽出する方法と、まず、ある集団の全ての要素で構成される任意の配列のリスト(標本抽出枠)を作り、標本抽出枠のそれぞれの要素に連番を振り、乱数生成器(ランダマイザー)で無作為な乱数を生成し、出て来た乱数と同じ番号が振られた要素を標本として標本抽出枠から抽出する方法がある。