統計
[Wikipedia|▼Menu]
.mw-parser-output .hatnote{margin:0.5em 0;padding:3px 2em;background-color:transparent;border-bottom:1px solid #a2a9b1;font-size:90%}

ウィキペディアにおける統計については、「Wikipedia:統計」をご覧ください。
ウィキペディア日本語版の記事数の統計

統計(とうけい、: statistic)は、社会の状態を数値によって精確に知りたいという要求に応えるため、実測したデータを元に計算した数値、あるいはそれを多数ひとまとめにしたものである。通常、関心の対象となる人々や事物の全数もしくはその一部について個別に情報を集め、計算をおこない、その結果を印刷物または機械可読な電子ファイルなどのかたちで公表する。この結果がじゅうぶんな信頼を得ている場合、それ自体で対象の状態を精確に反映したものとみなされる。たとえば、ある地域の人口統計の示す人口の数値が年々上昇しているということが、すなわちその地域において人口が本当に増加しているということだと解釈されるのである。

実現可能な範囲で精確な統計をつくる努力が重ねられてきた結果、統計の元となるデータの収集から結果の公表にいたるまでの手続きについて、標準的な考えかたが確立している。また、統計作成過程においてプライバシー個人情報を保護することも重要である。特に政府その他の公的機関が法的強制力をもったデータ収集をおこなう場合、対象者の権利が侵害されるリスクを抑えながらも、得られたデータを公共財として有効に活用する方法が模索されてきた。
概論
「統計」とは

「統計」は、広い範囲をカバーする語である。この語が使われる例には、ふたつの主要な類型がある。ひとつは、政府等が大規模な調査等をおこない、そこから得た結果やそこから計算した各種指標などの数値を公表していて、その公表された結果数値(あるいはそれをおさめた印刷物や電子ファイル)を「統計」と呼ぶ場合である。「人口統計」「経済統計」「労働統計」などをタイトルにふくむ書物[1][2][3]には、この例が多い。これに対して、自分自身で実験や観察をおこなって得た(たいていは小規模な)データをどう分析すればよいかという話題の場合は、分析それ自体あるいはそのときに使う方法を指して「統計」ということが多い。「心理統計」「医療統計」「生物統計」といったタイトルの書物[4][5][6]は、たいていこの例である。

歴史的にいえば、前者の用法のほうが発生が古い。19世紀はじめのドイツでは、いわゆる「国状学」(Staatskunde) の伝統のなかで、その版図にある各領邦 (Landesstaat) の地誌を統一的なテンプレートに沿って記述した書物を刊行して領邦間比較をおこなう研究が行われており、こうした研究あるいは材料となる地誌を記した書物のことをドイツ語で Statistik と呼んだ[7]。それ以前から、欧米各国では、人口などについて精確なデータを集めようという機運が高まっていた。19世紀には、そうした作業に従事する専門家や組織が、官民双方で誕生する。今日では「統計家」と呼ばれるような人々、「統計局」と呼ばれるような組織が、大規模な全数調査(センサス)をおこなって結果を集計し、分厚い報告書を出版する仕組みが確立していくことになる。大規模調査をおこなって数値をまとめて出版する「統計産業」とでもいうべきものが出現したということであり、その産業が生み出す製品、すなわち調査結果数値を集積した出版物が「統計」(statistics) と呼ばれるようになった。この産業の第一義的な顧客は、政策を立案し、実行する政府機関である。しかし、それ以外にも、調査結果数値を必要とする第二義的な顧客(統計ユーザー)が多数いる[8]。「人口統計」「経済統計」「労働統計」を冠する書物は、おおむねそのような統計ユーザーに向けて書かれている。

後者の用法はもっと新しく、20世紀に入って、確率論を応用したデータ分析のための学問[9]が発展したことから生まれた。規模の小さな標本における測定結果から無限母集団における値を推測することが相当の精度でできることが証明され、小規模な観察や実験でえたデータから全体を推測する技法をマスターすることが要請されるようになった。このような技法あるいはそれについて研究する学問分野が statistics と呼ばれるようになり、「統計学」あるいは「統計」と和訳される。「心理統計」「医療統計」「生物統計」を冠する書物は、そのような意味での統計(学)を利用してデータ分析を試みる読者に向けて書かれている。この意味での「統計」は、誰かが計算した結果の公表数値ではなく、自分自身が計算して必要な数値を求める作業を意味している。

以下では、前者の意味の「統計」について説明する。後者の意味の「統計」のさまざまな側面については、「統計学」「統計学の歴史」を参照されたい。
統計の変遷

国家を統治するための基礎的資料を得るための大規模調査には、長い歴史がある。建造物建設のための測量や徴税のための調査といったように、人口土地についての調査には古くから多くの例がある[7]

国民国家が成立した頃には政策の企画・立案のために量的なデータが必要だという考えが強くなり、それにともない調査の対象も多様化した。1800年にはフランス、1828年にはオーストリアで国家の調査機関が設立された。ナポレオン・ボナパルトは「統計は事物の予算である。そして予算なくしては公共の福祉も無い」[10]と語ったと伝えられる。

20世紀に入ると、国際機関による活動もあり、統計を通じた社会認識と政策立案が全世界に波及する。さらに、統計学の発展、高等教育大衆化コンピュータの普及などによって、統計を利用する層が政府以外の企業・団体・個人にも広がった。その結果、統計に求められる性質は、「国のためのデータ」から「国民のためのデータ」へと変わってきている[11]
統計の種類
実施主体による分類

政府その他の公共機関が作成する統計が公的統計である。それ以外にも、さまざまな組織が統計を作成している。公共機関以外の民間企業、業界団体、研究機関等が作成する統計は民間統計である。[12]
目的による分類
水準か構造か
対象集団における何らかの量の水準を精確に把握したい場合がある一方で、その何らかの量を規定する構造を把握するための属性情報を細かく収集したい場合がある。たとえばある地理的範囲に人が何人住んでいるかは水準の問題である。性別・年齢・民族などの属性あるいはそれらの組み合わせによって人口を把握したいなら構造の問題である。なお、「構造統計」という語はしばしば目にするが、「水準統計」はそうではない(用例
[13] がないわけでないが)。これは、一時点での水準だけを問題にすることがすくなく、時間による変動(つまり動態)に焦点があたることが多いからだろう。
静態か動態か
ある一時点での状態(静態)を知りたい場合と、時間の経過ともにどのように動くか(動態)を知りたい場合がある。たとえばある時点でのある地域の人口を知りたいのであれば、その地域に住んでいる人を全員数えて静態統計を作る。一方で、人口の動きを知りたいのであれば、一定期間(たとえば1年間)の出生・死亡・流入・流出の人数を数えて動態統計を作る。「静態」と「動態」の具体的な区別については、周期の短い(たとえば毎月)調査で短期間の変化を追跡したものが動態で、周期の長い(たとえば5年間隔)大規模調査でその時点の構造をおさえたものが静態だとする立場がある[14]。もう一つの立場は、上記の人口統計の例のように、何事かが連続的に変動する状態をある一時点で切り取って測定するのが静態であり、変化をもたらす離散的な事象の発生を一定の期間を区切って数えたものが動態だとするものである[15]


作成過程による分類

統計を作成することを目的としておこわれる調査を統計調査という。統計調査から得られる統計を調査統計または第一義統計という。統計を作成するための調査は、通常かなり大規模なものとなるので、入念な準備が必要である。一般的には、つぎのような流れで調査がおこなわれる。
企画・設計ニーズに応じて統計を企画・設計し、必要な資金や人員等を調達する。必要に応じて、当局などに計画を届け出、実施の許可を得る

説明実際に調査をおこなう担当者や団体、調査会社などに説明をおこなう

調査の実施調査対象(個人、事業所、各種団体等)に調査票を配布して記入を依頼し、記入後回収する

点検と集計回収した調査票を検査し(回答内容に矛盾がある場合など、調査対象に照会して修正することもある)、集計をおこなう

結果の発表集計した調査結果を分析し、公表する。

これに対して、わざわざ調査をおこなうのではなく、登録や届出、業務記録など、業務上の必要から集めた記録などを基に作成する統計を業務統計または第二義統計と呼ぶ。たとえば輸出入の通関書類から作成される貿易統計や、転出・転入の届出を基にした住民移動の動態統計のようなものがこれに相当する。

統計の対象となる個体を網羅した名簿(register)があって、それぞれの個体について採取した何らかの記録を名簿上のその個体の登録レコードに紐づけることができれば、そこから統計を作ることができる。そのような統計をレジスターベースの統計 (register-based statistics) という。これは業務統計の一種といえるが、従来の、特定の業務内容に特化した業務統計とはかなり性質が異なる。というのは、個人や団体を一意に区別できる識別子があれば、広範囲の情報をそれによって結合できるからである。情報技術の発達にともなって業務記録の電子化が進んできた結果、レジスターベースの統計がカバーしうる範囲は非常に広い。特に、現代国家の国民のほとんどが関係する租税、医療、社会保障などに関する事務からえられる情報を互いに結合して分析できれば、その社会の実態を把握する強力な武器となる。半面、個人情報保護の点で問題があることも指摘される。[16]

また、人々の生活の隅々まで電子デバイスが入り込んだ結果、民間企業がデジタルを駆使して巨大なデータを蓄積するようになっている。このようなデータは、従来の統計の代替物 (alternative) としての側面を持つため、オルタナティブデータ (alternative data) と呼ばれる。スマートフォン位置情報サービスや通信記録を利用して個人の地理的な動きや人々の接触状況を把握するもの、電子マネークレジットカードによる取引を記録するもの、ソーシャル・ネットワーキング・サービスでの行動履歴を追跡するものなどがある。


次ページ
記事の検索
おまかせリスト
▼オプションを表示
ブックマーク登録
mixiチェック!
Twitterに投稿
オプション/リンク一覧
話題のニュース
列車運行情報
暇つぶしWikipedia

Size:40 KB
出典: フリー百科事典『ウィキペディア(Wikipedia)
担当:undef