統計学
[Wikipedia|▼Menu]
□記事を途中から表示しています
[最初から表示]

英語で統計または統計学を「statistics(スタティスティクス)」と言うが、語源はラテン語で「状態」を意味する「statisticum(スタティスティークム)」であり、この言葉がイタリア語で「国家」を意味するようになり、国家の人力、財力等といった国勢調査を比較検討する学問を意味するようになった[要出典][注釈 2]

なお、統計学という語は、ドイツの政治学者ゴットフリート・アッヘンヴァルが1749年に『ヨーロッパ諸国国家学綱要』の中で、それまでドイツ語で「Staatenkunde」(「国情論」の意味)と呼ばれていた[6]学問に「Statistik(シュタティシュティーク)」(統計学)の名をつけたことに始まる[7]

日本語の「統計」という語の起源は明確にはなっていないが、幕末から明治初年にかけての洋学者である柳川春三が初めて現在の意味でこの語を使用したと考えられており、明治2年(1869年)には彼の編纂した冊子においてこの語と用法が使用されたとの記述がある。その後、明治4年(1871年)には大蔵省に「統計司」(後に「統計寮」に改組)が置かれ、次第にこの語が広まっていった[8]
分類
記述統計学と推計統計学詳細は「Category:記述統計学」および「Category:推計統計学」を参照

統計学は「記述統計学 (descriptive statistics) 」 と「推計統計学(inferential statistics、推測統計学とも) 」に分類できる[9]。記述統計学はデータの特徴を記述する学問であり、推計統計学は標本から母集団を推計する学問である。

記述統計学は、データ1つがもつ特徴を記述・説明することに着目した分野である[9]。例えば小学生99人の身長データがあったとする。データの値は個別の小学生のものであり、100人全体の特徴は値を個別に見ただけでは分からない。ここでデータの値を身長順に並べ、50番目の値を見れば「この小学生99人の"普通"の身長はだいたい110 cmである」と記述できる。50番目の値は中央値という。このように、データ全体の特徴を要約・記述することが記述統計学の大きな目的・方法論である。

推計統計学は、母集団からの標本化を前提とし、標本から母集団を推測する分野である[9]。例えば世界の小学生の身長特性を知りたいとする。全世界の小学生の身長を計測し記述統計学によって中央値や平均値を記述すれば、目的である世界の小学生の身長特性は解明できる。しかしその計測は著しく困難(事実上不可能)である。そこで推計統計学では、まず小学生100人の身長データ(標本と呼ぶ)を集める。そして標本は全世界の小学生という母集団からランダムに選ばれたものだと考える。ランダムに選ばれた100人の身長中央値(標本の中央値)は必ずしも世界小学生身長中央値(母集団の中央値)と一致しないと考えられるが、"似た"数値にはなると期待される。すなわち標本から母集団の特性を推測することができる。この、標本から母集団を推測する方法論に関する分野が推計統計学である。

このように、記述統計学はデータ(推計統計学でいう標本)の説明・記述を行い、推計統計学は母集団(の記述)の推測をおこなう。両分野の違いは、記述統計学では目の前にあるデータがすべて(母集団という考え方はない)のに対し、推計統計学ではむしろ目の前のデータは(真なる)母集団から今回たまたま選ばれた標本だと考える点にある。一方で、推計統計学では標本の記述統計から母集団の統計量を推測するように、この2分野は非常に密接に絡んでおり全く別の分野と考えることは不適切である。
統計的手法

この節は検証可能参考文献や出典が全く示されていないか、不十分です。出典を追加して記事の信頼性向上にご協力ください。(このテンプレートの使い方
出典検索?: "統計学" ? ニュース ・ 書籍 ・ スカラー ・ CiNii ・ J-STAGE ・ NDL ・ dlib.jp ・ ジャパンサーチ ・ TWL(2011年11月)

実験計画法
データ収集の規模や対象、割付方法をコントロールし、より公正で評価可能なデータが収集できるよう検討すること。統計の世界には「ゴミのようなデータを使っていくら解析しても出てくる結果はゴミばかりだ」[10]という格言がある[11]。これはデータ収集の前にその方法を十分に検討する必要があることを強調したものである。
尺度水準
データ(あるいは変数測定)の尺度はふつう次のような種類(水準)に分類される。尺度水準によって、統計に用いるべき要約統計量や統計検定法が異なる。

質的データ、カテゴリデータ

名義尺度:単なる番号で順番の意味はない。電話番号、背番号など。

順序尺度:順序が意味を持つ番号。階級や階層など。


量的データ、数値データ

間隔尺度:順序に加え間隔にも意味がある(単位がある)が、ゼロには絶対的な意味はない。摂氏華氏知能指数など。

比率尺度:ゼロを基準とする絶対的尺度で、間隔だけでなく比率にも意味がある。絶対温度、金額など。

これらは、意思決定に応用されている。
歴史詳細は「統計学の歴史」を参照

統計学の源流は国家または社会全体における人口あるいは経済に関する調査にある[12]。このことは、東西を問わず古代から行われている。

学問としては、17世紀にはイギリスウィリアム・ペティの『政治算術』(1790年)などが著述され、その後の社会統計学に繋がる流れが始まった。彼の提唱した政治算術そのものは18世紀に衰退するものの、ペティは統計学の父とも呼ばれる[13]。また同時期、ペティの友人であるジョン・グラント(英語: John Graunt)が『死亡表に関する自然的および政治的諸観察』(1662年)を表し、人口統計学の源流となった[14]。この死亡統計の研究はエドモンド・ハレーなども行うようになった[15]。これらの影響の基、18世紀にはドイツのヨハン・ペーター・ジュースミルヒが『神の秩序』(1741年)で人口動態にみられる規則性を明らかにしたが、これには文字通り「神の秩序」を数学的に記述する意図があった[16]

ドイツでは17世紀からヘルマン・コンリングなどによってヨーロッパ各国の国状の比較研究が盛んになり、1749年にゴットフリート・アッヘンヴァルがこれにドイツ語で「Statistik(シュタティシュティーク)」(「統計学」の意味)の名をつけている[7]

19世紀初頭になるとこれに関して政治算術的なデータの収集と分析が重視されて、「Statistik」の語は特に「統計学」の意味に用いられ、さらにイギリスやフランスなどでも用いられるようになった。この頃には、1748年のスウェーデンを皮切りに国勢調査も行われるようになり、1790年には下院の議員数算定のためにアメリカがこれに続き、イギリス、フランスなど西ヨーロッパ諸国においても1830年頃までには国勢調査が行われるようになった[17]

一方ブレーズ・パスカルピエール・ド・フェルマーに始まった確率論の研究がフランスを中心にして進み、19世紀初頭にはピエール=シモン・ラプラスによって一応の完成を見ていた[18]。また、カール・フリードリヒ・ガウスによる誤差正規分布についての研究も統計学発展の基礎となった[19]。ラプラスも確率論の社会的な応用を考えたが、この考えを本格的に広めたのが「近代統計学の父」と呼ばれるアドルフ・ケトレーであった。彼は『人間について』(1835年)、『社会物理学』(1869年)などを著し、自由意志によってばらばらに動くように見える人間の行動も社会全体で平均すれば法則に従っている(「平均人」を中心に正規分布に従う)と考えた[20]。ケトレーの仕事を契機として、19世紀半ば以降、社会統計学がドイツを中心に、特に経済学と密接な関係を持って発展する。代表的な人物にはアドルフ・ワグナー[21]エルンスト・エンゲルエンゲル係数で有名)[22]、ゲオルク・フォン・マイヤーがいる[23]


次ページ
記事の検索
おまかせリスト
▼オプションを表示
ブックマーク登録
mixiチェック!
Twitterに投稿
オプション/リンク一覧
話題のニュース
列車運行情報
暇つぶしWikipedia

Size:103 KB
出典: フリー百科事典『ウィキペディア(Wikipedia)
担当:undef