英語のstatisticsという語は、最終的には、ラテン語のstatisticum collegium(「国会」)とイタリア語のstatista(「政治家」)に由来している。1749年にゴットフリート・アッヘンヴァルによって初めて紹介されたドイツ語のStatistikは、元々は国家についてのデータの分析のことを指しており、「国家の科学」(当時は英語でpolitical arithmeticと呼ばれていた)を意味していた。19世紀初頭には、それは一般的にはデータの集計と分類を意味するようになった。この単語は1791年、ジョン・シンクレア(英語版)が21巻からなる "Statistical Accounts of Scotland"(『スコットランド統計研究(英語版)』)の第1巻を出版したときに英語で紹介された[1]。
したがって、Statistikの本来の主な目的は、データが政府の(中枢)行政機関に使用されることであった。国や地方についてのデータの集計は主に国家や国際的な公共事業を通じて定期的に行われる。特に、人口統計についての情報は国勢調査を通じて頻繁に更新される。
"Statistics" を題名に最初に冠した本は、Francis G. P. Neison(Medical Invalid and General Life Officeの保険数理士[要出典])による "Contributions to Vital Statistics"(1845年)である。 日本で初めて紹介された統計書は、1854年(江戸時代末期)の、オランダのP. A. de Jongによる Statistische tafel van alle landen der aarde(『地球上の全ての国の統計表』)と言われている[2]。当時はstatisticsという語に対する日本語が存在せず、一時期は片仮名で「スタチスチク」と使われていた[3]。この本は1860年(万延元年)、福澤諭吉とその弟子古川正雄(岡本博卿)の訳により、『万国政表』(萬國政表)として刊行された。そこでは "statistische tafel" を「政表」と訳している。 現在で一般的に使われている「統計」と初めて訳したのは、洋学者の柳川春三と推定されている[4]。1870年(明治3年)8月4日に、外務省が諸省に廻達した文書(外国貿易品輸出入の物品高表を編集、貿易年表を出版する旨を通知した文書)の中で、「統計年鑑」という用語がある。日本の公文書に「統計」という語が初めて登場したのはこの時とみられる。1871年(明治4年)7月27日、大蔵省に「統計司」という機関が設置され、日本の官署で初めて「統計」という名称が附された(翌8月10日に「統計寮」と改められた)[2]。これは、米国視察から帰国した伊藤博文の建議による[4]。「統計学」という訳語が日本の社会に普及し始めるのは、(明治7年)6月に文部省出版の『統計学』(モロー・ド・ジョンネ著 "Elementde Staisique" 箕作麟祥訳)によるとされる[4]。 現在の中国、韓国でも、statistics の訳語として「統計」が用いられている。その起源は日本であり、中国語の造語である「統紀」に触発されて日本で造語された「統計」が中国に導入された[2]。
日本における用語の取り扱い
起源「確率の歴史」および「:en:Timeline of probability and statistics
文明の開始以来、統計には基本的な方式が用いられてきた。初期の帝国では、しばしば人口国勢調査を照合したり、様々な商品の取引を記録したりしていた。漢王朝とローマ帝国は、帝国の人口、国土面積、富の規模についてのデータを広範囲に集計した、最初の国家たちである。
統計的手法が使用されるようになるのは、少なくとも紀元前5世紀にまでさかのぼる。歴史家のトゥキュディデスは『戦史』[5]で、アテネ人がプラタイア(都市国家)の壁の高さを測定する方法を説明している。周囲の、壁で漆喰の塗られていない区間のレンガの数を十分な回数数えた。そのカウントは何人かの兵士によって数回繰り返された。そこでの最頻値はレンガの数の最もありうる値と見なされた。この値に、壁に使われているレンガの高さを掛けることで、アテネ人は壁に架けるのに必要なはしごの高さを決めることができた[要出典]。
貨幣検査函審査(英語版)(トライアル・オブ・ザ・ピクス)は、12世紀から定期的に実施されている、王立造幣局(イギリス)の硬貨の純度の検査である。その検査方法は、統計学の標本調査による方法に基づいている。一連の硬貨を(元々は10ポンドの銀から)鋳造した後、1枚の硬貨をウェストミンスター寺院にあるピクス(英語版)に入れる。一定期間後(現在は1年に1度)硬貨を取り出して計量する。次に、箱から取り出された標本硬貨の純度を検査する。
14世紀のフィレンツェの歴史を記した『新年代記(英語版)』(ジョヴァンニ・ヴィッラーニ、フィレンツェの銀行家であり公務員)には、人口、法令、通商貿易、教育、宗教施設についての多くの統計情報が記載され、歴史上統計データを明確に著した最初のものである[6]。だが、そこにはまだ、特定の分野としての統計学の用語も概念もまだ存在していなかった。
算術平均はギリシャ人には知られていた概念であるが、16世紀まで3個以上の値に対して一般化されていなかった。1585年にシモン・ステヴィンが十進法を発明したことで、これらの計算が容易になったと思われる。この方法はティコ・ブラーエにより天文学で採用された。様々な天体の位置を推定したときの誤差を減らそうとしていた。
中央値の発想は、1599年のエドワード・ライト(英語版)の航法についての著書 ("Certaine Errors in Navigation") を起源とし、コンパスによる位置の特定についての節に書かれている。ライトは、一連の観測値の中でこの値が最も正しそうな値だと感じた。ウィリアム・ペティは17世紀の経済学者で、人口統計データを分析するために早くから統計学的手法を駆使した。
統計学の誕生は、1662年にまでさかのぼる。ジョン・グラント(英語版)がウィリアム・ペティと共に、国勢調査のための統計的方法を開発し、人口統計学の現代的な枠組みを構築した。彼は生命表を初めて作成し、年齢ごとの生存率を与えた。彼の著書 "Natural and Political Observations Made upon the Bills of Mortality" では死亡率の分析を行い、初等統計学的に基づいてロンドンの人口を推定した。彼は、ロンドンでは年間で約13,000の葬儀があり、11家族中3名の割合で亡くなっていることを知っていた。彼は小教区の記録から、世帯平均人数は8名と推定し、そこからロンドンの人口はおよそ384,000名と割り出した。これは比推定量(英語版)が初めて使用された例として知られる。1802年にラプラスは、同様の方法でフランスの人口を推定した。
統計学の適用範囲は元々は統治に有用なデータに限られていたが、その守備範囲は19世紀の間に、科学や商学の多くの分野に広がって行った。この分野の数学的基礎は、16世紀になって新たに拓かれた確率論によって促された。その初期の確率論を拓いたのは、ジェロラモ・カルダーノ、ピエール・ド・フェルマー、ブレーズ・パスカルである。クリスティアーン・ホイヘンス(1657年)は、この分野を科学的にとらえた最も初期の科学者として知られる。