統計学
[Wikipedia|▼Menu]
□記事を途中から表示しています
[最初から表示]

たとえば、ここ四十数年で少年犯罪は1/4になっているが、最近10年では微増している。この時、微増となっている最近10年分のデータだけを提示して、「近年少年犯罪は増加している」という主張をすれば、これは成立することになる[54]。さらに、グラフの縦軸(=犯罪数の軸)をわざと縦長に描くことで犯罪数が急上昇しているかのように見せかけることも可能である。
反証可能性

カール・ポパーの反証可能性理論が、反証可能性のない理論は非科学的であると主張したため、反証可能性のない統計理論が存在する場合、それは非科学的であるとする論文があることに留意すべきである[55]
教育

統計学は「実学」に端を発しており、市民社会以降世界に普及した「市場経済」を牽引した原動力とも言える学問である。そのため、自然科学社会科学人文科学の各分野の垣根を越えて分化かつ拡大を続ける中、基礎において汎用性が高い学問の構造を有している[要出典]。

社会生活の至る所で統計技術の適用が貢献できる場面がある以上、統計学とその適用方法を学習する上では社会の実態に即して頻繁に技法を適用してみることが重要であり、そのように出来るためには何よりまず統計処理を身近で制限無く実施できるような「統計処理環境」の備えが必要である。

PCソフトウェアインターネットなどのIT環境が急速に進化低廉化して普及したことで身近に統計処理環境を持ちうるようになり、なおかつ莫大な統計情報がインターネットを通じて公開されているため、研究・調査・学習の処理材料にも不自由しない。

実際21世紀に入って以降は、それまでの確率論と数理統計学を重点に置いたカリキュラムに加え、データを処理して求める答えに近づく「データ解析」のスキルが教育されるようになっている(データサイエンス論)。

元来コンピュータを使った数値解析に際してはまず、IEEE 754規格にあるように端数処理誤差が暗黙のうちに生じることや、有効数字の概念の認識が重要で、子供のころ算数で学んだような計算結果にはならないことがあることを知っておかねばならない。さらに、統計計算では殊に重要な乱数列についても、コンピュータ上で用いるのは擬似乱数であることや、良質な疑似乱数生成方式「メルセンヌ・ツイスタ」を計算ソフトウェアや開発用言語の全てが必ず備えているわけではないこと、暗号論的乱数はさらにまた別の乱数概念であること、なども実は大切な基礎知識である。

人が得意とするパターン認識の力を積極的に用いるため、統計データの「グラフ化」が古来常套手段として用いられているが、ITの支援を得ることで大量のデータを様々な形に、しかも瞬時にグラフ化(あるいは『可視化』)することが可能となった。そのためのグラフ作成ソフトも多数存在するが、その他の数値解析ソフトウェア数式処理システム、そして殊に下記のような統計アプリケーションではグラフ化するための機能が充実している。

一方、近年オフィスソフト機能等で極端なグラフ装飾を施すことが横行している。この結果として、例えば3Dグラフなどを安易に用いると遠近感や区間面積などから表示すべき真の数量とは異なった認識を受け手に与える事がある。本来3Dグラフ表示は人の空間認識力を活かし得る優れた表現手法であるが、意味なく勢い付け等で用いるのは本来的な視覚化からは退行するばかりか、意図して受け手の誤認識を誘導する事も可能となる。「グラフは直感的に分かるから全て善である」と一般に認識されていることや、前出「統計の困難さ」にある内容をふまえると、統計の視覚化とその解釈に関するリテラシ教育は初等段階から特に注意を要する。

上記のように、用いる統計処理環境ごとに適用分野・目的・方法論・使用者との相性などは異なる。そういった統計処理環境固有の特性なども含めて、いかなる道具もそうであるように、数多く体験の機会を作るほかに理解の早道は無い。

広く普及した表計算ソフトが統計処理・グラフ表現機能を持っているので、誰でも手軽に統計処理入門体験は出来る。しかしあくまでビジネスソフトであり、科学技術ソフトではないExcelの計算の信頼性については常に批判が絶えない[56][57][58][59](Excelに限らず普及している表計算ソフトウェアはどれも信頼に足る統計計算はできないとの報告もある[60])。

近年では研究・教育機関が公開するオープンソース自由ソフトウェアの中からきわめて優秀な計算ソフトウェアが育っており、プロプライエタリソフトの問題点顕在化により関心の高まった統計技術資産の持続可能性という観点からも、統計教育にあたってはこれらオープンソースソフトウェアの積極的な活用が推奨される。

統計の研究・教育に適した代表的なフリーソフトウェア

アプリケーション

R言語 - GNU GPLフリーウェアの統計用数値解析ソフトウェア[61]確率分布や統計モデルを簡潔に記述でき、無限大・非数欠損値定数を持つベクトル処理言語。アメリカ食品医薬品局公認。

GNU Octave - GNU GPL・フリーウェアの数値解析ソフトウェア。理工学分野でのデファクトスタンダードとも言えるMATLABと互換の命令体系を持つベクトル処理言語[62]

Scilab - Scilab License・フリーウェアの数値解析ソフトウェア[63][64][65][66]。MATLAB類似の文法をもったベクトル処理言語。付属するソフトウェアScicosを用いてダイアグラム操作で視覚的にシステムフロー図を描いてシステムダイナミクスシミュレーションが可能。INRIAが開発。

Ox言語 - 行列計算のために作られたベクトル処理言語。フリーウェア。オックスフォード大学が開発。

Maxima - 数式処理システム[67]MITMacsyma直系のGNU GPL・フリーウェア版。

Risa/Asir - 数式処理システム[68][69]。マルチプラットホーム。OpenXMを実装。フリーウェア。富士通が開発。


ライブラリ

GNU Scientific Library

Apache Commons Math

SAMMIF

DLLSA

ISMLIB

Incanter(Clojure用ライブラリ)

NumPyPython用ライブラリ)

SciPy(Python用ライブラリ[70][71][72]

統計計算に関連するソフトウェアのカテゴリ

グラフ作成ソフト

統計ソフトウェア

数値解析ソフトウェア

数式処理システム

日本

日本においては統計学がそれぞれの分野へ分化された形で組み込まれているため「統計学科」を置く大学がなかったが、2017年度に滋賀大学が日本で初めて統計学を研究の核とするデータサイエンス学部を新設。一橋大学がソーシャル・データサイエンス研究科・学部を2023年度に新設予定である。

国立の統計学研究・教育機関としては、1944年に設立された統計数理研究所があり、AIC数量化理論確率微分方程式などの顕著な成果を生み出し、統計学研究を牽引している[注釈 4]

平成21年(2009年)11月に公示された[73]新学習指導要領において、中学・高校数学における統計単元の拡充がなされた。

中学校では、中学数学においては「統計」を扱う単元が新設された(従来は確率を扱う単元はあったが統計処理を扱う単元はなかった)。

高校では、それまで高校数学Bにおいて選択履修とされていた「統計の基礎的概念」(代表値・相関係数ほか)を扱う単元が数学Iに移され「データの分析」として必修化された。また、それまで数学Cにおいて理系生のみが履修していた「確率分布と統計的な推測」が数学Bに移されて、文系生でも履修可能になった。

これらの変更は2012年(平成24年)度入学生から適用されている。(詳細は、「 数学 (教科) 」を参照)


次ページ
記事の検索
おまかせリスト
▼オプションを表示
ブックマーク登録
mixiチェック!
Twitterに投稿
オプション/リンク一覧
話題のニュース
列車運行情報
暇つぶしWikipedia

Size:103 KB
出典: フリー百科事典『ウィキペディア(Wikipedia)
担当:undef