この記事は検証可能な参考文献や出典が全く示されていないか、不十分です。出典を追加して記事の信頼性向上にご協力ください。(このテンプレートの使い方)
出典検索?: "データウェアハウス"
データベースモデル
基本的なモデル
階層
ネットワーク
関係
オブジェクト関係
オブジェクト
その他のモデル
多次元
スタースキーマ
XMLデータベース
列指向
Associative
Concept-oriented
.mw-parser-output .hlist ul,.mw-parser-output .hlist ol{padding-left:0}.mw-parser-output .hlist li,.mw-parser-output .hlist dd,.mw-parser-output .hlist dt{margin-right:0;display:inline-block;white-space:nowrap}.mw-parser-output .hlist dt:after,.mw-parser-output .hlist dd:after,.mw-parser-output .hlist li:after{white-space:normal}.mw-parser-output .hlist li:after,.mw-parser-output .hlist dd:after{content:" ・\a0 ";font-weight:bold}.mw-parser-output .hlist dt:after{content:": "}.mw-parser-output .hlist-pipe dd:after,.mw-parser-output .hlist-pipe li:after{content:" |\a0 ";font-weight:normal}.mw-parser-output .hlist-hyphen dd:after,.mw-parser-output .hlist-hyphen li:after{content:" -\a0 ";font-weight:normal}.mw-parser-output .hlist-comma dd:after,.mw-parser-output .hlist-comma li:after{content:"、";font-weight:normal}.mw-parser-output .hlist-slash dd:after,.mw-parser-output .hlist-slash li:after{content:" /\a0 ";font-weight:normal}.mw-parser-output .hlist dd:last-child:after,.mw-parser-output .hlist dt:last-child:after,.mw-parser-output .hlist li:last-child:after{content:none}.mw-parser-output .hlist dd dd:first-child:before,.mw-parser-output .hlist dd dt:first-child:before,.mw-parser-output .hlist dd li:first-child:before,.mw-parser-output .hlist dt dd:first-child:before,.mw-parser-output .hlist dt dt:first-child:before,.mw-parser-output .hlist dt li:first-child:before,.mw-parser-output .hlist li dd:first-child:before,.mw-parser-output .hlist li dt:first-child:before,.mw-parser-output .hlist li li:first-child:before{content:" (";font-weight:normal}.mw-parser-output .hlist dd dd:last-child:after,.mw-parser-output .hlist dd dt:last-child:after,.mw-parser-output .hlist dd li:last-child:after,.mw-parser-output .hlist dt dd:last-child:after,.mw-parser-output .hlist dt dt:last-child:after,.mw-parser-output .hlist dt li:last-child:after,.mw-parser-output .hlist li dd:last-child:after,.mw-parser-output .hlist li dt:last-child:after,.mw-parser-output .hlist li li:last-child:after{content:")\a0 ";font-weight:normal}.mw-parser-output .hlist ol{counter-reset:listitem}.mw-parser-output .hlist ol>li{counter-increment:listitem}.mw-parser-output .hlist ol>li:before{content:" "counter(listitem)" ";white-space:nowrap}.mw-parser-output .hlist dd ol>li:first-child:before,.mw-parser-output .hlist dt ol>li:first-child:before,.mw-parser-output .hlist li ol>li:first-child:before{content:" ("counter(listitem)" "}.mw-parser-output .navbar{display:inline;font-size:75%;font-weight:normal}.mw-parser-output .navbar-collapse{float:left;text-align:left}.mw-parser-output .navbar-boxtext{word-spacing:0}.mw-parser-output .navbar ul{display:inline-block;white-space:nowrap;line-height:inherit}.mw-parser-output .navbar-brackets::before{margin-right:-0.125em;content:"[ "}.mw-parser-output .navbar-brackets::after{margin-left:-0.125em;content:" ]"}.mw-parser-output .navbar li{word-spacing:-0.125em}.mw-parser-output .navbar-mini abbr{font-variant:small-caps;border-bottom:none;text-decoration:none;cursor:inherit}.mw-parser-output .navbar-ct-full{font-size:114%;margin:0 7em}.mw-parser-output .navbar-ct-mini{font-size:114%;margin:0 4em}.mw-parser-output .infobox .navbar{font-size:88%}.mw-parser-output .navbox .navbar{display:block;font-size:88%}.mw-parser-output .navbox-title .navbar{float:left;text-align:left;margin-right:0.5em}
表
話
編
歴
データウェアハウスとは、企業内のシステムやアプリ、クラウドサービスなどから定期的にデータを時系列に蓄積していくシステムのこと。 データウェアの提唱はアメリカの計算機科学者ビル・インモン
概要
定義
複数の基幹系システム(製造管理システム、販売管理システム、会計システムなど)から、マスタやトランザクション(取引)を抽出して、再構成・再蓄積したシステムを指すことが多い。 データウェアハウスの登場は、1990年代にハードディスクが安くなったことと、PCやサーバで使用可能な安価なCPUを並列で使用する技術ができてきたことによる。この時代にはまだ基幹系システムのCPUやハードディスクは高止まりしており、データウェアには専用のハードウェアやソフトウェアが使用されていたが、汎用PCにより構成出来るようになったことで、データを長期間に渡り蓄積するという観点を実現出来るようになった。 その後、2010年代にクラウドコンピューティングのデータウェアハウスとしてGoogle BigQueryやAmazon Redshiftなどの、よりクラウドネイティブなデータウェアハウスの提供がされるようになった。イニシャルコストを最小限に抑え、時間および使用リソースによる従量課金でデータウェアハウスが利用出来るようになり、データウェアハウスの利用用途が飛躍的に広がった。 基幹系システムではデータの参照時点での状況が把握できればよいので、過去のデータは基本的に保持されず、短ければ半期、長くても1年ごとに個別データをサマリに更新する。このため基幹系システムのディスク使用量は業務量が増大しない限り大きく変動しない。 これに対してデータウェアハウスの目的は過去のデータの蓄積と現在との比較であるため、データの削除や更新はされず、保持データ量は時間と比例して増大する。例えばある顧客が今までにどのような買い物をしたのか、さらに今後どの程度の購買が期待できるのか、といった判断のためにデータウェアハウスが使用される。 データウェアハウスでは、データを分析して意思決定に役立てるため、複数の基幹系システムからデータを収集し、蓄積する。意思決定にデータを活用するという観点から、データウェアハウスはBIの一つに位置付けられることがある。 データウェアハウスでは極めて小さい単位のデータ(「アトミック[要曖昧さ回避]である」とも表現される)を扱うが、多くの場合適宜に集計されたデータを使用する方が速いので、ユーザが使うデータを予測しておいて、データウェアハウスからデータを集計しデータマートが構築されることがある。ユーザはツールを使ってデータマートから必要なデータやレポートを作成する。その名前のとおり、データウェアハウスはデータの倉庫であり、データマートはデータの小売店を意味している。 データウェアハウスから有用なデータを発見するための手法・ツールとして、MS Accessなど市販のデータベースソフトを利用する人もいるが、OLAPやデータマイニングの専用ツールが使われることも多い。
データウェアハウスの成立と発展
特徴
関連するシステム
データウェアハウス製品
SAP - SAP NetWeaver Business Warehouse
Oracle - Oracle Database / Oracle Exadata