バックアップ(backup)とは、支援や予備のことであり、データのバックアップとは、データの複製をあらかじめ作成し、たとえ問題が起きてもデータを復旧出来るように備えておくこと。
揮発性メモリに電源を供給し続けることでデータを保持する技術はバッテリーバックアップを参照。本項目では、データの複製技術とその目的について解説する。
目次
1 バックアップの必要性
2 データ保全
3 バックアップ対象
4 バックアップの種類
4.1 フルバックアップの特徴
4.2 差分バックアップの特徴
4.3 増分バックアップの特徴
5 バックアップメディアの種類
6 関連項目
//
データはさまざまな要因で失われる。要因として、以下の物がある。
人為的ミス
ハードウェア障害
ソフトウェア障害
盗難
コンピュータウィルス
サイバーテロ
災害(地震や火災など)
戦争やテロリズム
失う要因としてもっとも大きなものは、ユーザ自身が誤って消したり、間違った情報を書き込んでしまうことである。それは100%防止することは不可能であり、その対策として取れるのは通常とは別の場所にコピーしておくことしかない。そのような行為をバックアップをとると言う。
OSの入った、普段使用しているストレージに複製するのもバックアップではあるが、コンピュータのストレージは、形あるものでありいつか壊れるものである。同じストレージにバックアップを取った場合、そのストレージが丸ごと破損するともはや復旧のしようがない。データ復旧サービスもあるが、その費用は、失われたデータを作り直すための費用と大差がない場合も多く、また作り直す事ができないデータは二度と復活できない。バックアップは、データを失うそれぞれの要因に巻き込まれないようにすることが肝心で、危惧される要因ごとに対策をとる必要がある。そのため通常は、普段使用しているデータのストレージとは別のストレージに、定期的にバックアップを取る事が強く推奨される。
コンピュータで扱うデータが貴重な物であればあるほど、万が一のデータ紛失に十分な対策を取る事が必要になる。
データ紛失のリスクとしては大きく分けると以下のものがある。
ユーザのミスや、ソフトウェアのバグ、ウイルス感染やクラッキング等による第三者による意図的な改ざんなどの、データの論理的な破壊
ハードウェアの故障(停電を含む)や、自然災害(火災、落雷、地震等)、さらには犯罪(盗難、テロ等)その他による、媒体の物理的破壊や紛失等
これらのリスク分析をし、それぞれの要因に対して必要かつ十分なデータ保全対策を取る事が重要である。
論理的な破壊に対しては、バックアップを数世代分に渡り取得し、時間的に遡る事が出来るようにする対策が必要。可能な限り意図的な改ざんに耐え、破壊される直前に戻れることが望ましい。データの重要度や更新頻度にあわせてバックアップを取得する期間を決定することが必要。
物理的な破壊に対しては、別の場所に保存したり、別のメディアに保存したりする対策が必要。バックアップ先が同じ理由で使えなくなることを避けるには、可能な限り離れた場所、可能な限り別のしくみのメディアを使うことが望ましい。
一般的にバックアップには論理的にも物理的にも保護を望める方法を使うが、方法によっては片方に対しての対策にしかならない方法もあるので、注意が必要。例をあげると:
同一ドライブ内にバックアップする。操作ミスなどの論理的な破壊に対しての対処としてのみ有効、操作ミスは最大の障害理由なのでとても有用だが、そのドライブが壊れてしまった場合にはまったくの無力である。
別のストレージに即座に反映する。物理的な破壊に対しては最良の手段、停止できないサービスを提供する場合は必須だが、操作ミスなども即座に反映してしまう。RAIDなどのミラーリングサービスがこれに該当する。
以上のような方法は、特定の目的の場合選択されるが、他の方法も組み合わせて使う必要があるといえる。
一般的な対策の例としてはコストに応じ、以下のものがある。
リムーバブルメディアにバックアップを取り、別の場所に保管する事により、場所的なリスク(自然災害や犯罪等)や、オンラインにある事のリスク(データの論理的な破壊等)を軽減する
多重バックアップ。重要度とコストに応じて、2重・3重に多重バックアップ(バックアップのバックアップ)を取る。例として、1次バックアップにはハードディスクドライブ等の高速なメディアを使い、2次バックアップにはDVDや磁気テープ等の比較低速メディアを使う。
ネットワークを通して、オンラインストレージやデータセンター等にバックアップを取る(もしくは、データセンター自体を通常使用のストレージとし、またそこから他にバックアップを取る)
RAIDはハードディスクドライブの耐障害性を向上させるだけの手段であって、RAIDだけでは完全ではなく、バックアップも同様に重要である。(RAIDはバックアップの代替にならず、バックアップもRAIDの代替にはならない)
バックアップは通常、バックアップした時点において最新なだけのデータしか復旧できないため、定期バックアップの期間が長い場合にはその分の期間のデータ編集を喪失する事になる。これも、期間の喪失リスクとバックアップのコストを天秤に掛ける事になる。また、後述のミラーリングにより、期間の喪失リスクはゼロに近づくが、専用のシステムが必要となる事が多い。