デジタル保存
[Wikipedia|▼Menu]

図書館情報学およびアーカイブズ学において、デジタル保存(デジタルほぞん)とは、継続的な価値をもつデジタル情報が長期的にアクセスでき利用可能であることを保証する公式なプロセスのことをいう[1]。それは計画の策定、資源の配分、保存手段・技術の適用を含み[2]、媒体の損傷や技術の変化といった諸課題がどのようなものであれ、デジタル化されたコンテンツやもともとデジタル形式で作成された「ボーンデジタル」コンテンツへのアクセス機会を保証するための方針・戦略・活動を組み合わせたものである。デジタル保存の目標は、真正なコンテンツを長期にわたり精確に表示・生成(レンダリング)することである[3]

米国図書館協会の一部門である「図書館コレクション・テクニカルサービス部会」(2020年に新たな部会 Core: Leadership, Infrastructure, Futures に統合)の保存・デジタル化セクションでは、デジタル保存について「長期的にデジタルコンテンツへのアクセス機会を保証するための方針・戦略・活動」を組み合わせたものと定義していた[4]。専門用語辞典 Harrod's Librarians' Glossary and Reference Book によれば、デジタル保存とは、技術進化によりもとのハードウェアやソフトウェアの仕様が旧式化しても対象となるデジタル資料が利用可能な状態を維持する手法のことをいう[5]

デジタルメディアの寿命は相対的に短いためデジタル保存の必要性が生じる。広く用いられているハードディスクドライブは、スピンドルモーターの損傷などのさまざまな理由から数年で使えなくなりえ、フラッシュメモリSSD携帯電話USBフラッシュドライブ上のものや、SD・マイクロSD・コンパクトフラッシュなどのメモリカード内のもの)は、保管時の温度や寿命内に書き込まれたデータ量にもよるが、最後に利用されてから一年ほどでデータが損失し始めかねない[要出典]。現在、保存用のアーカイバルディスク(英語版)と呼ばれるものも利用できるが、耐用年数は50年ほどにすぎず、かつ、ソニーパナソニックという日本企業2社により販売されている、プロプライエタリなフォーマットである。M-DISCDVDベースのフォーマットで、1,000年間データを保持可能と謳われているが、書き込みには特殊な光ディスクドライブが必要で、格納されたデータを読み出す際にも一般的なものでなくなりつつある光ディスクドライブが欠かせないことに加えて、このフォーマットの開発会社(Millenniata社)はすでに破産している。LTOテープに保管されたデータは、古いテープが新しいテープドライブでは読めないため、定期的にマイグレーションを行う必要がある。RAID構成のディスクアレイを導入すれば1台のハードディスクドライブの故障に対応できるが、あるディスクアレイのドライブと別のディスクアレイのドライブとが混在しないように注意しなければならない。
基本原理
評価選別

アーカイブズ的な(つまり保存を目的とした)評価選別(英語版)(ないし選択[6])とは、対象記録類の永続的価値を見極めることにより、保存すべき記録やその他資料を特定するプロセスのことを指す。こうした決定をするには通常、いくつかの要素が考慮される[7]。選択された諸々の記録を残すということが、ひとかたまりの記録群ないしフォンド (アーカイブズ)(英語版)に対する研究者らのとらえ方を形づくることになるため、このプロセスは困難かつ重要なものとなる。InterPARES(英語版) 2プロジェクト[8]で作成された保存連鎖モデル(Chain of Preservation model)[9]では、項目A4.2として評価選別が整理されている。このような評価選別は、適正な市場価値(英語版)を見極める金銭的な査定とは異なる。

評価選別は一度きりの場合もあれば、受入・処理の諸段階でなされる場合もありうる。高次のレベルで記録の機能分析を行うマクロ評価選別は[10]、受入対象とすべきものを見極めるために、記録の受入前に実施されることもあるだろう。記録の処理中により詳細かつ反復的な評価選別の作業がなされることもありうる。

評価選別はデジタル形式のものに限らず、すべての保存対象資料に対してなされる。従来、アナログ形式の記録の場合は評価選別後にその記録が保持されることになっていたわけだが、デジタルの文脈では、ストレージにかかるコストが低下するとともに、情報密度が低い記録群からも研究者らが価値を見出せるような高度のディスカバリツールを利用できるようになったことが主要因となり、より多くの記録を保持するのが望ましいのではないか、という指摘がなされてきた[11][12] 。アナログの文脈では、そうした記録は廃棄されるか、あるいは代表的なサンプルのみが保管されることになるかもしれない。しかし、資料の選択・評価・優先付けは、組織が責任をもってそのような資料群全体を管理できるかどうかという点を考慮に入れたうえで、慎重に検討されなければならない。

往々にして図書館は、そしてそれほどではないにせよアーカイブズも、デジタルにせよアナログにせよ、異なる形式で同じ資料を扱わざるをえない場合がある。そうした機関では、コンテンツの長期保存にとってもっとも好ましいと思われる形式のものが選択されやすい。米国議会図書館は、長期保存に適切なフォーマットの推奨リストを作成している[13]。このようなリストは、たとえば出版社から資料を直接図書館へ法定納入する場合などに参照される。
識別(識別子および記述メタデータ)

デジタル保存およびコレクション管理においては、識別子を付与し、精確な記述メタデータを記すことで、対象となるオブジェクトが発見・識別しやすくなる。識別子とはオブジェクトや記録(レコード)を参照するために用いられるユニークなラベルのことで、通常、数字や数値・文字からなる記号列として表される。データベースのレコードやインベントリに含まれるメタデータの重要な要素として、識別子は、オブジェクトとその諸々のインスタンスを区別するために、その他の記述メタデータとともに利用される[14]


次ページ
記事の検索
おまかせリスト
▼オプションを表示
ブックマーク登録
mixiチェック!
Twitterに投稿
オプション/リンク一覧
話題のニュース
列車運行情報
暇つぶしWikipedia

Size:176 KB
出典: フリー百科事典『ウィキペディア(Wikipedia)
担当:undef