この記事は検証可能な参考文献や出典が全く示されていないか、不十分です。出典を追加して記事の信頼性向上にご協力ください。(このテンプレートの使い方)
出典検索?: "アーカイブ" コンピュータ
アーカイブ(英: archive)とはコンピュータにおいてデータ群を纏めて一体で保存することを指す[1][2]。データと、ファイル作成日時や作成者などの付随するメタデータを関連づけ長期間保存する目的で用いられる。巻物化。
一つ以上のファイル(およびディレクトリ)とメタデータとをアーカイブ化した(一つのファイルへと変換された)ファイルをアーカイブファイルと呼ぶ。加えて可逆データ圧縮を併用し、アーカイブファイルのサイズを縮小することも少なくない。 アーカイブはデータの書き換えを想定せずオリジナルのファイルを長期間保存する。バックアップと似た概念でしばしば混同されるが、バックアップはデータの最新版を保存して災害時にロールバックしやすくするものである[1][2]。 電子メールを例に考える。1年前のメールは今日届いたメールにくらべて重要度は低いが、後で検索・閲覧できるようにしておく事も必要となる。この過去のメールは然程素早く取り出せる必要がないとすれば、「今日のメールは高速アクセスできるストレージへ」、「過去メールは低速だがメディアが安価なストレージへ」と階層化して保存する手法が考えられる。これは階層型ストレージ管理技術と呼ばれ、データの検索性を保持したままストレージのコストを抑えられる。メールアーカイブの身近な例はGmailにある[3]。見終わったメールを削除ではなくアーカイブすることで、受信メールには表示されないが検索するだけで閲覧出来る。 一つ以上のファイルとメタデータを一つのファイルへ変換するユーティリティソフトウェア。単にアーカイバ(英語: archiver)と呼ぶこともある。 ar、tar、cpioなどのコマンドラインツールを使いアーカイブファイルを作成する。これらは圧縮機能を持たない。 UNIXではgzip、bzip2、xzなどの追加のツールと組み合わせて圧縮を行う。圧縮の過程でファイル名に拡張子が追加される。たとえば、ファイル一式をtarでアーカイブして、作成されたアーカイブファイルをgzipで圧縮したファイルの拡張子は.tar.gzとなる。 Microsoft Windowsに標準で組み込まれているアーカイバ (ZIP圧縮フォルダ、CAB圧縮フォルダ、LZH圧縮フォルダ)や、WinRARや7-zipなどの多くのサードパーティのアーカイブソフトウェアは、グラフィカルユーザーインターフェイスを使用して操作を行う。また、コマンドラインインターフェイスも提供するものもあるが、Windowsには標準搭載されていない。Windowsで利用するアーカイバは、アーカイブ機能と圧縮機能の両方を一緒に行う。ソリッド圧縮は、Windows自体はサポートしていないが、WinRARと7-zipなどサードパーティの製品では提供されるものもある。 ファイルアーカイバによって変換されたファイルをアーカイブファイルと呼ぶ。日本語では書庫とも呼ばれる。アーカイブファイルを作成する工程をアーカイブあるいは書庫化と呼ぶ。アーカイブファイルのファイル形式はarやtarが代表的である。関連項目も参照。アーカイブファイルから元のファイルを取り出す操作を展開(英語: extract)、解凍、または抽出と呼ぶ。 アーカイブではファイル圧縮することが多い。ただし、ファイル圧縮は必ずしもアーカイブファイルを作成することを意味しない。ZIP等。その一方でアーカイブファイルの中から1つのファイルだけを解凍することを考慮したフォーマットもある。例えばZIPでは圧縮した後にアーカイブする。他にも圧縮時にデータを決まったサイズのブロックに分けて符号化することで、目的のファイル周辺だけを解凍して取得可能にする方式もある。 ファイルをデータ圧縮する場合には可逆圧縮が用いられる。ファイル圧縮の方式の中には、複数のファイルを1つにまとめて扱えるようにするアーカイブ機能を兼ね備えるものもある。 ファイル圧縮は、パーソナルコンピューターの分野では1980年代後半頃からパソコン通信の発達とともにLHAやZIPなどの圧縮方式が誕生した。 複数ファイルの圧縮ではtarなどの無圧縮アーカイブ形式と共に使われる。例えばtarでアーカイブした後にgzipで圧縮した場合は拡張子が .tar.gz となる。Webブラウザで使える形式も存在する (現行は☆、過去は★)[4]。
特徴
ファイルアーカイバ
UNIXにおけるアーカイバ
アーカイブファイルの圧縮
Windowsにおけるアーカイバ
アーカイブファイル
ファイル圧縮
主な圧縮アーカイブ形式
ZIP - パーソナルコンピューターの分野で普及している圧縮形式。圧縮方式は主にDeflate法が使用される。
7z - 7-Zipで扱うことの出来る多機能な高圧縮形式。オープンソース。圧縮方式は主にLZMA法が使用される。
RAR - マルチメディア系の圧縮が得意な高圧縮形式
ZPAQ - 増分バックアップやロールバックに対応した圧縮最重視の超高圧縮形式
CAB (Cabinet archive) - Windowsが標準で利用できる圧縮形式
GCA, DGCA (G Compression Archive) - テキストデータに強い日本産圧縮形式
LHA - 純日本産の圧縮形式。LZHとも
StuffIt - Macintosh系列で利用される圧縮形式
Compact Pro - Macintosh系列で利用された圧縮形式。開発は終了している。
主なストリーミング圧縮形式
pack (*.z) - UNIXの初期からある形式。今ではほとんど使われず、compressに取って代わられている。
compress★ (*.Z) - packの置き換えとして商用UNIXで標準で使われている形式。今ではほとんど使われず、gzipに取って代わられている。
gzip☆ (GNU Zip; *.gz) - 商用UNIXに標準のcompressにはLZWアルゴリズムの特許の問題があり、フリーの代用品として開発された。圧縮方式はDeflate法が使用される。
Deflate☆ - HTTPプロトコルで使われている圧縮方式。gzipと同じアルゴリズムだがヘッダが異なる。
bzip
Size:23 KB
出典: フリー百科事典『ウィキペディア(Wikipedia)』
担当:undef