ファイルには、大きく分けてバイナリファイルとテキストファイルに区分される。バイナリファイルには、コンピュータ内部でプログラムが直接処理するデータがそのまま格納されている一方、テキストファイルでは、文字コードに従い文字により表現されたデータとして格納されているため、人間が読む事ができる。どちらもテキストエディタ等(Windowsでは、「メモ帳」等)で強制的に開き表示させることが可能だが、バイナリファイルが文字化けを起こすのに対して、テキストデータでは一定の文字列となって表示される。今日、広く利用されているワープロソフトで作成された文章ファイルもバイナリファイルの一種である。
MS-DOSなどキャラクタベースのオペレーティングシステム (OS) では、ファイル名に拡張子は付けられていても、依然各ソフトウェアではファイルの種別を意識することが必要であった。Windowsにおいて拡張子によるアプリケーションの関連づけが本格導入されて以降は、プログラムソースやバッチファイル、音楽演奏ソフトウェアで設定したプレイリスト(Windows上では拡張子が“m3u”など)の実体はテキストファイルであるなど、一般的なパソコン利用者にとってはあまり意味の無い区分になっている。
バイナリファイルの一部には、ファイルの先頭部分に決まったデータを含む場合がある(これをヘッダと言う)。一部のソフトウェアでは、この文字情報を参照して、データの種別や、データのフォーマットのバージョンを判断したりする(パソコンに既に入っているソフトウェアで開けるかどうかを確認するなど)ものがある。(Mac OSでは伝統的にこれを参照する他、正体の判らないファイルを判別するのに、これを利用する技術者やハッカーも居る。)また、バイナリファイルをバイナリデータとして開き、直接編集するためのバイナリエディタと呼ばれる専用のソフトウェアも存在する。
コンピュータ側では、幾つかの段階を経て、画面上にデータの一つの塊として表示しているが、これをよりコンピュータ側からの視点で見た場合に、幾つものデータを寄せ集めて一つに見せている事もある。
ハードディスクはこれらファイルを保存しておくための記憶装置だが、この中にはトラックやセクター(更にはクラスタ)と呼ばれる細かい区分が用意されており、この細かい区分複数個に跨って情報が格納される。丁度何巻にも分かれている大作長編小説のように区分けされて保管された情報は、更に突き詰めればビットと呼ばれるON/OFFの関係にある点(スイッチ)の集合であるが、これらはコンピュータの基礎部分のプログラムやOSのファイルシステムによって制御され、最終的に一つのファイルの形で画面上に表示されている。
詳細はフラグメンテーションを参照
特に長期間使っているハードディスクでは、コンピュータは情報を書き込む際に、空いている場所に随時書き込むように設計されているが、扱うデータが一定のサイズではないため、何度も書いたり消したりと言った操作を繰り返す内に、フラグメンテーションと呼ばれる現象が発生する。この現象は、例えるなら前出の長編小説の1巻が本棚右上・2巻が左隅・3巻が中央…といった具合である。
だがコンピュータの誤動作等により、この細かい区分を統合するための情報が損なわれた場合に、これら情報を正確に統合して利用者に提供する事が出来なくなる。前出の長編小説で更に例えるなら「五巻が何処に行ったか見当たらない」というような状態だ。このようなファイル破損では、自動的に復旧するツールもあるが、その機能も絶対ではなく、特にOSのプログラムファイルが破損したり、設定ファイルが呼び出せなくなった場合には、致命的な問題が発生する。
なおコンピュータのファイルは、基本的に複製を作る事が非常に容易い。破損して困るデータは、積極的にバックアップを取る事が勧められる。
関連項目
ディレクトリ
補助記憶装置
ファイルシステム
ファイル名
ファイルフォーマット
ブロック (データ)
カテゴリ: コンピュータのデータ | OSのファイルシステム
更新日時:2008年8月12日(火)06:51
取得日時:2008/08/19 12:29