音声ファイルフォーマット
[Wikipedia|▼Menu]
.mw-parser-output .hatnote{margin:0.5em 0;padding:3px 2em;background-color:transparent;border-bottom:1px solid #a2a9b1;font-size:90%}

ウィキペディア記事への音声データの添付についてはHelp:音声・動画の作成と利用をご覧ください。

音声ファイルフォーマット(おんせいファイルフォーマット、: Audio file format)は、データをコンピュータシステム上で格納する際のファイル形式(コンテナフォーマット)の総称である。
概要

音声の符号化には、大別してパルス符号変調(PCM)方式に基づくものと、パルス密度変調(PDM)方式に基づくものとがある。CD-DADVD-Audioに使用される方式は前者であり、Super Audio CDに使用される方式は後者である。リニアPCMは音声信号の強度を特定の量子化ビット数(ビット深度)の数値として表現し、一定の時間間隔(サンプリング周波数)で標本化する。音声信号の強さの代わりに、音声信号の強さの(時間)差分を符号化する方式として差分パルス符号変調(DPCM)や適応的差分パルス符号変調(ADPCM)がある。一方でPDMは音声の波の疎密を1bitで表現して一定の間隔で標本化する。

これらのデータは圧縮されずに格納されるか、ファイルサイズを削減するために圧縮して格納される。その際に、どのような構造で格納されるかを規定するものがファイルフォーマットである。例えば、生のPCMデータは 量子化ビット数[bit/sample]×サンプリング周波数[sample/sec]×時間[sec] で定まる長さのビット列として表されるが、これを音声データとして解釈する場合、それがPCMで符号化された音声であること、量子化ビット数、サンプリングレートなどの情報(メタデータ)が必要である。ファイルフォーマットはこれらデータの配置の仕方・形式(フォーマット)を規定する。リニアPCMを格納したWAVフォーマットは、RIFF識別子、この項目以降のサイズ、フォーマット情報、fmt識別子、fmtチャンクのサイズ、リニアPCMであることを表す情報、チャンネル数(モノラルなら 1、ステレオなら 2)、サンプリングレート、バイトレート、ブロックサイズ、データ識別子、PCMデータのバイト数、PCMデータ、という形式になっている。ただし数値はリトルエンディアンで表現される。より複雑なファイルフォーマットでは、曲名、アーティスト名、アルバムアート(画像データ)、歌詞など、他の付加的情報を格納することもでき、その為のフォーマットが規定される。

ファイルフォーマットコーデックを区別することは重要である。コーデックは生の音声データを符号化(とくに圧縮)/復号する方式であり、ファイルフォーマットは音声をファイルに格納する際の特定の形式を指す。ただし、音声ファイルフォーマットには1つのコーデックが対応する(あるいはひとつの標準的なコーデックが存在する)こともある。複数のコーデックが対応する音声ファイルフォーマットとしては、Matroska AudioMP4などがある。
種類

音声ファイルフォーマットには、主に非圧縮音声の格納に用いられるもの、可逆圧縮音声の格納に用いられるもの、非可逆圧縮音声の格納に用いられるものとがある。
非圧縮音声

PCM形式の非圧縮音声については、WindowsではWAVMac OS ではAIFFに格納されることが標準的である。WAVは柔軟なファイルフォーマットであり、非圧縮/圧縮を問わず、任意のサンプリング周波数とビットレートの音声を格納できる。一方でPDM形式の非圧縮音声はDSDIFFやDSFなどの形式で格納される。詳細はDSDを参照。

WAV - 主にMicrosoft Windowsで使われている標準音声ファイルフォーマット。基本的にはリニアPCMが格納される。ただし他コーデックを格納することも可能である。ファイル内の構造は RIFFを踏襲している。これはIFFフォーマットに似ている。

AIFF - アップルの標準音声ファイルフォーマット。言うなればMacintoshにとってのWAVである。

BWF (Broadcast Wave Format) - 欧州放送連合がWAVの後継として策定した標準音声フォーマットである。BWFではファイルにメタデータを含めることができる。詳しくは、European Broadcasting Union: Specification of the Broadcast Wave Format - A format for audio data files in broadcasting. EBU Technical document 3285, July 1997 を参照。このフォーマットは録音時のフォーマットとして、テレビや映画業界で使われる多くのオーディオワークステーションで採用されている。SMPTEタイムコードをファイルに含めることができるため、別に録画された画像と同期をとるのが容易である。

可逆圧縮を伴うフォーマットでは、録音や再生の際に余分な処理が必要となるが、大量の録音をする場合にはストレージ容量の節約という点で効率的と言える。WAV(正確にはリニアPCM)などの非圧縮形式は、録音対象が複雑な音楽でも全くの静寂であっても、単位時間当たりに同じ量のビットを記録する。例えば、オーケストラの演奏のような複数の音が混じる場合でも、全く音がしない状況でも、非圧縮の場合、単位時間当たりのファイルサイズは同じである。同じものを可逆圧縮方式であるTTAで符号化した場合、前者のファイルはある程度小さくなり、後者のファイルはほとんどゼロに近いサイズになるだろう。


次ページ
記事の検索
おまかせリスト
▼オプションを表示
ブックマーク登録
mixiチェック!
Twitterに投稿
オプション/リンク一覧
話題のニュース
列車運行情報
暇つぶしWikipedia

Size:44 KB
出典: フリー百科事典『ウィキペディア(Wikipedia)
担当:undef