音質
[Wikipedia|▼Menu]
□記事を途中から表示しています
[最初から表示]

ITU-R BS.1116

劣化が少ない高品質のオーディオシステムや多チャンネルシステム向けの主観評価法として ITU-R BS.1116-1 が定義されている。BS.1116-1 は DMOS と同様の5段階の評価カテゴリを用いて小数点以下1桁までの評点を決める。

BS.1116-1 の評価カテゴリカテゴリ評点
わからない(Inaudible)5.0
わかるが気にならない(Audible but not annoying)4.0
やや気になる(Slightly annoying)3.0
気になる(Annoying)2.0
非常に気になる(Very annoying)1.0

試験は隠れ基準付き3刺激二重盲検法(double-blind triple-stimulus with hidden reference)で評価を行う。この方法は、リファレンス音(原音)と2つの評価対象音の合計3つの音を聴き比べ、2つの評価対象音の相対評価を行う。2つの評価対象音のどちらかにはランダムにリファレンス音(隠れ基準、hidden reference)が含まれ、必ず一方に 5.0 の評点を付ける。この方法は毎回3つの音を比較するため時間がかかるが、僅かな劣化でも検出できるため劣化が少ないシステムの評価に向いている[9]
MUSHRA

中品質のオーディオ圧縮システムの品質の主観評価法として ITU-R BS.1534 が定義されている。BS.1534 で定義されている評価方法は MUSHRA法(MUltiple Stimuli with Hidden Reference and Anchor)と呼ばれており、AACHE-AAC など様々なオーディオ用コーデックの評価・比較に使われている。

MUSHRA法では、一度にリファレンス音(原音)と複数の評価対象音、隠れ基準(リファレンス音)、隠れアンカー(最も劣化の大きな音)を提示でき、評価者が自由に切り替えて聞くことができる。リファレンス音以外の提示の順番はランダムに変わり、どれが隠れ基準/隠れアンカーかも分からない。評価は5段階の連続品質尺度を用い、平均オピニオン評点の「非常に良い(Excellent)」?「非常に悪い(Bad)」までの段階を 100 から 0 までの連続値で表す。

中品質から低品質の音を評価する場合、評価対象音とリファレンス音との差が大きくなるのに対し、異なった評価対象音の差は相対的に小さくなる。異なったコーデックの音を比較する場合など、BS.1116 のようリファレンス音との差のみで評価すると誤差が大きくなる可能性がある。MUSHRA法ではリファレンス音との比較だけでなく異なったコーデック音の間の比較も評価者が自由に行えるため、正しい評価が容易になる[10]。また、隠れアンカーにより劣化した音の聞こえ方が具体的に分かり、劣化を区別をしやすくなる[10]。隠れ基準(リファレンス音)が評価対象音に含まれるため、必ず1つの評価対象音は 100 の評点になる。

隠れアンカー(最も劣化の大きな音)として、原音(リファレンス音)に 3.5kHz のローパスフィルターを通し高音をカットした音を用いる。隠れアンカーは複数含まれてもよく、7kHz のローパスフィルターを通した音、雑音を加えた音、ステレオ感を無くした音などが使われる。
客観品質評価法(音声)

平均オピニオン評点に代表される主観品質評価法はコスト・時間が掛かるという欠点があり、主観評価と対応の良い音声の客観品質評価法は古くから研究されてきた。最も基本的な評価方法として、元の音声信号と通信回線などを通過してきた信号とから信号対雑音比(signal-to-noise ratio、SNR)を求める方法と、短い時間単位で測定した信号対雑音比を長時間の音声区間で平均したセグメンタルSNR(SSNR)があり、単純なアルゴリズムで値が求まるため以前から使われてきた。求まる値は、音声波形を変えない特定のシステムでは主観評価と相関関係にあるが、複雑な音声符号化方式を使うもっと一般的なシステムでは主観評価値とかけ離れたものとなってしまう欠点がある。

また、人間がフォルマントなど周波数領域のパラメータで音声を認識していることを利用した、音声スペクトルの形状や形状を与えるパラメータによる歪みの評価も可能で、板倉-斎藤距離(Itakura-Saito distance)、LPCケプストラム距離(linear predictive coding cepstral distance)などを用いたものが提案されている。

これらをさらに発展させ人間の様々な聴覚心理学上の特性を考慮したパラメータを用いた受聴品質の客観評価方法として、ITU-T P.861(PSQM、perceptual speech quality measure)と、それの改良版であるITU-T P.862(PESQ、perceptual evaluation of speech quality)がある。
PESQ

ITU-T P.862 で定義されている PESQ は電話などでの音声の受聴品質の客観評価を行うためのアルゴリズムで、その前身の PSQM を改良したものである。遅延やエコーなど会話品質での劣化要因は考慮されていない。 PESQ はリファレンス音声(原音)と評価対象音声とを入力とし、以下の2段階の処理により評価値を推定する。
知覚モデリング :リファレンス/評価対象音声を人間の聴覚心理モデルに基き周波数領域でパラメータ化

認知モデリング :パラメータ化した値から雑音や歪みなどの妨害値を計算し MOS 値にマッピング

ITU-T P.862 は 300-3400Hz の電話帯域の音声信号の評価を対象とする。同様のアルゴリズムを用い 7kHz の広帯域音声を対象とする勧告としてITU-T P.862.2 がある。
客観品質評価法(オーディオ)

オーディオの客観品質評価法として古くから使われてきたのは信号対雑音比歪率だが、現代のデジタル信号処理を使った様々なオーディオ圧縮コーデックでは有効な評価方法ではない[11]。そのため、音声の客観品質評価法と同様、オーディオでの新しい客観品質評価法が研究されている。ITU-R BS.1387-1 で定義されている PEAQ(perceived evaluation of audio quality)はその代表的なものである。
PEAQ

ITU-R BS.1387-1 で定義されている PEAQ はオーディオの客観評価を行うためのアルゴリズムである。デジタル放送やデジタル機器などで使用されているさまざまなビットレートオーディオ圧縮コーデックの評価などを行うためのもので、それまでに提案されたいくつかのオーディオ客観品質評価法を研究して優れたところを1つにまとめたものである[11]。ただしこの方法は主観品質評価を補完するためのものであって、正式なリスニング試験の代わりになるものではない[11]

PEAQ は、音声の客観品質評価法と同様、リファレンス音(原音)と評価対象音とを入力とし、以下の2段階の処理により評価値を推定する。
知覚モデリング :リファレンス/評価対象音を人間の聴覚心理モデルにもとづき周波数領域でパラメータ化

認知モデリング :パラメータ化した値の差からさまざまなモデル変数値を計算し劣化度合を求める

聴覚心理モデルとしては、FFTベースの耳モデルとフィルタバンクベースの耳モデルの2種類が定義されている。用途に応じ、FFTベースのみ、あるいはFFTベースとフィルタバンクベース両方のいずれかが使われる。

認知モデリングでは知覚モデリングの出力を用いて音質に関係するさまざまな聴感上のモデル変数値(16種類)が計算され、これらの値から人工ニューラルネットワークを用いて Objective Difference Grade(ODG、客観品質劣化度合)と呼ばれる最終的な劣化度合が計算される。ODG は、BS.1116-1 のような主観品質評価法での評価値「わからない:評価値 5.0 」?「非常に気になる:評価値 1.0 」について、評価対象信号の主観的評価値からリファレンス信号の主観的評価値を引いた Subjective Difference Grade(SDG、主観劣化度合い)に対応するものである。SDG は以下の式で表される。 S D G = G r a d e S i g n a l U n d e r T e s t − G r a d e R e f e r e n c e S i g n a l {\displaystyle SDG=Grade_{SignalUnderTest}-Grade_{ReferenceSignal}}

SDG 値は 0 ? -4 までの値をとり、0 は劣化が分からず、-4 は劣化が非常に気になる状態を表す。
脚注^ N. Remy. Sound quality : a definition for a sonic architecture. Proc. 12th International Congress on Sound and Vibration, Lisbon. July 2005.
^ Ted Painter, Andreas Spanias. Perceptual Coding of Digital Audio. Proceedings of the IEEE, pp.451-513. 2000.
^ a b Jacob Benesty, M. M. Sondhi, Yiteng Huang (ed). Springer Handbook of Speech Processing. Springer, 2007. ISBN 978-3540491255.
^ a b c d “ ⇒主観評価と客観評価”. 2010年6月15日閲覧。
^ Glen Ballou (ed). Handbook for Sound Engineers, Second Edition: The New Audio Cyclopedia. Focal Press, 1991. ISBN 978-0240803319.
^ 石川 俊行, 降旗 建治, 柳沢 武三郎. 音楽再生時における物理的歪と音色の好みの関係. Technical report of IEICE. EA 102(398), pp.57-62, 2002. など参照のこと。
^ITU-T 勧告 P.800: Methods for subjective determination of transmission quality
^ITU-R 勧告 BS.1284: General methods for the subjective assessment of sound quality
^ITU-R 勧告 BS.1116: Methods for the subjective assessment of small impairments in audio systems including multichannel sound systems
^ a b G. Stoll, F. Kozamernik. EBU listening tests on Internet audio codecs. EBU TECHNICAL REVIEW. June, 2000.
^ a b cITU-R 勧告 BS.1387: Method for objective measurements of perceived audio quality (PEAQ)


次ページ
記事の検索
おまかせリスト
▼オプションを表示
ブックマーク登録
mixiチェック!
Twitterに投稿
オプション/リンク一覧
話題のニュース
列車運行情報
暇つぶしWikipedia

Size:43 KB
出典: フリー百科事典『ウィキペディア(Wikipedia)
担当:undef