ITU-T P.862 で定義されている PESQ は電話などでの音声の受聴品質の客観評価を行うためのアルゴリズムで、その前身の PSQM
を改良したものである。遅延やエコーなど会話品質での劣化要因は考慮されていない。 PESQ はリファレンス音声(原音)と評価対象音声とを入力とし、以下の2段階の処理により評価値を推定する。ITU-T P.862 は 300-3400Hz の電話帯域の音声信号の評価を対象とする。同様のアルゴリズムを用い 7kHz の広帯域音声を対象とする勧告としてITU-T P.862.2 がある。 オーディオの客観品質評価法として古くから使われてきたのは信号対雑音比や歪率だが、現代のデジタル信号処理を使った様々なオーディオ圧縮コーデックでは有効な評価方法ではない[11]。そのため、音声の客観品質評価法と同様、オーディオでの新しい客観品質評価法が研究されている。ITU-R BS.1387-1 で定義されている PEAQ ITU-R BS.1387-1 で定義されている PEAQ はオーディオの客観評価を行うためのアルゴリズムである。デジタル放送やデジタル機器などで使用されているさまざまなビットレートのオーディオ圧縮コーデックの評価などを行うためのもので、それまでに提案されたいくつかのオーディオ客観品質評価法を研究して優れたところを1つにまとめたものである[11]。ただしこの方法は主観品質評価を補完するためのものであって、正式なリスニング試験の代わりになるものではない[11]。 PEAQ は、音声の客観品質評価法と同様、リファレンス音(原音)と評価対象音とを入力とし、以下の2段階の処理により評価値を推定する。 聴覚心理モデルとしては、FFTベースの耳モデルとフィルタバンクベースの耳モデルの2種類が定義されている。用途に応じ、FFTベースのみ、あるいはFFTベースとフィルタバンクベース両方のいずれかが使われる。 認知モデリングでは知覚モデリングの出力を用いて音質に関係するさまざまな聴感上のモデル変数値(16種類)が計算され、これらの値から人工ニューラルネットワークを用いて Objective Difference Grade(ODG、客観品質劣化度合)と呼ばれる最終的な劣化度合が計算される。ODG は、BS.1116-1 のような主観品質評価法での評価値「わからない:評価値 5.0 」?「非常に気になる:評価値 1.0 」について、評価対象信号の主観的評価値からリファレンス信号の主観的評価値を引いた Subjective Difference Grade(SDG、主観劣化度合い)に対応するものである。SDG は以下の式で表される。 S D G = G r a d e S i g n a l U n d e r T e s t − G r a d e R e f e r e n c e S i g n a l {\displaystyle SDG=Grade_{SignalUnderTest}-Grade_{ReferenceSignal}} SDG 値は 0 ? -4 までの値をとり、0 は劣化が分からず、-4 は劣化が非常に気になる状態を表す。
客観品質評価法(オーディオ)
PEAQ
知覚モデリング :リファレンス/評価対象音を人間の聴覚心理モデルにもとづき周波数領域でパラメータ化
認知モデリング :パラメータ化した値の差からさまざまなモデル変数値を計算し劣化度合を求める
脚注^ N. Remy. Sound quality : a definition for a sonic architecture. Proc. 12th International Congress on Sound and Vibration, Lisbon. July 2005.
^ Ted Painter, Andreas Spanias. Perceptual Coding of Digital Audio. Proceedings of the IEEE, pp.451-513. 2000.
^ a b Jacob Benesty, M. M. Sondhi, Yiteng Huang (ed). Springer Handbook of Speech Processing. Springer, 2007. ISBN 978-3540491255.
^ a b c d “ ⇒主観評価と客観評価”. 2010年6月15日閲覧。
^ Glen Ballou (ed). Handbook for Sound Engineers, Second Edition: The New Audio Cyclopedia. Focal Press, 1991. ISBN 978-0240803319.
^ 石川 俊行, 降旗 建治, 柳沢 武三郎. 音楽再生時における物理的歪と音色の好みの関係. Technical report of IEICE. EA 102(398), pp.57-62, 2002. など参照のこと。
^ ⇒ITU-T 勧告 P.800: Methods for subjective determination of transmission quality
^ ⇒ITU-R 勧告 BS.1284: General methods for the subjective assessment of sound quality
^ ⇒ITU-R 勧告 BS.1116: Methods for the subjective assessment of small impairments in audio systems including multichannel sound systems
^ a b G. Stoll, F. Kozamernik. EBU listening tests on Internet audio codecs. EBU TECHNICAL REVIEW. June, 2000.
^ a b c ⇒ITU-R 勧告 BS.1387: Method for objective measurements of perceived audio quality (PEAQ)
参考文献
Glen Ballou (ed). Handbook for Sound Engineers, Second Edition: The New Audio Cyclopedia. Focal Press, 1991. ISBN 978-0240803319.
Jacob Benesty, M. M. Sondhi, Yiteng Huang (ed). Springer Handbook of Speech Processing. Springer, 2007. ISBN 978-3540491255.
Ted Painter, Andreas Spanias. Perceptual Coding of Digital Audio. Proceedings of the IEEE, pp.451-513. 2000.
N. Remy. Sound quality : a definition for a sonic architecture. Proc. 12th International Congress on Sound and Vibration, Lisbon. July 2005.
G. Stoll, F. Kozamernik. EBU listening tests on Internet audio codecs. EBU TECHNICAL REVIEW. June, 2000.
“ ⇒音声品質評価法(NTT技術解説)”. 2010年6月15日閲覧。
⇒ITU-T 勧告 P.563: Single-ended method for objective speech quality assessment in narrow-band telephony applications (no-reference algorithm)
⇒ITU-T 勧告 P.800: Methods for subjective determination of transmission quality
⇒ITU-T 勧告 P.830: Subjective performance assessment of telephone-band and wideband digital codecs
⇒ITU-T 勧告 P.861: Objective quality measurement of telephone-band (300-3400 Hz) speech codecs
⇒ITU-T 勧告 P.862: Perceptual evaluation of speech quality (PESQ): An objective method for end-to-end speech quality assessment of narrow-band telephone networks and speech codecs
⇒ITU-T 勧告 P.862.2: Wideband extension to Recommendation P.862 for the assessment of wideband telephone networks and speech codecs
⇒ITU-T 勧告 P.862.3: Application guide for objective quality measurement based on Recommendations P.862, P.862.1 and P.862.2
⇒ITU-R 勧告 BS.1116: Methods for the subjective assessment of small impairments in audio systems including multichannel sound systems
⇒ITU-R 勧告 BS.1284: General methods for the subjective assessment of sound quality
⇒ITU-R 勧告 BS.1387: Method for objective measurements of perceived audio quality (PEAQ)
⇒ITU-R 勧告 BS.1534: Method for the subjective assessment of intermediate quality levels of coding systems (MUSHRA)
関連項目
音声符号化
オーディオ圧縮
コーデック
データ圧縮
了解度
歪率
音響機器
電気通信
デジタル信号処理
音響心理学
外部リンク.mw-parser-output .side-box{margin:4px 0;box-sizing:border-box;border:1px solid #aaa;font-size:88%;line-height:1.25em;background-color:#f9f9f9;display:flow-root}.mw-parser-output .side-box-abovebelow,.mw-parser-output .side-box-text{padding:0.25em 0.9em}.mw-parser-output .side-box-image{padding:2px 0 2px 0.9em;text-align:center}.mw-parser-output .side-box-imageright{padding:2px 0.9em 2px 0;text-align:center}@media(min-width:500px){.mw-parser-output .side-box-flex{display:flex;align-items:center}.mw-parser-output .side-box-text{flex:1}}@media(min-width:720px){.mw-parser-output .side-box{width:238px}.mw-parser-output .side-box-right{clear:right;float:right;margin-left:1em}.mw-parser-output .side-box-left{margin-right:1em}}ウィクショナリーに関連の辞書項目があります。音質
⇒ITU-T 勧告 ITU-T ウェブページ(英語)
⇒ITU-R 勧告 ITU-R ウェブページ(英語)