線スペクトル対(せんスペクトルつい、英: line spectral pairs、LSP)、あるいは線スペクトル周波数(せんスペクトルしゅうはすう、英: line spectral frequencies、LSF)は、線形予測係数を表現するために用いられるもので、その優れた特性のため線形予測を用いる音声符号化方式の多くで使われている。線スペクトル対の考え方は1975年に板倉文忠が発表した[1]。線スペクトル対は全世界の携帯電話での音声符号化に欠かせない基礎技術であり、その重要性のため2014年にIEEEマイルストーン賞に認定された。 携帯電話やVoIPなどで音声符号化を行う際、音声の特徴の1つである声道の周波数特性を線形予測フィルターの係数としてパラメータ化し、送信を行う。しかし線形予測フィルターの係数は量子化誤差に敏感で、誤差が大きいとフィルターが発振する問題がある。 線スペクトル対は線形予測係数と等価な周波数領域の係数で、線スペクトル対で表現されたフィルターは量子化誤差の影響が少なく、また線形予測係数と比較して時間方向の変化が滑らかで補間を行いやすい。そのため、音声符号化に用いた場合より少ない情報量で同等の音声品質が得られ、多くの音声符号化方式で用いられている。 声道を固定長で一定の直径を持つ音響管の並びとしてモデル化した時、線スペクトル対は声門を開いたときと閉じたときそれぞれでの共振周波数の組にあたるパラメータである。くちびる側は完全開放のため反射係数が-1と見なし、声門側は開いたときの反射係数を1、閉じたときの反射係数を-1とモデル化すると、両端でのエネルギー損失が無いため声道全体が無損失系となり、音響管の伝達関数は線スペクトル状になる。この線スペクトルの周波数のペアで線形予測係数を表現するため、線スペクトル対という名称で呼ばれる。 Z変換を使って表した線形予測多項式は次の式で表される。 A ( z ) = 1 − ∑ k = 1 p a k z − k {\displaystyle A(z)=1-\sum _{k=1}^{p}a_{k}z^{-k}} ここで実数の係数 a k {\displaystyle a_{k}\,} は線形予測係数である。この式は以下の2つの式に分解できる。 { P ( z ) = A ( z ) + z − ( p + 1 ) A ( z − 1 ) Q ( z ) = A ( z ) − z − ( p + 1 ) A ( z − 1 ) {\displaystyle {\begin{cases}P(z)=A(z)+z^{-(p+1)}A(z^{-1})\\Q(z)=A(z)-z^{-(p+1)}A(z^{-1})\end{cases}}} ここで P(z) は声門が完全に閉じたとき(反射係数 -1)に対応し、Q(z) は声門が完全に開いたとき(反射係数 1)に対応する。この式が LSP 多項式である[2]。線スペクトル対の値はこの多項式の根で表される。 元の多項式 A(z) は以下の式から容易に復元できる。 A ( z ) = 1 2 ( P ( z ) + Q ( z ) ) {\displaystyle A(z)={\frac {1}{2}}\left(P(z)+Q(z)\right)} 多項式 A(z) の全ての根がz平面 P(z) と Q(z) の根にそれぞれ対応するωは必ず交互に相手のものを間に挟むので,以下のように並べることができる。 0 < ω 1 < ω 2 < ω 3 < ⋯ < ω p < π {\displaystyle 0<\omega _{1}<\omega _{2}<\omega _{3}<\cdots <\omega _{p}<\pi } また、この条件は線スペクトル対を使った合成フィルターが安定であるための必要十分条件でもあることが示されている[3][4]。 線形予測係数を線スペクトル対に変換するためには、P(z) = 0, Q(z) = 0 の根を求める必要がある。以下では単純化のために線形予測多項式 A(z) の次数が偶数 N {\displaystyle N} の場合を考える。この時 LSP 多項式の P(z)、Q(z) は N + 1 {\displaystyle N+1} 次の多項式になる。 LSP 多項式の P(z) と Q(z) はそれぞれ ( 1 + z − 1 ) {\displaystyle (1+z^{-1})} と ( 1 − z − 1 ) {\displaystyle (1-z^{-1})} で割り切れる。残りの多項式は ( z + z − 1 ) / 2 {\displaystyle (z+z^{-1})/2} で割り切れ、単位円上では ( z + z − 1 ) / 2 = cos ω {\displaystyle (z+z^{-1})/2=\cos \omega } と表現できる。
概要
数学的基礎
LSP 分析