倍音加算合成
[Wikipedia|▼Menu]

音響信号処理における加算合成(かさんごうせい、: additive synthesis)は複数の純音を重ね合わせ(加算して)音響信号を合成する、音声合成の一種である[1][2]。アディティブ・シンセシスとも呼ばれる。対比される合成手法に減算合成がある。
概要.mw-parser-output .side-box{margin:4px 0;box-sizing:border-box;border:1px solid #aaa;font-size:88%;line-height:1.25em;background-color:#f9f9f9;display:flow-root}.mw-parser-output .side-box-abovebelow,.mw-parser-output .side-box-text{padding:0.25em 0.9em}.mw-parser-output .side-box-image{padding:2px 0 2px 0.9em;text-align:center}.mw-parser-output .side-box-imageright{padding:2px 0.9em 2px 0;text-align:center}@media(min-width:500px){.mw-parser-output .side-box-flex{display:flex;align-items:center}.mw-parser-output .side-box-text{flex:1}}@media(min-width:720px){.mw-parser-output .side-box{width:238px}.mw-parser-output .side-box-right{clear:right;float:right;margin-left:1em}.mw-parser-output .side-box-left{margin-right:1em}}.mw-parser-output .listen .side-box-text{line-height:1.1em}.mw-parser-output .listen-plain{border:none;background:transparent}.mw-parser-output .listen-embedded{width:100%;margin:0;border-width:1px 0 0 0;background:transparent}.mw-parser-output .listen-header{padding:2px}.mw-parser-output .listen-embedded .listen-header{padding:2px 0}.mw-parser-output .listen-file-header{padding:4px 0}.mw-parser-output .listen .description{padding-top:2px}.mw-parser-output .listen .mw-tmh-player{max-width:100%}@media(max-width:719px){.mw-parser-output .listen{clear:both}}@media(min-width:720px){.mw-parser-output .listen:not(.listen-noimage){width:320px}.mw-parser-output .listen-left{overflow:visible;float:left}.mw-parser-output .listen-center{float:none;margin-left:auto;margin-right:auto}}アディティブ・シンセシスの例21個の部分音を加算合成したベル音この音声や映像がうまく視聴できない場合は、Help:音声・動画の再生をご覧ください。

音響信号は正弦波の重ね合わせで表現できる。またヒトの聴覚には可聴域が存在するため聞こえる周波数に上限がある。このことは周期信号と聴覚上等価な合成音を正弦波の有限和で表現できることを示唆する(詳細: #理論的背景)。

加算合成は有限個の正弦波を加算して音を合成する手法の総称である。正弦波の周波数・振幅・位相を適切に設定することで多様な音を生成・再現できる。

実装としては事前計算した波形テーブル(ウェーブテーブル・シンセシス)や逆高速フーリエ変換を活用できる。

合成要素となる個々の正弦波は部分音(パーシャル)と呼ばれる。特に倍音はハーモニック・パーシャル(調波)、非倍音はインハーモニック・パーシャル(非調波)と呼ばれる。
理論的背景フーリエ級数による
方形波の近似(最初の4項)

音響信号は正弦波の重ね合わせで表現できる(フーリエ変換)。さらに信号が周期性を持っていれば、その信号は正弦波の無限和で(積分せずに)表現できる(フーリエ級数)。 y ( t ) = r 0 + r 1 cos ⁡ ( 2 π f o t ) + ⋯ + r k cos ⁡ ( 2 π k f o t ) + ⋯ {\displaystyle y(t)=r_{0}+r_{1}\cos(2\pi f_{o}t)+\cdots +r_{k}\cos(2\pi kf_{o}t)+\cdots } 「フーリエ級数」および「フーリエ解析」も参照

また、ヒトには知覚可能な周波数範囲(可聴域)が存在する。標準的には15kHzが上限でありそれ以上の音を聞き取ることができない。これは信号から可聴域外の成分を取り除いても聴覚上の差がない(=等価である)ことを意味する。「聴覚#可聴域」も参照

この2つの事実は、ある周期的な音響信号と聴覚上等価な信号を正弦波の有限和で表現できることを示唆する。なぜなら正弦波の無限和に含まれる15kHz以上の正弦波成分を除いても聴覚上等価な信号が構成でき、それは有限個の正弦波の和を意味するからである。
手法

加算合成は有限個の正弦波を加算して音を合成する手法の総称である。パラメータの時変性や周波数制約に基づき、様々なタイプの加算合成が存在する。

以下、各部分音のインデックスを k {\displaystyle k} 、初期位相を ϕ k {\displaystyle \phi _{k}} 、部分音の総数を K {\displaystyle K} 、合成音を y ( t ) {\displaystyle y(t)} とする。各部分音において周波数を f k {\displaystyle f_{k}} 、振幅を r k {\displaystyle r_{k}} とし、これが時変の場合は瞬時周波数 f k ( t ) {\displaystyle f_{k}(t)\,} 、瞬時振幅 r k ( t ) {\displaystyle r_{k}(t)} を用いる。

次の表は様々な制約をもった加算合成を表現する式の一覧である。各手法は以降の節で詳説されている。

表. 制約付き加算合成時変振幅 (AM)時変周波数 (FM)調波構造合成式
--- y ( t ) = ∑ k = 1 K r k cos ⁡ ( 2 π f k t + ϕ k ) {\displaystyle y(t)=\sum _{k=1}^{K}r_{k}\cos \left(2\pi f_{k}t+\phi _{k}\right)}
?-- y ( t ) = ∑ k = 1 K r k ( t ) cos ⁡ ( 2 π f k t + ϕ k ) {\displaystyle y(t)=\sum _{k=1}^{K}r_{k}(t)\cos \left(2\pi f_{k}t+\phi _{k}\right)}
-?- y ( t ) = ∑ k = 1 K r k cos ⁡ ( 2 π ∫ 0 t f k ( u ) d u + ϕ k ) {\displaystyle y(t)=\sum _{k=1}^{K}r_{k}\cos \left(2\pi \int _{0}^{t}f_{k}(u)du+\phi _{k}\right)}
??- y ( t ) = ∑ k = 1 K r k ( t ) cos ⁡ ( 2 π ∫ 0 t f k ( u )   d u + ϕ k ) {\displaystyle y(t)=\sum _{k=1}^{K}r_{k}(t)\cos \left(2\pi \int _{0}^{t}f_{k}(u)\ du+\phi _{k}\right)}
??? y ( t ) = ∑ k = 1 K r k ( t ) cos ⁡ ( 2 π ∫ 0 t k f o ( u )   d u + ϕ k ) {\displaystyle y(t)=\sum _{k=1}^{K}r_{k}(t)\cos \left(2\pi \int _{0}^{t}kf_{o}(u)\ du+\phi _{k}\right)}

時不変時不変加算合成器の構成定周波数・振幅の正弦波が生成(?)、加算(+)されて合成音となる。

単純な加算合成では単一合成区間内で周波数と振幅を固定する(時不変)。この方式は次のように定義される[3]: y ( t ) = ∑ k = 1 K r k cos ⁡ ( 2 π f k t + ϕ k ) {\displaystyle y(t)=\sum _{k=1}^{K}r_{k}\cos \left(2\pi f_{k}t+\phi _{k}\right)}
時変振幅

振幅が時間変化するハーモニック・アディティブ・シンセシスの例
(基本周波数 f0 = 440 Hz)

振幅を時間に応じて変化させる場合(c.f. 振幅変調)、次のように定義される: y ( t ) = ∑ k = 1 K r k ( t ) cos ⁡ ( 2 π f k t + ϕ k ) {\displaystyle y(t)=\sum _{k=1}^{K}r_{k}(t)\cos \left(2\pi f_{k}t+\phi _{k}\right)}

帯域制限(band-limited signal)の観点から、 r k ( t ) {\displaystyle r_{k}(t)\,} の変化は振幅変調による帯域の広がり Δ f r k ( t ) {\displaystyle \Delta f_{r_{k}}(t)\,} が 隣接部分音間の周波数間隔より有意に小さくなるよう[4][5][注釈 1]、充分ゆっくりした速度で変化させる必要がある[1][注釈 2]


次ページ
記事の検索
おまかせリスト
▼オプションを表示
ブックマーク登録
mixiチェック!
Twitterに投稿
オプション/リンク一覧
話題のニュース
列車運行情報
暇つぶしWikipedia

Size:123 KB
出典: フリー百科事典『ウィキペディア(Wikipedia)
担当:undef