Spectral_modeling_synthesis
[Wikipedia|▼Menu]
.mw-parser-output .tmulti .thumbinner{display:flex;flex-direction:column}.mw-parser-output .tmulti .trow{display:flex;flex-direction:row;clear:left;flex-wrap:wrap;width:100%;box-sizing:border-box}.mw-parser-output .tmulti .tsingle{margin:1px;float:left}.mw-parser-output .tmulti .theader{clear:both;font-weight:bold;text-align:center;align-self:center;background-color:transparent;width:100%}.mw-parser-output .tmulti .thumbcaption{background-color:transparent}.mw-parser-output .tmulti .text-align-left{text-align:left}.mw-parser-output .tmulti .text-align-right{text-align:right}.mw-parser-output .tmulti .text-align-center{text-align:center}@media all and (max-width:720px){.mw-parser-output .tmulti .thumbinner{width:100%!important;box-sizing:border-box;max-width:none!important;align-items:center}.mw-parser-output .tmulti .trow{justify-content:center}.mw-parser-output .tmulti .tsingle{float:none!important;max-width:100%!important;box-sizing:border-box;align-items:center}.mw-parser-output .tmulti .trow>.thumbcaption{text-align:center}}スペクトラルモデリング合成Roads 1996, p. 153[1]を日本語訳

Spectral modeling synthesis (SMS; スペクトラルモデリング合成) は正弦波と色付きノイズを用いた楽音分析合成手法[2]および音声分析合成手法である[3]
概要SMS分析/合成の処理概要    Bonada et al. 2001 Fig.1 & 2に基く

SMSは調波成分 と 残余成分 (非調波成分; ノイズ成分) の組合せとしてモデル化する。

楽音分析合成 / 音声分析合成として次の要素から構成される。

分析

調波成分: 短時間フーリエ変換のピーク検出および軌跡化による周波数・位相・振幅抽出

残余成分: 短時間フーリエ変換残差(全体-調波) によるノイズスペクトル抽出



特徴量

調波成分: 周波数・位相・振幅 (時変)

残余成分: スペクトル (時変)


合成

調波成分: 加算合成 (※ フェーズボコーダと同様)

残余成分: ホワイトノイズ[4]に対する減算合成
(※ 場合によってはソース・フィルタモデル適用)

このモデルは多くのタイプのオーディオ信号に適用できる。例えば音声信号は、声帯振動で生じるゆっくり変化する調波音と、唇や口で生じる広帯域ノイズ状音を含む。同様に楽器も、調波成分と、ノートの発音/変更時に生じるノイズ状音の両方を発する。
関連項目

音響解析

音響合成
Sinusoidal modelingSinusoidal Analysis/Synthesis System (McAulay & Quatieri 1988, p. 161[5] に基く)

Sinusoidal modeling (調波合成モデル: 周波数が整数比の正弦波の総和)

Composite sinusoidal model (非調波合成モデル: 任意周波数の正弦波の総和)


音声分析合成

ソース・フィルタモデル (音声生成モデル)

適応フィルタ

線形予測法

LPC

CELP



フェーズボコーダ

脚注^ Roads 1996, p. 153, Figure 4.23: Overview of spectrum modeling synthesis.
^ 本手法は調波解析/調波合成に基づいており、その意図は調波成分が主役となる楽音音響分析音響合成である。
^ Serra & Smith 1990, p. 12. "It describes a technique called spectral modeling synthesis [SMS], that models time-varying spectra as (1) a collection of sinusoids controlled through time by piecewise linear amplitude and frequency envelopes (the deterministic part), and (2) a time-varying filtered noise component (the stochastic part). The analysis procedure first extracts the sinusoidal trajectories by tracking peaks in a sequence of short-time Fourier transforms. These peaks are then removed by spectral subtraction. The remaining “noise floor” is then modeled as white noise through a time-varying filter. A piecewise linear approximation to the upper spectral envelope of the noise is computed each successive spectrum, and the stochastic part is synthesized by mean of the overlap-add technique."
^ 加法性ホワイトガウスノイズ (AWGN): パワースペクトル(周波数領域の強度)が全周波数で同じ強度(=白色)で、振幅分布(時間領域の強度)がガウス分布に従うノイズ
^ McAulay & Quatieri 1988, p. 161, Fig. 8. "This block diagram of the sinusoidal analysis/synthesis system illustrates the major functions subsumed within the system. Neither voicing decisions nor residual waveforms are required for speech synthesis."

参考文献body:not(.skin-minerva) .mw-parser-output .columns-list__wrapper{margin-top:0.3em}body:not(.skin-minerva) .mw-parser-output .columns-list__wrapper>ul,body:not(.skin-minerva) .mw-parser-output .columns-list__wrapper>ol{margin-top:0}body:not(.skin-minerva) .mw-parser-output .columns-list__wrapper--small-font{font-size:90%}


次ページ
記事の検索
おまかせリスト
▼オプションを表示
ブックマーク登録
mixiチェック!
Twitterに投稿
オプション/リンク一覧
話題のニュース
列車運行情報
暇つぶしWikipedia

Size:14 KB
出典: フリー百科事典『ウィキペディア(Wikipedia)
担当:undef