VOCALOID
[Wikipedia|▼Menu]
□記事を途中から表示しています
[最初から表示]

ただし、この「周波数ドメイン歌唱アーティキュレーション接続法」という名称は、ヤマハのVOCALOID公式サイトではVOCALOID2、VOCALOID3の説明[16]には使用されていない。

なお、一般向けに販売されているVOCALOIDの合成エンジンは、歌を作成することを前提に開発されており、文章の読み上げには対応していない[17]。また歌唱に係わる表現でも、だみ声やシャウトなどを自然に再現することは出来ない[18]

パソコン向けのVOCALOIDは当初Windows用のみあったが、2013年8月に一部のVOCALOID3製品でMac OS X対応が行われた[19]。また、パソコン以外のプラットフォームへの対応も進められており、2010年10月にiOS上で動作するiPadiPhone向けのアプリケーションや、組み込み用のハードウェアとしての提供が発表され[20]、2013年にはニンテンドー3DSへの対応も行われた[21]
システム構成VOCALOIDのシステム構成

VOCALOIDのシステム構成をVOCALOID2を中心に説明する。大きく分けてユーザーが歌詞やメロディなどを入力する「スコアエディタ(VOCALOID2 Editor)」、音声素片を収録した「歌声ライブラリ」、音声素片を連結して歌声を合成する「合成エンジン」の三要素で構成される。「スコアエディタ」に入力された情報が合成エンジンに送られ合成エンジンが「歌声ライブラリ」から適切な音声素片を選び出し、接続して出力する流れとなる。ヤマハの提供部分である「スコアエディタ」と「合成エンジン」についてはVOCALOID2同士であれば基本的に製品ごとの違いは無いため、既にVOCALOID2製品がインストールされているパソコンに別のVOCALOID2製品をインストールする場合はライブラリの追加だけで使用可能となる。スタンドアローン(再生、WAVファイルに書き出し)。歌声の入力が可能なシーケンスソフトに用いられるピアノロール表示の例[注 2]。VOCALOIDのスコアエディタでは図のものと同様、ピアノロールの音符の中に歌詞を入力することで歌を表現する。
スコアエディタ(Score Editor)
ユーザーが入力を行う部分。音符はピアノロールスタイルで入力し、歌詞はピアノロールの音符の中に入力する。日本語用のライブラリを使用する場合は平仮名片仮名もしくはローマ字を用いて五十音で歌詞を入力。英語用のライブラリでは英単語を入力し、内部の発音辞書により自動的に発音記号に変換される。発音辞書に登録されていない単語発音記号を直接編集する。日本語用のライブラリと英語用のライブラリでは歌詞の入力方法は異なるが、プラットホームが同じであるためVOCALOID2同士であれば日本語版のスコアエディタでも英語用のライブラリを読み込ませることも出来、逆も可能。スコアエディタは歌声に表情付けを行うための各種パラメータを備えており、歌声を作成する際はこうしたパラメータを調整し、曲にあわせた加工を施すことが前提となっている[22]
歌声ライブラリ(Singer Library)
ヤマハからライセンス供与を受けた各社の担当部分で、人間の声からサンプリングした音声素片(歌声の断片)を含むデータベース。音声素片は、VOCALOID2では、2つの音(音素)が変化する際の移り変わりの部分(二音素連鎖、diphone)と、母音鼻音の伸ばし音が収録されている。例えば「さーいーたー」([sa i ta])という歌詞を合成する場合は二音素連鎖「#-s,s-a,a-i,i-t,t-a,a-#」(#は無音を示す)と母音の伸ばし音「a,i」を用い、これらを接続して歌声が作られる。これら音声素片は合成する際に入力されたメロディに合うピッチ(音高)に変換されるがより自然な合成を得られるよう歌手ライブラリには異なるピッチのものを複数用意している[注 3][24]。1ピッチあたりの二音素連鎖は日本語用ライブラリでは約500個、英語では約2500個収録している[25]。この違いは言語の特性の違いによるもので日本語の二音素連鎖が少ないのは日本語の音素の数が少ないことと、音節がほとんどの場合開音節(母音で終わる音節)であるためである。日本語の子音を含む二音素連鎖では基本的に「無音-子音」「母音-子音」「子音-母音」という組み合わせのパターンとなるが英語の場合は閉音節(子音で終わる音節)も多く存在し、「子音-子音」や「子音-無音」といったように組み合わせのパターンも多くなるため日本語用ライブラリに比べ収録しなければならない二音素連鎖の数も多くなる。またこのような違いがあるため、日本語用ライブラリで英語の歌詞を発音させるといったような使用は適さない。なお、VOCALOID3では、2までと同様の2音素連鎖だけでなく3音素連鎖(triphone)も扱えるようになっている[26]
合成エンジン(Synthesis Engine)
スコアエディタに入力された情報を元にライブラリから音声素片を選び出し周波数領域でピッチ、音色などを調整、連結して歌声に合成する。VOCALOID2では、エディタに入力された情報はVOCALOID MIDIという専用のMIDIメッセージを用いて合成エンジンへ送られる。DAW等からVOCALOID2をVSTiとして使用する場合は、製品に同梱されているVSTプラグインを用いてスコアエディタを介さず合成エンジンへ直接VOCALOID MIDIメッセージを送る形となる[27]。合成エンジンに送られたVOCALOID MIDIメッセージは合成用の楽譜情報に変換される。子音+母音の音節の場合は音符の位置と実際の発音の開始位置にずれがあり音符の位置より早く発音が始まるため、子音ではなく母音の開始位置を音符の位置と合わせるようタイミングが調整される。入力された音符とアタック、ビブラートのパラメーターを元にピッチの変化も計算されこれらの情報を元にライブラリから必要な音声素片が選択される[28]。合成する際は音声素片のピッチの変換を行うがピッチを調整しただけでは同じ音素であっても音声素片毎に音色に違いがあることから、音色の合わせこみも行う。伸ばし音部分では前後の二音素連鎖の末端部のスペクトル包絡に合わせ伸ばし音のスペクトル包絡の変化を決定し、ピークの強度を調整することで音色の突然の変化が生じないようにする。周波数領域でピッチ、音色といった調整がされた後、逆高速フーリエ変換(IFFT)などの処理を行い、合成音声が出力される。
バージョン
VOCALOID
通称「V1(ブイワン)」。2003年2月に発表され、2004年1月から2006年2月にかけて、ZERO-G、クリプトン・フューチャー・メディアの2社から、パソコン用のパッケージ5製品が発売された。


次ページ
記事の検索
おまかせリスト
▼オプションを表示
ブックマーク登録
mixiチェック!
Twitterに投稿
オプション/リンク一覧
話題のニュース
列車運行情報
暇つぶしWikipedia

Size:293 KB
出典: フリー百科事典『ウィキペディア(Wikipedia)
担当:undef