VOCALOID
[Wikipedia|▼Menu]
特に日本国内においては「VOCALOID2」を採用した「初音ミク」が発売された2007年以降、ネット上を中心にVOCALOIDをメインボーカルに起用した楽曲が数多く発表されるようになり、そうした中の人気楽曲からメジャーレーベルから発売されるものも現れるなど、一つの楽曲文化の様相を見せるようにもなっている[9]2010年には『EXIT TUNES PRESENTS Vocalogenesis feat.初音ミク』が、VOCALOIDをボーカルに用いた楽曲を集めたアルバムで、初のオリコン週間チャート1位を獲得している[10]
名称の由来

VOCALOIDという名称は、「vocal(ボーカル)」に接尾辞の「-oid」を組み合わせて作られた造語である。「-oid」は「?のようなもの」「?状の」という意味の接尾辞で、「human(人)」と組み合わせれば「humanoid(ヒューマノイド)」、ギリシャ語で男を意味する「andro」と組み合わせれば「android(アンドロイド)」となり、VOCALOIDについては「ボーカルのようなもの」といった意味となる[11]。2003年2月に報道発表に先立って決定された[12]

ただし、名称の由来とは別に「ボーカル・アンドロイド=VOCALOID(ボーカロイド)」という説明が行われている場合[13]もある。
技術.mw-parser-output .side-box{margin:4px 0;box-sizing:border-box;border:1px solid #aaa;font-size:88%;line-height:1.25em;background-color:#f9f9f9;display:flow-root}.mw-parser-output .side-box-abovebelow,.mw-parser-output .side-box-text{padding:0.25em 0.9em}.mw-parser-output .side-box-image{padding:2px 0 2px 0.9em;text-align:center}.mw-parser-output .side-box-imageright{padding:2px 0.9em 2px 0;text-align:center}@media(min-width:500px){.mw-parser-output .side-box-flex{display:flex;align-items:center}.mw-parser-output .side-box-text{flex:1}}@media(min-width:720px){.mw-parser-output .side-box{width:238px}.mw-parser-output .side-box-right{clear:right;float:right;margin-left:1em}.mw-parser-output .side-box-left{margin-right:1em}}.mw-parser-output .listen .side-box-text{line-height:1.1em}.mw-parser-output .listen-plain{border:none;background:transparent}.mw-parser-output .listen-embedded{width:100%;margin:0;border-width:1px 0 0 0;background:transparent}.mw-parser-output .listen-header{padding:2px}.mw-parser-output .listen-embedded .listen-header{padding:2px 0}.mw-parser-output .listen-file-header{padding:4px 0}.mw-parser-output .listen .description{padding-top:2px}.mw-parser-output .listen .mw-tmh-player{max-width:100%}@media(max-width:719px){.mw-parser-output .listen{clear:both}}@media(min-width:720px){.mw-parser-output .listen:not(.listen-noimage){width:320px}.mw-parser-output .listen-left{overflow:visible;float:left}.mw-parser-output .listen-center{float:none;margin-left:auto;margin-right:auto}}Mitchie M「Freely Tomorrow」VOCALOIDソフト「初音ミク」を使用した歌の一例この音声や映像がうまく視聴できない場合は、Help:音声・動画の再生をご覧ください。

VOCALOIDの歌声合成技術は「素片連結型」と呼ばれるもので[14]人の歌声の録音から切り出した歌声の素片を周波数領域(周波数ドメイン)で接続、加工することで歌声を合成する。合成の際、強弱やビブラート・息つぎなどの表情の情報を加えることでリアルな歌声が作られる[15]。なお、VOCALOIDの合成技術の名称は「周波数ドメイン歌唱アーティキュレーション接続法(Frequency-domain Singing Articulation Splicing and Shaping)」という名前で発表されている[3]。この名称の「歌唱アーティキュレーション」については「ビブラートや音の断片など歌唱に必要な“声の表情”」として説明されている。ただし、この「周波数ドメイン歌唱アーティキュレーション接続法」という名称は、ヤマハのVOCALOID公式サイトではVOCALOID2、VOCALOID3の説明[16]には使用されていない。

なお、一般向けに販売されているVOCALOIDの合成エンジンは、歌を作成することを前提に開発されており、文章の読み上げには対応していない[17]。また歌唱に係わる表現でも、だみ声やシャウトなどを自然に再現することは出来ない[18]

パソコン向けのVOCALOIDは当初Windows用のみあったが、2013年8月に一部のVOCALOID3製品でMac OS X対応が行われた[19]。また、パソコン以外のプラットフォームへの対応も進められており、2010年10月にiOS上で動作するiPadiPhone向けのアプリケーションや、組み込み用のハードウェアとしての提供が発表され[20]、2013年にはニンテンドー3DSへの対応も行われた[21]
システム構成VOCALOIDのシステム構成

VOCALOIDのシステム構成をVOCALOID2を中心に説明する。大きく分けてユーザーが歌詞やメロディなどを入力する「スコアエディタ(VOCALOID2 Editor)」、音声素片を収録した「歌声ライブラリ」、音声素片を連結して歌声を合成する「合成エンジン」の三要素で構成される。「スコアエディタ」に入力された情報が合成エンジンに送られ合成エンジンが「歌声ライブラリ」から適切な音声素片を選び出し、接続して出力する流れとなる。ヤマハの提供部分である「スコアエディタ」と「合成エンジン」についてはVOCALOID2同士であれば基本的に製品ごとの違いは無いため、既にVOCALOID2製品がインストールされているパソコンに別のVOCALOID2製品をインストールする場合はライブラリの追加だけで使用可能となる。スタンドアローン(再生、WAVファイルに書き出し)。歌声の入力が可能なシーケンスソフトに用いられるピアノロール表示の例[注 2]。VOCALOIDのスコアエディタでは図のものと同様、ピアノロールの音符の中に歌詞を入力することで歌を表現する。
スコアエディタ(Score Editor)
ユーザーが入力を行う部分。音符はピアノロールスタイルで入力し、歌詞はピアノロールの音符の中に入力する。日本語用のライブラリを使用する場合は平仮名片仮名もしくはローマ字を用いて五十音で歌詞を入力。英語用のライブラリでは英単語を入力し、内部の発音辞書により自動的に発音記号に変換される。発音辞書に登録されていない単語発音記号を直接編集する。日本語用のライブラリと英語用のライブラリでは歌詞の入力方法は異なるが、プラットホームが同じであるためVOCALOID2同士であれば日本語版のスコアエディタでも英語用のライブラリを読み込ませることも出来、逆も可能。スコアエディタは歌声に表情付けを行うための各種パラメータを備えており、歌声を作成する際はこうしたパラメータを調整し、曲にあわせた加工を施すことが前提となっている[22]
歌声ライブラリ(Singer Library)
ヤマハからライセンス供与を受けた各社の担当部分で、人間の声からサンプリングした音声素片(歌声の断片)を含むデータベース。音声素片は、VOCALOID2では、2つの音(音素)が変化する際の移り変わりの部分(二音素連鎖、diphone)と、母音鼻音の伸ばし音が収録されている。例えば「さーいーたー」([sa i ta])という歌詞を合成する場合は二音素連鎖「#-s,s-a,a-i,i-t,t-a,a-#」(#は無音を示す)と母音の伸ばし音「a,i」を用い、これらを接続して歌声が作られる。これら音声素片は合成する際に入力されたメロディに合うピッチ(音高)に変換されるがより自然な合成を得られるよう歌手ライブラリには異なるピッチのものを複数用意している[注 3][24]。1ピッチあたりの二音素連鎖は日本語用ライブラリでは約500個、英語では約2500個収録している[25]。この違いは言語の特性の違いによるもので日本語の二音素連鎖が少ないのは日本語の音素の数が少ないことと、音節がほとんどの場合開音節(母音で終わる音節)であるためである。日本語の子音を含む二音素連鎖では基本的に「無音-子音」「母音-子音」「子音-母音」という組み合わせのパターンとなるが英語の場合は閉音節(子音で終わる音節)も多く存在し、「子音-子音」や「子音-無音」といったように組み合わせのパターンも多くなるため日本語用ライブラリに比べ収録しなければならない二音素連鎖の数も多くなる。またこのような違いがあるため、日本語用ライブラリで英語の歌詞を発音させるといったような使用は適さない。なお、VOCALOID3では、2までと同様の2音素連鎖だけでなく3音素連鎖(triphone)も扱えるようになっている[26]
合成エンジン(Synthesis Engine)
スコアエディタに入力された情報を元にライブラリから音声素片を選び出し周波数領域でピッチ、音色などを調整、連結して歌声に合成する。VOCALOID2では、エディタに入力された情報はVOCALOID MIDIという専用のMIDIメッセージを用いて合成エンジンへ送られる。DAW等からVOCALOID2をVSTiとして使用する場合は、製品に同梱されているVSTプラグインを用いてスコアエディタを介さず合成エンジンへ直接VOCALOID MIDIメッセージを送る形となる[27]。合成エンジンに送られたVOCALOID MIDIメッセージは合成用の楽譜情報に変換される。子音+母音の音節の場合は音符の位置と実際の発音の開始位置にずれがあり音符の位置より早く発音が始まるため、子音ではなく母音の開始位置を音符の位置と合わせるようタイミングが調整される。入力された音符とアタック、ビブラートのパラメーターを元にピッチの変化も計算されこれらの情報を元にライブラリから必要な音声素片が選択される[28]


次ページ
記事の検索
おまかせリスト
▼オプションを表示
ブックマーク登録
mixiチェック!
Twitterに投稿
オプション/リンク一覧
話題のニュース
列車運行情報
暇つぶしWikipedia

Size:293 KB
出典: フリー百科事典『ウィキペディア(Wikipedia)
担当:undef