この項目では、音声合成ソフトウェアについて説明しています。スイスの地名については「en:Cevio
」を、その他の用法については「Cevio (曖昧さ回避)」をご覧ください。CeVIOプロジェクト
綱領ユーザー生成コンテンツを支援し、これまでに無いエンターテイメントを創出する[1]
営利か?商用
製品CeVIO Vision、CeVIO Creative Studio、CeVIO AI
オーナーテクノスピーチ、ブイシンク、ソニー・ミュージックエンタテインメント、フロンティアワークス、アップフィールド
国 日本
創設2013年1月 (11年前) (2013-01)
現況現行
ウェブサイト ⇒cevio.jp
CeVIO(チェビオ)は、
名古屋工業大学学内ベンチャー企業のテクノスピーチ、デジタルサイネージのブイシンク、映像ソフト会社のフロンティアワークス、他数社で構成されているプロジェクトの名称[2][3]。
上記プロジェクトがリリースする音声合成ソフトウェア(CeVIO Creative Studio, CeVIO AI)のこと。姉妹ブランドとしてVoiSonaが存在する。
初期展開として、デジタルサイネージの CeVIO Vision、音声合成ソフトウェアの CeVIO Creative Studio のそれぞれで、キャラクターのさとうささらがリリースされた。
当項ではソフトウェアとしての部分を中心に記載する。
CeVIO の名称は VOICE のアナグラムである[4]。 CeVIO Vision種類デジタルサイネージ
企画
CeVIO Vision
会社名ブイシンク
ブランド名CeVIO
ウェブサイト ⇒cevio.jp
テンプレートを表示
CeVIO Vision(チェビオ ビジョン)はキャラクターとの双方向なやりとりが可能な音声デジタルサイネージ(電子看板)である。CeVIOプロジェクトの企画第1弾として登場した[5]。
最初の登場は、CeVIOプロジェクトのキャラクター「さとうささら」が等身大サイズとなり2013年1月22日より1年間、アニメイト秋葉原店入り口横で稼働した[6]。
その後は常設展示はないが、イベント等で展示されることがある[7]。 名古屋工業大学で研究開発され、MMD(MikuMikuDance)モデルを使用可能な対話エージェントシステム「MMDAgent
CeVIO Visionの技術背景
アニメイトで展示されたシステムはIntel製のプラットホームでWindows Embedded上で稼働する[8]。
Kinect V2を利用したリアルタイムモーション検出に対応する[9]。 CeVIO Creative Studio開発元テクノスピーチ, ブイシンク
CeVIO Visionの歴史
2013年1月22日 (11年前) (2013-01-22) アニメイト秋葉原店入り口横で稼働開始(1年間)
2015年1月21日 (9年前) (2015-01-21) SCビジネスフェア 2015に出展[9]
2015年9月2日 (8年前) (2015-09-02) 宣伝会議 プロモーション&クリエイティブフォーラム2015に出展[10]
2016年10月27日 (7年前) (2016-10-27) 文部科学省内で展示(2016年12月22日まで)[11]。
CeVIO Visionの関連製品
「スマートビジョン」 - バーチャルキャラクターがリアルタイムに音声認識/音声合成で情報案内をしてくれるサイネージ。さとうささらが採用されているなどCeVIO Visionと同等の機能を有する製品[12]。
「ケアアシストサイネージ」 - 介護支援施設向けのデジタルサイネージ。高齢者介護向けの機能が充実している。引き続きさとうささらがキャラクターとして採用されている[13]。
CeVIO Creative Studio
初版2013年4月26日 (11年前) (2013-04-26)
最新版7.0.23.1 / 2020年9月17日 (3年前) (2020-09-17)
対応OSWindows 8.1, Windows 10, Windows 11
プラットフォームx86-64
サイズ112MB
対応言語日本語,英語 (米国)
種別音声合成, DTM, ボーカルシンセサイザー
ライセンスプロプライエタリソフトウェア
公式サイトcevio.jp
テンプレートを表示
CeVIO Creative Studio(チェビオ クリエイティブスタジオ)は、テキストを入力すると合成して読み上げるトーク機能(Text-To-Speech)と、歌詞をピアノロール上に入力して歌い上げるソング機能(ボーカルシンセサイザー)の2つを併せ持つ、音声合成ソフトウェア。
トーク、ソングそれぞれに対応した音声ライブラリ・キャラクターが存在しており[14]、両方のライブラリを持つキャラクターも存在する(さとうささら、ONEなど)。マルチトラックに対応しており、トークとソングを組み合わせた音声作品を作ることも可能(例:『おねがいダーリン』(ナナホシ管弦楽団)など)。WAVファイルをオーディオトラックとして読み込むことも可能で、伴奏などのオケを取り込むことで簡易MIXも可能(MIXした状態で音声ファイルとして出力できる)。ソング、トークともに生成した音声ファイルの出力だけでなく音素のタイミング情報を記載したラベルファイル(.lab)を出力することが可能で、リップシンクなどに利用ができる。
CeVIO AIの発売後も併売されるが、ソングボイス・トークボイスに互換性はなくCeVIO AIのボイスを使用することはできない[15]。 縦に複数行が並ぶUIをもち、各行ごとに文字を入力すると音声が合成される。各行ごとに音声ライブラリ・キャラクターを切り替えることが可能で、掛け合いなどの会話劇を作ることができる。 各行ごとに複数のパラメータによる表情設定ができる他、音声ライブラリ・キャラクターごとの独自の感情コントロールで表情付けをすることができる[16]。 長文の外部テキストファイルを読み込むことが可能なほか、青空文庫の形式を読み込むことも可能。青空文庫方式のルビ表記にも対応する。生成した音声はWAV形式で出力する以外にも、元の文章をテキストファイルとして出力したり、字幕(srt形式)ファイルを出力することも可能。 SAPI 5に対応し、外部ソフトと連携して読み上げソフトとしての利用もできる。また、COMやC#向けの専用APIが公開されており、SAPI5以上の細かなパラメータを外部ソフトから制御することが可能[17]。 DTMで一般的なピアノロール型シーケンサーのユーザーインターフェースを持つ。ピアノロールのUIの上に各パラメータを扱う以下のモードを切り替えて調声を行う[18]。パラメータによって操作方法は異なる。 歌詞の一部に特殊な記号を入力することで(「※」ファルセットや「'」母音脱落など)歌い方を指定することができる。MIDI形式によるトラックのインポート・エクスポートに対応するほか、MusicXMLによるソングトラックのインポート・エクスポートに対応する。
トーク機能
ソング機能歌声の入力が可能なシーケンスソフトに用いられるピアノロール表示の例[注 1]。CeVIO CSのソングエディタでは図のものと同様、ピアノロールの音符の中に歌詞を入力することで歌を表現する。
NOR - 楽譜入力
TMG - 発声のタイミングを調整
VOL - 音の大きさを調整
PIT - 音の高さを調整
VIA - ビブラートの振幅
VIF - ビブラートの周期調整
ALP - 声質を調整。曲全体の声質を変更するUI(声質バー)も別に存在する
技術背景CeVIOの音声合成基礎技術は名古屋工業大学での研究が基になっている。