ボイスチェンジャー
[Wikipedia|▼Menu]
□記事を途中から表示しています
[最初から表示]

ソフトウェアボイスチェンジャー: デジタル信号処理による音声変換[3]

利用例
フィクション

フィクションではしばしばボイスチェンジャーが登場する。有名な例として、漫画『名探偵コナン』に登場する「蝶ネクタイ型変声機」がある。
音声変換

音声変換(: voice conversion)は入力音声がもつ特徴の一部を変換するタスクである[4]

音声合成の一種であり、言語内容を維持したまま話者を変える話者変換[5]、声のトーンのみを変える感情変換など、様々なサブタスクに分類できる。話者性や音色を維持し言語内容のみを外国語に変えるタスクは音声翻訳タスクとも音声変換タスクとも捉えられる。ボイスチェンジャーは音声変換タスクを実現するシステムと解される。
手法

様々な手法が存在し、実利用されている。以下はその一例である:

信号処理

PSOLA(利用例: 恋声 TD-PSOLA モード[6]

フェーズボコーダ(利用例: 恋声 Phase Vocoder モード[6]


機械学習

混合正規分布モデル[7]

ニューラルネットワーク

DDSP


パラレルデータ

パラレル音声変換(: parallel VC)は同一内容・異スタイルの音声を利用可能な音声変換タスクである。パラレルデータを利用できないタスクは非パラレル音声変換(: non-parallel VC)と呼ばれる。

より平易な言い方をすれば、パラレル音声変換は「同一文章を読み上げた別話者の音声を利用可能なVCタスク」である。パラレルデータは含まれる音素列の一致が保証されている。よって「正解」相当の変換先音声が与えられていると言える(c.f. 教師あり学習)。しかし発話タイミングや音素継続長の一致は保証されないため、単なるフレーム単位の教師ありスタイル変換として解くことは難しい[8]

非パラレル音声変換では正解相当のデータが存在しないことになる。ゆえに信号処理的な固定変換をおこなったり、教師なし学習を用いたりする必要がある。
商品名としての「ボイスチェンジャー」

日本コロムビアが1972年に「ボイスチェンジャー」(商品名)という自動音声交換装置を開発・発売した[9]
脚注^ a b "ボイスチェンジャー(音声変換)とは,音声を人工的に加工・変換する技術である。(高道慎之介「音声アバターを選ぶ時代」『電気学会誌』第141巻第2号、電気学会、2021年2月、93-96頁、doi:10.1541/ieejjournal.141.93、.mw-parser-output cite.citation{font-style:inherit;word-wrap:break-word}.mw-parser-output .citation q{quotes:"\"""\"""'""'"}.mw-parser-output .citation.cs-ja1 q,.mw-parser-output .citation.cs-ja2 q{quotes:"「""」""『""』"}.mw-parser-output .citation:target{background-color:rgba(0,127,255,0.133)}.mw-parser-output .id-lock-free a,.mw-parser-output .citation .cs1-lock-free a{background:url("//upload.wikimedia.org/wikipedia/commons/6/65/Lock-green.svg")right 0.1em center/9px no-repeat}.mw-parser-output .id-lock-limited a,.mw-parser-output .id-lock-registration a,.mw-parser-output .citation .cs1-lock-limited a,.mw-parser-output .citation .cs1-lock-registration a{background:url("//upload.wikimedia.org/wikipedia/commons/d/d6/Lock-gray-alt-2.svg")right 0.1em center/9px no-repeat}.mw-parser-output .id-lock-subscription a,.mw-parser-output .citation .cs1-lock-subscription a{background:url("//upload.wikimedia.org/wikipedia/commons/a/aa/Lock-red-alt-2.svg")right 0.1em center/9px no-repeat}.mw-parser-output .cs1-ws-icon a{background:url("//upload.wikimedia.org/wikipedia/commons/4/4c/Wikisource-logo.svg")right 0.1em center/12px no-repeat}.mw-parser-output .cs1-code{color:inherit;background:inherit;border:none;padding:inherit}.mw-parser-output .cs1-hidden-error{display:none;color:#d33}.mw-parser-output .cs1-visible-error{color:#d33}.mw-parser-output .cs1-maint{display:none;color:#3a3;margin-left:0.3em}.mw-parser-output .cs1-format{font-size:95%}.mw-parser-output .cs1-kern-left{padding-left:0.2em}.mw-parser-output .cs1-kern-right{padding-right:0.2em}.mw-parser-output .citation .mw-selflink{font-weight:inherit}ISSN 13405551、NAID 130007978857。 )
^ a b "Voice conversion (VC) refers to a technique that converts a certain aspect of speech from a source to that of a target without changing the linguistic content" Huang, et al. (2021). S3PRL-VC: Open-source Voice Conversion Framework with Self-supervised Speech Representations. p.1.
^ Kameoka, et al. (2018). StarGAN-VC: Non-parallel many-to-many voice conversion with star generative adversarial networks.
^ "Voice conversion (VC) refers to a technique that converts a certain aspect of speech from a source to that of a target without changing the linguistic content" Huang, et al. (2021). S3PRL-VC: Open-source Voice Conversion Framework with Self-supervised Speech Representations. p.1.
^ "speaker conversion, which is the most widely investigated type of VC." Huang, et al. (2021). S3PRL-VC: Open-source Voice Conversion Framework with Self-supervised Speech Representations. p.1.
^ a b "「恋声」には、TD-PSOLAとPhase Vocoderという2種類のピッチ変換方法が搭載されています。" ⇒恋声 公式ホームページ. 2024-01-20閲覧.
^ "1990年代中ごろに,確率モデルに基づく手法として,混合正規分布モデル ... に基づく変換法 ... が提案された。" 戸田. (2011). 確率モデルに基づく声質変換技術. 日本音響学会誌, 67巻1号. pp. 34?39
^ "use temporally aligned parallel data of source and target speech as training data. ... we need to perform automatic time alignment ... misalignment involved in parallel data can cause speech-quality degradation" Kaneko. (2017). Parallel-Data-Free Voice Conversion Using Cycle-Consistent Adversarial Networks.
^ 「新製品ご紹介 ボイスチェンジャー」『経済知識』1972年8月号、新経済知識社、61頁。NDLJP:1418742/31

関連項目

音声合成

音声変換


外部リンク

AV Voice Changer Software Diamond Edition

MorphVOX Junior

リアルタイムボイスチェンジャー
.mw-parser-output .asbox{position:relative;overflow:hidden}.mw-parser-output .asbox table{background:transparent}.mw-parser-output .asbox p{margin:0}.mw-parser-output .asbox p+p{margin-top:0.25em}.mw-parser-output .asbox{font-size:90%}.mw-parser-output .asbox-note{font-size:90%}.mw-parser-output .asbox .navbar{position:absolute;top:-0.90em;right:1em;display:none}

この項目は、工学技術に関連した書きかけの項目です。この項目を加筆・訂正などしてくださる協力者を求めていますPortal:技術と産業)。
.mw-parser-output .hlist ul,.mw-parser-output .hlist ol{padding-left:0}.mw-parser-output .hlist li,.mw-parser-output .hlist dd,.mw-parser-output .hlist dt{margin-right:0;display:inline-block;white-space:nowrap}.mw-parser-output .hlist dt:after,.mw-parser-output .hlist dd:after,.mw-parser-output .hlist li:after{white-space:normal}.mw-parser-output .hlist li:after,.mw-parser-output .hlist dd:after{content:" ・\a0 ";font-weight:bold}.mw-parser-output .hlist dt:after{content:": "}.mw-parser-output .hlist-pipe dd:after,.mw-parser-output .hlist-pipe li:after{content:" |\a0 ";font-weight:normal}.mw-parser-output .hlist-hyphen dd:after,.mw-parser-output .hlist-hyphen li:after{content:" -\a0 ";font-weight:normal}.mw-parser-output .hlist-comma dd:after,.mw-parser-output .hlist-comma li:after{content:"、";font-weight:normal}.mw-parser-output .hlist-slash dd:after,.mw-parser-output .hlist-slash li:after{content:" /\a0 ";font-weight:normal}.mw-parser-output .hlist dd:last-child:after,.mw-parser-output .hlist dt:last-child:after,.mw-parser-output .hlist li:last-child:after{content:none}.mw-parser-output .hlist dd dd:first-child:before,.mw-parser-output .hlist dd dt:first-child:before,.mw-parser-output .hlist dd li:first-child:before,.mw-parser-output .hlist dt dd:first-child:before,.mw-parser-output .hlist dt dt:first-child:before,.mw-parser-output .hlist dt li:first-child:before,.mw-parser-output .hlist li dd:first-child:before,.mw-parser-output .hlist li dt:first-child:before,.mw-parser-output .hlist li li:first-child:before{content:" (";font-weight:normal}.mw-parser-output .hlist dd dd:last-child:after,.mw-parser-output .hlist dd dt:last-child:after,.mw-parser-output .hlist dd li:last-child:after,.mw-parser-output .hlist dt dd:last-child:after,.mw-parser-output .hlist dt dt:last-child:after,.mw-parser-output .hlist dt li:last-child:after,.mw-parser-output .hlist li dd:last-child:after,.mw-parser-output .hlist li dt:last-child:after,.mw-parser-output .hlist li li:last-child:after{content:")\a0 ";font-weight:normal}.mw-parser-output .hlist ol{counter-reset:listitem}.mw-parser-output .hlist ol>li{counter-increment:listitem}.mw-parser-output .hlist ol>li:before{content:" "counter(listitem)" ";white-space:nowrap}.mw-parser-output .hlist dd ol>li:first-child:before,.mw-parser-output .hlist dt ol>li:first-child:before,.mw-parser-output .hlist li ol>li:first-child:before{content:" ("counter(listitem)" "}.mw-parser-output .navbar{display:inline;font-size:75%;font-weight:normal}.mw-parser-output .navbar-collapse{float:left;text-align:left}.mw-parser-output .navbar-boxtext{word-spacing:0}.mw-parser-output .navbar ul{display:inline-block;white-space:nowrap;line-height:inherit}.mw-parser-output .navbar-brackets::before{margin-right:-0.125em;content:"[ "}.mw-parser-output .navbar-brackets::after{margin-left:-0.125em;content:" ]"}.mw-parser-output .navbar li{word-spacing:-0.125em}.mw-parser-output .navbar-mini abbr{font-variant:small-caps;border-bottom:none;text-decoration:none;cursor:inherit}.mw-parser-output .navbar-ct-full{font-size:114%;margin:0 7em}.mw-parser-output .navbar-ct-mini{font-size:114%;margin:0 4em}.mw-parser-output .infobox .navbar{font-size:88%}.mw-parser-output .navbox .navbar{display:block;font-size:88%}.mw-parser-output .navbox-title .navbar{float:left;text-align:left;margin-right:0.5em}


次ページ
記事の検索
おまかせリスト
▼オプションを表示
ブックマーク登録
mixiチェック!
Twitterに投稿
オプション/リンク一覧
話題のニュース
列車運行情報
暇つぶしWikipedia

Size:17 KB
出典: フリー百科事典『ウィキペディア(Wikipedia)
担当:undef