機械翻訳
[Wikipedia|▼Menu]
.mw-parser-output .hatnote{margin:0.5em 0;padding:3px 2em;background-color:transparent;border-bottom:1px solid #a2a9b1;font-size:90%}

ウィキペディアにおける機械翻訳については、「Wikipedia:翻訳のガイドライン#機械翻訳」をご覧ください。
.mw-parser-output .ambox{border:1px solid #a2a9b1;border-left:10px solid #36c;background-color:#fbfbfb;box-sizing:border-box}.mw-parser-output .ambox+link+.ambox,.mw-parser-output .ambox+link+style+.ambox,.mw-parser-output .ambox+link+link+.ambox,.mw-parser-output .ambox+.mw-empty-elt+link+.ambox,.mw-parser-output .ambox+.mw-empty-elt+link+style+.ambox,.mw-parser-output .ambox+.mw-empty-elt+link+link+.ambox{margin-top:-1px}html body.mediawiki .mw-parser-output .ambox.mbox-small-left{margin:4px 1em 4px 0;overflow:hidden;width:238px;border-collapse:collapse;font-size:88%;line-height:1.25em}.mw-parser-output .ambox-speedy{border-left:10px solid #b32424;background-color:#fee7e6}.mw-parser-output .ambox-delete{border-left:10px solid #b32424}.mw-parser-output .ambox-content{border-left:10px solid #f28500}.mw-parser-output .ambox-style{border-left:10px solid #fc3}.mw-parser-output .ambox-move{border-left:10px solid #9932cc}.mw-parser-output .ambox-protection{border-left:10px solid #a2a9b1}.mw-parser-output .ambox .mbox-text{border:none;padding:0.25em 0.5em;width:100%;font-size:90%}.mw-parser-output .ambox .mbox-image{border:none;padding:2px 0 2px 0.5em;text-align:center}.mw-parser-output .ambox .mbox-imageright{border:none;padding:2px 0.5em 2px 0;text-align:center}.mw-parser-output .ambox .mbox-empty-cell{border:none;padding:0;width:1px}.mw-parser-output .ambox .mbox-image-div{width:52px}html.client-js body.skin-minerva .mw-parser-output .mbox-text-span{margin-left:23px!important}@media(min-width:720px){.mw-parser-output .ambox{margin:0 10%}}

この記事には複数の問題があります。改善やノートページでの議論にご協力ください。

出典がまったく示されていないか不十分です。内容に関する文献や情報源が必要です。(2015年5月)


正確性に疑問が呈されています。(2015年5月)
出典検索?: "機械翻訳" ? ニュース ・ 書籍 ・ スカラー ・ CiNii ・ J-STAGE ・ NDL ・ dlib.jp ・ ジャパンサーチ ・ TWL

.mw-parser-output .sidebar{width:auto;float:right;clear:right;margin:0.5em 0 1em 1em;background:#f8f9fa;border:1px solid #aaa;padding:0.2em;text-align:center;line-height:1.4em;font-size:88%;border-collapse:collapse;display:table}body.skin-minerva .mw-parser-output .sidebar{display:table!important;float:right!important;margin:0.5em 0 1em 1em!important}.mw-parser-output .sidebar-subgroup{width:100%;margin:0;border-spacing:0}.mw-parser-output .sidebar-left{float:left;clear:left;margin:0.5em 1em 1em 0}.mw-parser-output .sidebar-none{float:none;clear:both;margin:0.5em 1em 1em 0}.mw-parser-output .sidebar-outer-title{padding:0 0.4em 0.2em;font-size:125%;line-height:1.2em;font-weight:bold}.mw-parser-output .sidebar-top-image{padding:0.4em}.mw-parser-output .sidebar-top-caption,.mw-parser-output .sidebar-pretitle-with-top-image,.mw-parser-output .sidebar-caption{padding:0.2em 0.4em 0;line-height:1.2em}.mw-parser-output .sidebar-pretitle{padding:0.4em 0.4em 0;line-height:1.2em}.mw-parser-output .sidebar-title,.mw-parser-output .sidebar-title-with-pretitle{padding:0.2em 0.8em;font-size:145%;line-height:1.2em}.mw-parser-output .sidebar-title-with-pretitle{padding:0 0.4em}.mw-parser-output .sidebar-image{padding:0.2em 0.4em 0.4em}.mw-parser-output .sidebar-heading{padding:0.1em 0.4em}.mw-parser-output .sidebar-content{padding:0 0.5em 0.4em}.mw-parser-output .sidebar-content-with-subgroup{padding:0.1em 0.4em 0.2em}.mw-parser-output .sidebar-above,.mw-parser-output .sidebar-below{padding:0.3em 0.8em;font-weight:bold}.mw-parser-output .sidebar-collapse .sidebar-above,.mw-parser-output .sidebar-collapse .sidebar-below{border-top:1px solid #aaa;border-bottom:1px solid #aaa}.mw-parser-output .sidebar-navbar{text-align:right;font-size:75%;padding:0 0.4em 0.4em}.mw-parser-output .sidebar-list-title{padding:0 0.4em;text-align:left;font-weight:bold;line-height:1.6em;font-size:105%}.mw-parser-output .sidebar-list-title-c{padding:0 0.4em;text-align:center;margin:0 3.3em}@media(max-width:720px){body.mediawiki .mw-parser-output .sidebar{width:100%!important;clear:both;float:none!important;margin-left:0!important;margin-right:0!important}}.mw-parser-output .side-headbg-left{text-align:left}.mw-parser-output .side-headbg-w15em{width:15em}.mw-parser-output .side-headbg-w16em{width:16em}.mw-parser-output .side-headbg-w22em{width:22em}.mw-parser-output .side-headbg-w150px{width:150px}.mw-parser-output .side-headbgr-top-image-default{padding:0;line-height:0.4em}.mw-parser-output .side-headbg .sidebar-pretitle{padding-top:0.2em}.mw-parser-output .side-headbg .sidebar-pretitle-with-top-image{padding-top:0.2em}.mw-parser-output .side-headbg .sidebar-title{background:#ccf;padding:0.2em 0.4em 0.2em}.mw-parser-output .side-headbg .sidebar-title-with-pretitle{background:#ccf;padding:0.2em 0.4em 0.2em}.mw-parser-output .side-headbg .sidebar-heading{background:#ddf;padding:0.2em 0.4em 0.2em}.mw-parser-output .side-headbg .sidebar-content{padding:0.3em 0.4em 0.6em}.mw-parser-output .side-headbg .sidebar-content-with-subgroup{padding:0.3em 0.4em 0.6em}.mw-parser-output .side-headbg .sidebar-above{padding:0;line-height:0.4em}.mw-parser-output .side-headbg .sidebar-below{background:#ddf;padding-top:0.3em}.mw-parser-output .sidebar-headbg .sidebar-navbar{padding-top:0.4em}

言語学
世界の言語分布図
基礎分野


音声学

音韻論

形態論

統語論

意味論

語用論

個別言語学

言語の変化と変異


歴史言語学

比較言語学

言語地理学

言語系統論

言語年代学

言語類型論

社会言語学

方言学

理論


生成言語学

認知言語学

応用分野


応用言語学

対照言語学

言語人類学

心理言語学

神経言語学

生物言語学

計算言語学

計量言語学

法言語学

言語獲得

言語の起源

関連項目


言語

言語学者



ポータル

カテゴリ

.mw-parser-output .hlist ul,.mw-parser-output .hlist ol{padding-left:0}.mw-parser-output .hlist li,.mw-parser-output .hlist dd,.mw-parser-output .hlist dt{margin-right:0;display:inline-block;white-space:nowrap}.mw-parser-output .hlist dt:after,.mw-parser-output .hlist dd:after,.mw-parser-output .hlist li:after{white-space:normal}.mw-parser-output .hlist li:after,.mw-parser-output .hlist dd:after{content:" ・\a0 ";font-weight:bold}.mw-parser-output .hlist dt:after{content:": "}.mw-parser-output .hlist-pipe dd:after,.mw-parser-output .hlist-pipe li:after{content:" |\a0 ";font-weight:normal}.mw-parser-output .hlist-hyphen dd:after,.mw-parser-output .hlist-hyphen li:after{content:" -\a0 ";font-weight:normal}.mw-parser-output .hlist-comma dd:after,.mw-parser-output .hlist-comma li:after{content:"、";font-weight:normal}.mw-parser-output .hlist-slash dd:after,.mw-parser-output .hlist-slash li:after{content:" /\a0 ";font-weight:normal}.mw-parser-output .hlist dd:last-child:after,.mw-parser-output .hlist dt:last-child:after,.mw-parser-output .hlist li:last-child:after{content:none}.mw-parser-output .hlist dd dd:first-child:before,.mw-parser-output .hlist dd dt:first-child:before,.mw-parser-output .hlist dd li:first-child:before,.mw-parser-output .hlist dt dd:first-child:before,.mw-parser-output .hlist dt dt:first-child:before,.mw-parser-output .hlist dt li:first-child:before,.mw-parser-output .hlist li dd:first-child:before,.mw-parser-output .hlist li dt:first-child:before,.mw-parser-output .hlist li li:first-child:before{content:" (";font-weight:normal}.mw-parser-output .hlist dd dd:last-child:after,.mw-parser-output .hlist dd dt:last-child:after,.mw-parser-output .hlist dd li:last-child:after,.mw-parser-output .hlist dt dd:last-child:after,.mw-parser-output .hlist dt dt:last-child:after,.mw-parser-output .hlist dt li:last-child:after,.mw-parser-output .hlist li dd:last-child:after,.mw-parser-output .hlist li dt:last-child:after,.mw-parser-output .hlist li li:last-child:after{content:")\a0 ";font-weight:normal}.mw-parser-output .hlist ol{counter-reset:listitem}.mw-parser-output .hlist ol>li{counter-increment:listitem}.mw-parser-output .hlist ol>li:before{content:" "counter(listitem)" ";white-space:nowrap}.mw-parser-output .hlist dd ol>li:first-child:before,.mw-parser-output .hlist dt ol>li:first-child:before,.mw-parser-output .hlist li ol>li:first-child:before{content:" ("counter(listitem)" "}.mw-parser-output .navbar{display:inline;font-size:75%;font-weight:normal}.mw-parser-output .navbar-collapse{float:left;text-align:left}.mw-parser-output .navbar-boxtext{word-spacing:0}.mw-parser-output .navbar ul{display:inline-block;white-space:nowrap;line-height:inherit}.mw-parser-output .navbar-brackets::before{margin-right:-0.125em;content:"[ "}.mw-parser-output .navbar-brackets::after{margin-left:-0.125em;content:" ]"}.mw-parser-output .navbar li{word-spacing:-0.125em}.mw-parser-output .navbar-mini abbr{font-variant:small-caps;border-bottom:none;text-decoration:none;cursor:inherit}.mw-parser-output .navbar-ct-full{font-size:114%;margin:0 7em}.mw-parser-output .navbar-ct-mini{font-size:114%;margin:0 4em}.mw-parser-output .infobox .navbar{font-size:88%}.mw-parser-output .navbox .navbar{display:block;font-size:88%}.mw-parser-output .navbox-title .navbar{float:left;text-align:left;margin-right:0.5em}









機械翻訳(きかいほんやく、: machine translation)とは、ある自然言語を別の自然言語に翻訳する変換を、コンピュータを利用して自動的に行おうとするものである。

機械翻訳という発想は20世紀半ばには生まれていた。#歴史

2010年代後半には、AIのディープラーニング技術により、急速に成長し、特定の用途に限った翻訳においては人間の手で補助することで、ある程度の解決がみられるようになっていて、日常生活における異言間のコミュニケーションに大きな影響を与えることが期待されるようになっていた[1]

2022年11月に大規模言語モデルによるchatGPTが登場し、それまでとは次元が異なる高性能の翻訳を行えるようになり、機械翻訳業界の状況がそれまでとは一変した。#大規模言語モデル方式AIの機械翻訳



歴史詳細は「en:History of machine translation」を参照

1629年に、ルネ・デカルトは、単一の記号をもって異なった言葉での同一の概念を割り当てる普遍言語を提案した[3]

機械翻訳という発想が生まれた起原のひとつは、暗号学である。ウォーレン・ウィーバーシャノンによる論文『通信の数学的理論』の書籍版の共著者)が1947年3月にノーバート・ウィーナーに送った手紙によると、ロシア語で書かれた文章について、それを「暗号化された英語の文章」とみなせば暗号解読の要領で機械的に翻訳できるのではないか、と提案している。しかし同年4月のウィーナーの返信によれば、自然言語は曖昧な表現が多いために、暗号解読のようにはうまくできないのでは、と懐疑的であった。

米国およびソ連の場合、機械翻訳は冷戦を背景とした需要があった。一方欧州の場合は、多国間交渉や条約などで多国語間の翻訳という課題を抱えていたという動機があり、2言語間ではなく多言語間の翻訳という比較的難しい問題に挑む一方、ある程度近い言語間の翻訳ではあった。日本の場合は、とにかく英日・日英の翻訳が望まれた。

上位の学術分野としては自然言語処理あるいは計算言語学であるが、いずれもコンピュータの発達により自然言語を扱えるようになったことで発展した分野であり、また自然言語の統計的性質を研究する点など、暗号学に起源の一部を辿れる点も似ている。機械翻訳はこれらの分野で主要な応用の位置にある。

大学や研究機関による成果の最も早いものは、1954年にジョージタウン大学などの研究グループにより発表された。これを皮切りに、形態素解析係り受け解析などの機械翻訳に必要な技術の研究が始まった。日本では1950年代に九州大学の栗原俊彦らが研究を開始し、1950年代末に実験機「KT-1」を[4]、またそれとは独立に電気試験所(後の電子技術総合研究所)の研究チームが実験機「やまと」を[5]作成している。その後も研究が続いたが、当時のコンピュータの性能による限界が厳しく、米国では1964年に発表された「ALPACレポート」で機械翻訳の様々な問題点が指摘され実用レベルには程遠いとされたことにより、米国ではしばらく予算がつかず約10年にわたって研究が停滞した。その中でも研究する者はおり、緩やかに進んだ。1980年代になると、ルールベースの機械翻訳システムが一定の成果を上げるようになった。

一方、IBMは1990年代に異なる言語間の単語対応を統計的に獲得する「IBMモデル」という手法を提案した。これが統計的機械翻訳の始まりである。初期の統計的機械翻訳は単語の並べ替えに基づくものであったが、2000年代に句構造を利用した翻訳手法が発表され、語族が異なる言語間でも翻訳の精度が飛躍的に向上することとなった。

2010年代に入り、文章翻訳への応用はできないとされていたニューラルネットワークによるディープラーニングを使ったニューラル機械翻訳(NMT)が登場したことで品質が向上した[6]。(BERTなど)

情報通信研究機構によると、2021年現在の人工知能は、音声認識能力においては人間を上回っているものの、その精度やスピードには大きな課題がある。課題解決にむけて重点的に開発されている機能は「チャンク」「補正」「翻訳精度そのものの向上」である。現状のAIによる同時通訳は10秒程度のタイムラグがあり(人間による同時通訳は2?3秒)テンポのいい会話などの通訳は難しい。これは現状の機械翻訳が文ごとにしか訳せない為であり、意味ごとに訳す「チャンク」という機能の開発が現在行われている。また、日本語などの言語においては「動詞・否定など重要な情報が末尾にくる」「主語が省略される」などの特徴がある為AIが誤訳しやすく、その解決策として「修正機能」が開発されている。翻訳機能の基幹となる「精度」においては「GPT-3」機能の応用などが研究されている。しかし、いずれにおいても「横一直線で、現状成果は出ていない」という批判もある[7]

2021年4月、NVIDIAではリアルタイムで多言語の音声認識と翻訳が可能な人工知能フレームワーク「Jarvis」を公開した[8]。技術デモにおいては、ジェン・スン・ファンが英語で九州じゃんがらへの道順を声で尋ねると、リアルタイムでテキスト化され、1?2秒程度で違和感の無い日本語テキストに変換されるレベルとなっている[8]
課題の認識の変遷

1975年にYehoshua Bar Hillelは、現実的に研究すべき機械翻訳として、以下3点を述べており、この視点がその後も受け継がれた。
機械の支援を伴う人間翻訳

人間の支援を伴う機械翻訳

低品質の機械翻訳


奥村学(
自然言語処理)は「翻訳は人間でも言外の意味の理解や知識を要求される非常に負荷の高いタスクであり、『全自動高品質機械翻訳』の完成を目指してはいけない」と2014年に指摘した。

Thierry Poibeau (LATTICE言語学研究所所長)は、「機械翻訳が、人間の翻訳を取って代わることはない。そのようなことは目標でも望ましい結果でもない」と2017年に述べた。

「人工知能やロボット等による代替可能性が高い100種の職業」(野村総合研究所)では、「翻訳通訳」は圏外である[9]

「Frey and Osborne」(2013年)による機械学習の研究では、「認知性・創造性・社会性」の観点から、機械化されるリスクに対し、様々な職種に指標を与えており、翻訳通訳は0.38の指標を与えられている。

「1」は現時点で機械化が可能。

「0.7 - 0.99」は将来(10年 - 20年以内)機械化される可能性が高い。

0.7未満は中、0.3未満は低レベルのリスク。数字が小さいほどリスクが低い。


今後も「ディープラーニング」を活用した機械翻訳技術の向上により、記述のルールが定まった文書(特許・法律文書、論文など)であれば、書く側が「あらかじめ機械翻訳に配慮」することで、翻訳の精度は相当に高くなっていくことが期待できる。しかし「人間の多彩な情報を用いた複雑なコミュニケーションには程遠く、AIがそのレベルに到達し、人間の翻訳・通訳の代わりするのは遥か先」というのが研究者の共通の見解である。特に以下の3点による[10]

AIはディープラーニングにより「言葉の意味そのもの」を学習するわけではない

ディープラーニングには「誤った学習結果」が含まれる


次ページ
記事の検索
おまかせリスト
▼オプションを表示
ブックマーク登録
mixiチェック!
Twitterに投稿
オプション/リンク一覧
話題のニュース
列車運行情報
暇つぶしWikipedia

Size:83 KB
出典: フリー百科事典『ウィキペディア(Wikipedia)
担当:undef