バーチャルアシスタント(英: virtual assistant)、または仮想アシスタント(かそうアシスタント)とは、個人のタスクまたはサービスを実行できるソフトウェアエージェント。広義のAI技術を使用するため、しばしばAIアシスタント、あるいは単にAIと呼ばれる。また、独立して存在する既存の機能やアクセシビリティに関する機能の統合、あるいはアカウントやコンピューターに散在するファイルやデータの受け渡しの一元化を担う。
2017年時点で、AIアシスタントの機能や使用法は急速に拡大しており、新製品も市場に登場している。2017年5月のオンライン調査ではアメリカで最も幅広く使われているのはAppleのSiri(34%)で、2位以降はGoogleのGoogleアシスタント(19%)、AmazonのAmazon Alexa(6%)、MicrosoftのMicrosoft Cortana(4%)という結果になった[1]。
これらのアシスタントが動作するスマートスピーカーの使用法は根本的に異なっている。Appleは2017年6月までスマートスピーカーの発表すらしていなかった。AppleとGoogleは、それぞれiOSとAndroidなど各社のOSが搭載された大規模なスマートフォンのユーザーを持っており、MicrosoftはWindowsがインストールされている多くのコンピュータがある(Cortanaはスマートフォンやスマートスピーカーでも動作する)一方、Alexaはネット通販の(Amazon)商品を注文できる最初のAIアシスタントとなった[2]。 デジタル音声認識が可能な最初の製品であるIBM Shoeboxは、1961年に市場へ投入された。その後1962年に、シアトル万国博覧会で一般公開された。 さらに20年後の1981年に発売された最初のIBM PCは、16の音声語と0から9までの数字を認識することができた。 1970年代に米国国防総省とDARPAの相当な支援を受け、ペンシルベニア州ピッツバーグのカーネギーメロン大学でHarpyが開発された。Harpyは(3歳児の語彙力に相当する)約1000語を習得し、音声認識技術の開発における次のマイルストーンとなった。 約10年後、同じグループの科学者が、個々の単語を分析するだけでなく、隠れマルコフモデルにより単語シーケンス全体を分析できるシステムを開発した[3]。 そして、音声認識ソフトウェアを適用した最も初期のAIアシスタントは自動応答および医療用ICレコーダーであった[4]。 1990年代、デジタル音声認識技術は、MicrosoftやIBM、Philips、Lernout&Hauspieが顧客向けに競争していたPCの特徴となった。 それからかなり後の1994年に市場へ投入された最初のスマートフォンであるIBM Simonは、今日のAIアシスタントの基盤となった[5]。 Appleは2010年に、DARPAと米国国防総省から資金を調達するSRIインターナショナルという研究所のスピンオフ企業であるSiri Inc.を買収した後、Siriを開発した[3]。翌年、2011年の10月14日にスマートフォンに搭載された最初の現代AIアシスタントであるSiriは、iPhone 4Sの機能として導入された[6]。 バーチャルアシスタントは以下の方法で動作する 一部のAIアシスタントは複数の方法で利用できる。Googleアシスタントはグーグル「Allo」アプリのチャット機能とスマートスピーカーの「グーグルホーム」で音声を通じて利用できる。 AIアシスタントは、ユーザーのテキストまたは音声入力を実行可能コマンドに一致させるために自然言語処理(NLP)を使用する。多くは、機械学習を含む人工知能技術を使用して継続的に学習する。
歴史
交流方法
テキスト (チャット)、特にインスタントメッセージアプリなど
音声、例えばAmazon Echoに搭載されているAmazon AlexaやiPhoneに搭載されているSiriがある。
写真の撮影及びアップロード、サムスンのギャラクシーS8に搭載されている「Bixby」などがある