日本でも盛り上がる「ボイステクノロジー」
7月14日、LINEがAIプラットフォーム「Clova」に連携するスピーカー型デバイス「WAVE」の先行体験版を販売開始、今秋には正式版を発売することを発表した。
海外ではすでに広く普及している「ボイステクノロジー」が、いよいよ日本でも本格的に盛り上がりそうな様相を呈している。
米国のAIスピーカー市場では、アマゾンのAIプラットフォーム「Alexa」に連携したスピーカー「Echo」シリーズが70%を占める一強状態。2014年末ごろにリリースされ、ミレニアル世代を中心にユーザーを増やしてきた。また英国やドイツでも発売され、人気を呼んでいる。
そんな米国や欧州ではボイステクノロジーの普及で、「人間とコンピューターの関係」が少しずつ変化しているように見て取れる。一歩先を行く米国や欧州で何が起きているのか。今回は、ボイステクノロジーに関する意思調査などから、人間とコンピューターの関係がどのように変化しているのか、そして今後どのような関係になるのかを考えてみたい。
ボイステクノロジー、アマゾンが独占するAIスピーカー市場
本題に入る前に、ボイステクノロジーに関連するAIスピーカーの基本構造と市場の全体感を見てみたい。
ここで使っている「AIスピーカー」とは定まった呼び名でなく、便宜上使っている名称だ。市場が新しいため「ボイスファースト・スピーカー」や「ボイスエナブル・スピーカー」などいくつかの名称が混在している。
アマゾンEchoを基準とするなら、AIスピーカーとは、クラウドベースの音声認識エンジン(人工知能)につながったスピーカーと定義することができる。アマゾンでは、この人工知能をAlexaと呼んでいる。スピーカーはあくまで、音声をひろい、そのデータをクラウドに送信し、クラウド上で解析・アウトプットされたデータを音声に変換するためのデバイスだ。スピーカー自体に人工知能が搭載されているわけではない。
ボイステクノロジーの可能性は、サードパーティー・アプリの開発者がクラウド上にある人工知能を利用して、さまざまなサービスを開発できるところにある。たとえば、Alexaに連携させることのできるスマートLEDライトがある。連携させることで、声だけで電気をつけたり消したりできる。このほかにも、冷蔵庫、洗濯機、テレビなどの連携が進むと考えられている。
さて、そんなAIスピーカーだが、現在どれほどのユーザーがいるのだろうか。
eMarkterが今年4月に発表した調査によると、AIスピーカー市場における占有率はアマゾン Echoが70%、グーグル Homeが約24%と、ほぼこの2社が独占している状態だ。その他は5.6%で、レノボ、LG、ハーマンカードンなどが含まれている。
2017年末までに、米国のAIスピーカーユーザー数(少なくとも1カ月に1回は利用する)は3560万人と前年比で129%増になる見込みだという。世代別で見ると、ミレニアル世代が圧倒的に多い。
米国以外では、現時点Alexaの対応言語が英語とドイツ語であるため、英語圏とドイツ語圏に住むユーザーが多いと考えられる。
ボイステクノロジーが変えるひととコンピューターの関係
日本ではこれから盛り上がるボイステクノロジーだが、米国含め英語圏とドイツ語圏ではすでに数千万人のユーザーがおり、今後もさらに増えていく見込みだ。
ここで気になるのは、ボイステクノロジーがさらに浸透していったとき、ひと・社会はどう変わるのだろうかということだ。過去には、電気、自動車、飛行機、インターネット、スマホなど、テクノロジーの登場で私たちのライフスタイルは大きく変わってきた。ボイステクノロジーのインパクトはどれほどのものになるのだろうか。
すでにボイステクノロジーが普及している市場を見てみると、その答えの一端が見えてくるかもしれない。
世界最大の広告会社グループWPPの広告代理店ジェイ・ウォルター・トンプソンがこのほど実施したボイステクノロジーに関する調査では、普段ボイステクノロジーを利用しているひとびとがどのようにこのテクノロジーを認識しているのかが明らかになった。ここから、人間とコンピューターの関係が変わっていく未来が少し見えてくる。
この調査で以下のようなことが明らかになった。
ー72%のボイステクノロジーユーザーが企業・ブランドは独自のボイスアシスタントを開発するべきだと考えている。
ー53%のスマートフォンユーザーがボイスアシスタントに話しかけ、また話しかけてくれたほうが楽だと考えている。
ースマホでタイピングするよりも声で話しかけたときのほうが人の感情的な脳の働きは2倍アクティブになる。
これらの結果から分かるのは、ひとびとはAlexaなどで使われているデフォルトの声ではなく、個性ある声を好み、その個性ある声とインタラクティブにコミュニケーションを取りたいと思っているのではないかということだ。
単にコマンドを出して、それをコンピューターが処理する時代は終わりつつあり、人間はコンピューターに個性を求め、コンピューターは人間を理解し、コミュニケーションする相手になる時代に入ろうとしているのではないだろうか。
これはAlexaだけでなく、日本でもPepperを見ていると、その流れを感じるとることができるはずだ。Pepperは白色のボディーを持つロボットだが、いまPepperに専用のユニフォームを着せる企業が増えている。なぜかというと、Pepperにユニフォームを着せることで、個性が生まれ、人間とのコミュニケーションが促進される効果があると分かってきたからだ。
鉄道会社のユニフォームを着るPepper(YouTubeより)
また、ボイステクノロジーも人間とのコミュニケーションを深化させる方向で発展しようとしている。声によるコミュニケーションでは、言葉そのものだけでなく、声の抑揚も喜怒哀楽などを含む複雑な情報を伝達する役割を担う。現在は、抑揚による感情解析も進んでいるといわれている。
さらに、ボイステクノロジーに使われている機械学習やディープラーニングは、ユーザーのデータが蓄積すればするほどアウトプットクオリティが向上するとされている。データが蓄積していけば、人間の感情を読み取るだけでなく、感情を表現するボイステクノロジーが登場しても不思議ではない。
もし、このようにボイステクノロジーが進化していけば、この先スマホを見ることは少なくなるだろう。スマホを触ることなく、情報検索や買い物はもちろんのこと、人工知能と冗談を言い合ったり、愚痴をこぼしたり、人生相談したり、とアシスタントや友達、そしてメンターのような存在になるのかもしれない。