英語スピーキング評価AI技術「CHIVOX (チボックス)」を提供するアイードは、2021年1月より新技術「自由発話認識評価カーネル」の提供を開始することを発表した。

今回提供を開始する新技術「自由発話認識評価カーネル」は、英語で発話された内容を文字に起こした上で、発音評価も同時且つリアルタイムに行うという特徴がある。

日常英会話やヒアリング試験対策/スピーキング演習など、様々な学習ニーズに適していると考えられ、高い認識精度を持つ音声認識技術によってインタラクティブなユーザーエクスペリエンスの実現をサポートするとのことだ。

自由発話認識評価カーネルは従前のサービスとは異なり、事前に評価対象となる英文テキストを用意する必要はなく、学習者の自由な発話内容を文字に起こし発音評価を行うため、これまでにはないUI/UXでのプロダクト開発が期待されるという。

また、評価対象を限定しないだけでなく評価基準の調整も可能であるため、プロダクト開発の幅が広がり多くの可能性をもたらすとのことだ。

新カーネルの特徴は以下のとおり。

・音声認識技術×音声評価技術がベース
・発話内容の文字起こし及び発音評価をリアルタイム且つ同時に行える
・高速フィードバック
・音声認識の結果を単語毎にレーティング
・主な発音評価項目は「総合点」「流暢性」「ポーズ」「WPM」

新カーネルでは、発話した単語毎のスコアをフィードバックすることが可能。一般的な音声認識技術は文字起こしを行うが、その成り立ちもあり、認識された結果を単語毎にレーティングを行いフィードバックするという概念自体がないという。

一方、音声評価技術がベースのCHIVOXは語学学習用途に特化されており、今回もグローバルのニーズに応える形で新カーネルを開発/リリースするに至ったとのことだ。

また、音声認識技術には標準的なネイティブの発話モデルが採用されているため、ネイティブの発話に近ければ近いほど、自身の発話内容が正確に文字に起こされる。

定量評価もリアルタイムに文字起こしと同時に行われるため、AIが自分の発話内容を正確に文字に起こしてくれるまで、即ち、ネイティブに近い発音レベルになるまで「評価の高い単語は自信をもって」「評価の低い単語は意識をしながら」何度もスピーキング練習を行うといったユーザー体験が実現できるとのことだ。