複数音声のデータも高精度なテキストに。日立製作所が切り開くデジタル対話サービスの未来

TAG:

近年、さまざまな業種で、労働人口の減少や長時間労働の是正など働き方改革が経営課題となっている。これにともない、業務負荷の軽減や生産性向上が求められている。

その一環として、会話音声をテキスト化する音声認識技術の活用に期待が高まっている。

この会話音声をテキスト化する音声認識技術に挑戦しているのが、日立製作所である。今回、同社のデジタル対話サービスの第2弾として、さまざまな業種における会議や商談などの会話音声をテキスト化する「音声書き起こし支援サービス」を販売開始した。

複数話者の音声データも高精度にテキスト化

同社の「デジタル対話サービス」について対話型ボットを活用して業務改革や新たな価値の創出を支援するサービス。第1弾には、チャットボットサービスをリリースしている。

今回のサービスは、その第2弾として、日立独自の音声認識技術を駆使し、雑音や反響音を除去して認識対象の音声のみを抽出する雑音除去技術と、複数方向からの音声を別々に認識する音源分離技術を活用した。

このため、音や複数話者の音声が含まれている音声データでも高精度にテキスト化することが可能だ。

また、従来、口元とマイクの距離が大きく離れると音声認識率が低下するため、精度の高い音声認識を行うためには、一人ひとりにマイク設備を用意して録音する必要があった。

しかし、音源方向を特定する日立の技術を組み込んだマイクであれば、一つのマイクで録音した音声データから複数話者の音声を音源方向から識別し、話者ごとのコメントをテキスト化することが可能である。

また、一般のマイクやICレコーダー、スマートフォンで録音した音声ファイルもクラウド上にアップロードすることで容易にテキスト化することができる。

さらに、ユーザー自身が単語や例文の表記と読みを登録できるカスタム言語モデルにより、予め登録されている一般的な用語に加えて、固有名詞や専門用語などを適宜追加することができ、ユーザーの業務に合わせた音声認識精度の向上を図ることができるという。

これらにより、会議の議事録作成や商談の記録作成などさまざまなシーンで事務作業の効率化を実現するのが狙いだ。

事務作業を格段に効率化するデジタル音声サービス

デジタルによる音声書き起こし支援サービスが、今後ビジネスの効率化に果たす役割は大きい。特に、会議の議事録の書き起こしなどには、絶大な威力を発揮するだろう。

このサービスによって事務作業は格段に効率化が促され、日本の抱える課題の一つである人材不足の解決の糸口になるかもしれない。今後、さらに精度を向上し、デジタル対話サービスの未来を切り開いていってもらいたい。

img:NIKKEI

モバイルバージョンを終了