近年、AIの進歩が急速に進み、「Chat GPT」や「生成AI」という言葉をよく耳にするようになり、“AIの活用の幅”は益々広がっている。AI×自動車やAI×料理など、AIの活用が幅広い分野で行われている中、AI×音声の研究に力を入れている企業がある。
それが、音・音楽に関連する事業を中核に、“楽器”、“音響機器”、“部品・装置など”、3つの領域で幅広く展開するヤマハだ。
ヤマハは長年、AI技術を駆使した音声合成技術の研究を行っており、AI×音声を活用した、『なりきりマイク®』を展開している。
『なりきりマイク』は普通に歌うだけで、憧れの有名アーティストの歌声に誰でもなれる夢の道具である。2022年には、Every Little Thingの持田香織さんとコラボレーションをした「なりきりマイク feat.ELT持田香織」を展開し、大きな注目を集めた。そして2024年に第2弾として、第63回日本レコード大賞を受賞したDa-iCEさんとコラボレーション。ツインボーカルの大野雄大さん・花村想太さんの歌声になりきれる『なりきりマイク VOLUME 2 Da-iCE』を開発。この”有名アーティストの歌声に誰でもなれる”技術を実現したのが、ヤマハが培ってきたAI技術を駆使した音声合成技術『TransVox®(トランスヴォックス)』である。
今回は、ヤマハ株式会社TransVox企画担当の倉光大樹氏(以下、敬称略)に、『なりきりマイク』開発における苦労したポイントや、展開の経緯、『TransVox』と『なりきりマイク』の今後の展望などに関して、お話を伺った。
- ー倉光大樹氏 プロフィールー
- ヤマハ株式会社 ミュージックコネクト推進部 戦略企画グループ 主幹
- 2004年ヤマハ株式会社入社。商品企画として、カジュアルオーディオのラインアップ立ち上げに携わり30商品以上をプロデュース。その後コミュニケーションロボットCharlieを企画。2022年に「なりきりマイクfeat.ELT持田香織」をローンチ。現在、サービス分野の新規事業を担当するミュージックコネクト推進部で新規事業企画に従事。
――『TransVox』と『なりきりマイク』に関して、改めて概要を教えてください。
『TransVox』は、AIを活用し、発声した音声を瞬時に別の音声に合成・変換する技術です。まず、アーティストの大量のボーカルデータをAIに学習させることで、歌声の特徴、抑揚、癖などを把握します。そして、それを楽譜に近いようなデータに変換してから、その情報を学習済みのAIに送ります。それにより、AIは、「アーティストがこの楽譜を読むと、こう発音し、こう歌うだろう」と瞬時に判断し、音声をリアルタイムで合成します。この技術を活用することで、年代や性別を問わずどんな人の声でも別人の歌声に変換できる『なりきりマイク』が誕生しました。第一弾のEvery Little Thing持田香織さんの際に、非常に大きな反響を呼んだこともあり、第二弾として、『なりきりマイク VOLUME2 Da-iCE』を3月29日(金)から8月29日(木)までの期間限定で、全国18店舗のカラオケ店にて展開しています。
――第1弾実施後の反響において、印象に残っているものがあれば教えてください。
実際に体験した方々から、「気持ちよかった」、「楽しかった」、という声をいただけたことが何よりうれしかったです。リリースするまで、自分たち自身、この体験価値がどのように受け入れられるか不安でした。なぜ違う誰かの声で歌わなければならないのか、自分の声で歌うから楽しいのではないのか、とマイナスに考え始めるとキリがありません。結果、「楽しかった」とシンプルに多くの方に言っていただけたことがこの第二弾への原動力になりました。
――今回、第二弾のコラボレーションの対象としてDa-iCEの大野さんと花村さんの声を選んだのはなぜですか?
第一弾の際、メディアで紹介していただいたのをDa-iCEさんがご覧になり、本技術に興味を持っていただいたことがきっかけです。初めて男性アーティストの歌声や2音声の同時出力(デュエット機能)に挑戦したい気持ちもあり、今回のコラボレーションが実現しました。また、ELT持田香織さんとは異なるファン層にアピールできる点も大きな要因でした。
――第1弾から進化したのはどんなところですか?
音質的な改善に加え、男性アーティストの声への変換も可能になったこと、さらに2音声の同時変換(デュエット機能)への対応が第一弾からの大きな変化です。
――今回の『なりきりマイク VOLUME2 Da-iCE』の開発で苦労したのはどんなところですか?
第一弾のELT持田香織さんの『なりきりマイク』のシステムは、カラオケ店の機器とは完全に独立していたため、専用のマイクを使用し、採点機能に対応していないなどの使い勝手に課題がありました。今回は、システムの改良を行い、カラオケ常設のワイヤレスマイクを使え、採点機能にも対応するなど、事業化を視野に入れてカラオケ店の機器との親和性を高めています。この開発にあたり、様々な機器との連携において多くの苦労がありました。
――今回の『なりきりマイク VOLUME2 Da-iCE』展開後、何か反響はありましたか?
Da-iCEファンの方がスペシャルルームで楽しんでいる様子は、Xの投稿などでも拝見しています。今回、多くの店舗で部屋をデコレーションしたコラボルームやコラボドリンクの展開もあり、『なりきりマイク』含め、「推し活」として、Da-iCEさんの世界を満喫いただいているようです。若干の遅れもあるので、歌い方に慣れが必要ですが、Da-iCE以外の曲で仮想コラボを楽しむなど、皆さんそれぞれの楽しみ方でご活用いただいています。リピーターも増えており、カラオケの楽しみ方の一つとして『なりきりマイク』が定着していくといいなと思っています。
――開発面、ビジネス面などにおいて、今後の課題はありますか?
歌声・声に関する価値創造はヤマハだけではできず、声の主の方々と一緒に取り組んでいく必要があります。今回の『なりきりマイク VOLUME2 Da-iCE』では、avexさん、Da-iCEさんの全面的なサポートがあり実現しました。今後、このエンターテイメントを広く普及させるために、権利者の方々と歩調をあわせ、お互いが納得できる体制を整えることが必要です。この取り組みは前例がないため、ハードルの高い課題だと考えています。
――今後、『TransVox』や『なりきりマイク』の活用方法で挑戦していきたいことはありますか?
『TransVox』としては、歌だけでなくしゃべり声などでの活用も考えています。今年2月には、静岡県イメージキャラクター「ふじっぴー」の声変換についても発表しましたが、その他にもナレーションやアニメの領域にも挑戦していきたいと考えております。もともと歌がルーツであることから、『TransVox』の技術は抑揚の豊かな表現などに向いています。声優さんの感情のこもった声の再現、そこから生まれるエンターテイメントにいつかチャレンジしてみたいです。
また、しゃべり声での活用ができるようになったため、病気や障害などで声が出しにくい方の補助など、エンタメとは異なる分野でも何か活用できないかと個人的に考えています。
『なりきりマイク』としては、カラオケのエンターテインメントサービスとして提供できるよう、事業化を目指しています。曲を選ぶように声を選んで歌を楽しむという体験が理想です。しかし、事業化にあたってはまだ多くの課題が残っており、それらを一つ一つ解決していく必要があると思っています。