今や企業活動に不可欠となったデータサイエンス。分析の中核を担うデータサイエンティストは、知識の専門性と領域の先進性ゆえに、世界中で人材が不足している。そこで注目されるのが、AIや機械学習を活用したデータ分析のプロセスを自動化する動きだ。

なかでも、米国を拠点に世界中にプロダクトを展開するdotDataは、データサイエンスの工程全体を自動化するプラットフォームを構築した、同領域のトップランナーだ。日本国内でも導入企業が急増し、業務プロセスに大きな変革をもたらしている。

今回は従来の機械学習の常識を塗り替え、データサイエンス分野を加速する同社の取り組みと、『Microsoft for Startups』参画によって生まれるシナジーについて、CEOの藤巻遼平氏(以下、敬称略)に話を聞いた。

データ分析のAI活用は、人と時間の問題を抱えている

――データサイエンスにおけるAIや機械学習の活用は、どのように進展してきたのでしょうか。


dotData, Inc. CEO 藤巻遼平氏

藤巻 ビッグデータという言葉が流行した2010年代前半、企業が蓄積されたデータを可視化し、活用しようとする動きが活性化しました。データをプロアクティブに活用するために、人間が担っていたデータ分析の工程を自動化したり、コンピュータの計算力でより高度な意思決定を支援したりと、新たな仕組みが求められていきます。こうした流れから、AIや機械学習を導入する流れが生まれました。

2010年代後半、「AI活用で既存の業務を効率化し、新たな価値を生む」という考えが、徐々に定着しました。そして現在は、「AIを利用できなければ企業はその活動を持続できない」といわれるほど、重要度を高めつつあります。

しかし、実際に企業がデータ活用でAIを取り入れる上では、課題がいくつかあります。

一つは「人」の問題です。機械学習は新しい領域である上、数理や統計、ソフトウェアの技術を理解していなければ扱えない分野。これらを扱えるデータサイエンティストは、世界的に不足しています。特に日本では顕著で、データサイエンティストチームを抱える企業はまだまだ少ない状況です。米国であっても、スモール/ミディアムエンタープライズのマーケットとなると、100人規模の会社にデータサイエンティストが1人か2人いるといった程度なんです。

もう一つは、「時間」の問題です。データを用意して課題を設定し、モデルを組んでハンドリングするのには、何カ月もかかります。そもそもの人材が少ないのに、プロセスにも時間がかかる。この2点はAI導入の大きな障壁となっていました。

仮に導入されたとしても、それが機能するかはまた別の話です。よく“PoC(概念実証)疲れ”といわれますが、何カ月も分析・実証を行なった挙句、求めていた成果にたどり着けず、経営層の理解を得られないことで結局定着しないというケースも多いです。本来AIは、もっとクイックに、試行錯誤をしながら運用していくもの。しかし実際にはハードルが高く、業務に適用するところまで到達しないんです。

本来あるべき世界は、全ての業務にAIなどを用いたインテリジェントなモデルを組み込み、より高度な意思決定がされること。その理想に対して、大きなギャップが存在していたのです。

――そうした問題にアプローチするため、どんな機械学習部分に目をつけてdotDataを立ち上げたのでしょうか。

藤巻 プロジェクトとしてのdotDataは、研究員として所属していたNECで2015年頃から行なってきたものです。その後、事業をカーブアウトする形で、2018年、米国で現在の会社を創業しました。

私は機械学習の専門家ですが、最初から機械学習の自動化を目指していたわけではないんです。自動化したのは、機械学習の前処理にあたる、蓄積された生のデータを加工する部分。この「特徴量(※)設計」は、分析工数の8割を占めるともいわれる、手のかかる工程です。

※特徴量
コンピュータの学習指標となる対象データの特徴を数値にして表したもの

今思うと、特徴量設計をAIで自動化するという考えはユニークだったと思います。機械学習そのものは結局のところ数理・統計の世界で、計算によって最適化するのは比較的簡単なので、オープンソースが現れ、コモディティ化することは、当時からなんとなく見えていました。一方、業務に関する知見をベースにデータを加工する特徴量設計は、どこか泥臭く、自動化しづらいものです。そこに早い段階でアプローチしたことが功を奏したように思います。

――企業がAIを導入する動きは加速の一途をたどっていますが、今後はどのようなソリューションが求められていくのでしょうか。

藤巻 海外では、AIが「特別な技術ではない」というフェーズに移行したと考えていいと思います。ただし、AIはあくまで手段。ビジネスのユースケースの中で初めて価値を生みます。企業においては、「どのようなユースケースにAIを活用することが最も効果的か」という、もっとも本質的な課題を見つけ出す力が重要になってきています。

そのため、自動化技術もアジャイルな開発が求められてきています。これまでは万全なモデルを一つ構築して、長い時間をかけてシステムを作り込んでいく方法が主流でした。しかし現在は、AIが力を発揮するユースケースを素早く見つけ出す企業が成功します。そこでは、万全な一つのモデルでなく、何百もの小さなモデルを組み、運用と検証を繰り返していくことが必要です。だからこそ、人材や時間の問題を解決することが急務になっているんです。

リソースの最適化へ。データサイエンティストの役割を変えるdotDataの可能性

――dotDataのプロダクトについて教えてください。


dotData資料より抜粋

藤巻 エンタープライズ向けのソフトウェア「dotData Enterprise」は、データサイエンスにおけるプロセスの大部分を自動化します。コーディングやビジュアルプログラミング、フローの書き込みなど、専門的な作業は必要ありません。基本的には使用したいデータを選ぶだけで、あとは自動で進んでいきます。これまで必要だった、大量のSQLを書いたり、複雑なデータフローをキャンバスに書き込んだり、Pythonなどを用いて機械学習を行う作業をしなくても、多少のクリック操作だけで特徴量から機械学習のモデル開発までを行うことができるのです。

ただし、dotData Enterpriseはあくまでツールなので、どのようなユースケースを解くかという設定は人間が行います。この部分はある意味で最も難しいのですが、ビジネスにおいて最も重要な部分でもあります。その本質的な部分に人間が専念できるという点も、dotDataが提供できる重要な価値だと考えています。

dotData Enterpriseを取り入れた企業の方から、「モデルや特徴量をつくることが劇的に楽になった。その分、新たな部分が課題になった」という声をいただいたことがあります。この「新たな部分」というのは、AIのプロジェクトを継続的に運用していくか、各部門のスタッフがAIをいかに活用していくかなど、“カルチャー”にあたるところです。ビジネス部門がAIを活用して業務を改善するためのマインドセットや、それを推進するリーダーの育成、そうした本質的な部分にフォーカスできるようになったことは、自動化がもたらすポジティブな変化だと捉えています。

――プロセスの自動化に伴い、「データサイエンティスト」または「人」の課題はどう解決されますか?

藤巻 自動化の利点は、汎用的なプロセスを誰もが効率的に解くことができることです。一方、自動化が苦手なのは、そうではない“特化”したケースでしょう。一つ一つの問題に対してカスタマイズをしていく作業は、人間の方が得意なので、データサイエンティストが必要になるシーンは多いです。

では、どのように「人」の問題が解消されるかというと、一人のデータサイエンティストが生み出す価値が高まるということです。誰でも解けるような問題は自動化し、より難解な問題に専念する、エバンジェリストのようにAIを社内に布教する動きをするなど、もっとコアな部分にコミットすることができるようになります。

単純にいうと、それまでデータサイエンティストが解かなければならなかった100の問題のうち、80を自動化して、本質的な部分にコミットするわけです。データサイエンティスト自体は不要になるのでなく、むしろ重要性を増していくものと考えています。

――では、「時間」の課題はどのように解決されるのでしょうか。

藤巻 導入後にどれだけ使いこなせるようになったかにもよるのですが、米国の導入企業からは、データサイエンティストがいないほぼゼロベースで開始して、数週間程度で優れたモデルを構築し、年間売り上げの1%増を実現できたという評価をいただいたことがあります。ペイメントのトランザクションで問題を抱えていた企業で、支払いが滞っていた顧客に催促をするプロセスにAIを取り入れ、回収の効率化に成功したという事例です。

――改めてdotDataの強みを教えてください。


dotData資料より抜粋

藤巻 機械学習自動化の技術はここ2〜3年で急速に発展しており、現在は多くの企業が開発しています。dotData Enterpriseを活用する場合でも、機械学習の部分においては、他社のツールを使うこともできます。しかし、どのツールを使おうと、特徴量設計で入力するデータを作らなければ、分析は始まりません。そのデータを自動でつくるのが私たちのプロダクトです。この領域においては世界ではじめて実現した技術であり、現在もマーケットのリーダーであると自負しています。2019年には、米国の調査会社フォレスター・リサーチが行なった機械学習自動化に関するリポートで、最高ランクの「リーダー」に認定されました。

――データサイエンスの自動化は、どのような社会課題を解決していくのでしょうか。

藤巻 まずは人材の不足でしょう。特に日本は、労働人口そのものが足りないというフェーズに入っています。その中で国際競争力を高めるためには、業務の自動化によるリソースの最適化は不可避です。一方、AIや機械学習が、ITのように普通のインフラとなっていけば、自ずと専門的人材も増えていきます。この循環さえ生まれれば、日本も新たな戦い方ができるはずです。

例えば日本の製造業のお客さまで、dotDataを導入したことをきっかけに、200人規模のデータ分析者を教育するプロジェクトを始めたという事例があります。製造業では、工場の膨大なデータを収集して、生産性を上げていくことができるかは死活問題。このプロセスの大部分が自動化されたことで、むしろAIのリテラシーを向上する意識が高まっているのです。このように自動化は、多くの人がAIにコミットする帰結をもたらすこともあります。

信頼の獲得と先行投資のバックアップで、スタートアップを加速した

――マイクロソフトの『Microsoft for Startup』プログラムに参画された理由を教えてください。

藤巻 クライアントである企業から、マイクロソフトの担当者の方を紹介していただきました。きっかけ自体はdotDataがAzureをインフラとしてサポートしていなかったことなのですが、マイクロソフトの担当者とざっくばらんに事業内容について話をすることができ、Azureの連携が可能である『Microsoft for Startup』を勧めていただきました。

現在は『Microsoft for Startup』のプログラムからは卒業したという立ち位置ですが、データウェアハウスをはじめとしたさまざまなAzureサービスとの連携など、新たな形での協業が始まっています。

――スタートアップ時代、『Microsoft for Startup』のどのようなサービスが役立ちましたか。

藤巻 エンタープライズの場合、多くの企業がユーザー管理でActive Directoryを使用しています。AIや機械学習では、センシティブなデータにアクセスすることもできてしまうことから、ユーザー管理におけるガバナンスが非常に重要となります。この領域でマイクロソフトが高い信頼を獲得していることは大きく、dotDataのユーザー管理にマイクロソフト側のガバナンスを使用するなど、連携を深めることで、顧客の評価を高めることができました。

また、Azureの開発クレジットをいただけたのは大きかったです。売れるかどうかわからない段階で、どこまで先行投資をするかは、経営者として難しい判断。Azure上にdotDataを構築する開発に投資をすべきかと悩んでいたところ、マイクロソフトから、dotDataをAzureで提供することを条件に、開発クレジットいただくという進め方を提案していただきました。

ほかにも、米国や欧州での販路拡大で、マイクロソフトのコネクションでサポートしていただくなど、事業拡大で積極的な支援を受けています。dotDataの成長がマイクロソフトに対しても貢献するという、同じ視点に立ったパートナーシップが、良いサイクルを生んだのではないでしょうか。ビジネスユーザーから信頼されるプロダクトを多数持っている点も魅力で、それらと連携しながら、dotDataのビジョンを実現したいですね。

AIインフラがExcelのようになる未来

――dotDataは今後、どのようなポジションを目指していくのでしょうか。

藤巻 5年後の世界では、AIは企業のインフラになり、何百というモデルをそれぞれの企業が運用しているでしょう。そうしたシーンで、インフラ部分の有力なプレイヤーになっていたいですね。

最終的には、全てのビジネスユーザーが気軽に活用できるようなソフトウェアに仕上げていきたいと思います。ビジネスに生かされてこそのAIなのですが、ビジネス部門の人たちがAIの活用をするようになるには、米国でも日本でもまだ隔たりがある。そこを埋めなければなりません。

dotData Enterpriseによって、技術的な障壁を下げることを達成できましたが、それでもAIや機械学習は難しい領域です。まだまだユーザビリティを高める余地は残っていると考えています。Excelのように、高度な作業からちょっとしたメモ書きまで、全てのビジネスユーザーが使えるようなソフトウェアとなれることが理想的な状態なので、そこまでAIが身近になる未来を目指していきたいと思います。

文:相澤 優太