INDEX
目の前に、立っている女性がいて足元の地面にハンカチがある場合、おそらく「ハンカチ落としましたか?」と声をかけるだろう。
この行動の中には、実は3つのステップが存在しており、①女性とハンカチを認識すること、②足元にあるハンカチは女性が落としたものと理解をすること、③声をかけるという行動をすることだ。
行動するためには、認識することと、理解することが必要である。ロボット、AI分野においてもこの基本原則は同様だ。AI領域で、この基本原則の実現に挑戦しているのがCogentLabs(コージェントラボ)である。
CogentLabsはソリューションとして、認識のための「Tegaki(テガキ)」を2017年8月に提供開始し、理解のための「kaidoku(カイドク)」を本日11月15日に発表した。それぞれ、どのような技術なのだろうか。
手書き文字を“認識”するTegaki
Tegakiはその名の通り、手書き文字をデータ化するAIサービスだ。これまでの技術では自動認識による読み取りが難しく、キーボード入力が必要だった手書き文字を、スピーディかつ高精度でデータ化する。独自開発のAI技術でデータを処理・学習することにより、継続的に読み取り精度が向上する仕組みだ。
Tegakiは認識の部分を担う典型的なAIである。AIブレイクスルーは、認識によるものが大きく、感情認識や手書きなど、非構造データを構造化していくことが求められる。
Tegakiが生まれた背景を、Cogent Labs代表取締役の飯沼純氏はこう語った。
飯沼氏「AIはバズワードになっていました。AIを使って何かしたい、というクライアントの声が多かったが、そもそもどんな課題があるかということをヒアリングするようにしてました。大事にしていたのはAI導入でビジネス課題が解決できるかという視点です。データ入力はその一つの領域でした。データ入力には、時間とコストがかかるためです。」
社内にドキュメントがたくさん残っている。これをテキスト化し、社内の情報を一元化して、業務判断や意思決定に役立てたいが、そもそもデータ入力に時間とコストがかかるという課題に対して、AIが応えられると感じたのだ。
飯沼氏「初めは一人のリサーチャーと2、3人のエンジニアをアサインし、日本語の手書き認識の精度を確認しました。こういったアルゴリズムを創ってみたら、98.66%の精度をだすことができました。短い期間で高難度の認識ができ、ディープラーニングのテクノロジーを活用することによって多くのお客様が享受できるとするならば、プロダクト化することによって社会に意義のあるものになるのではと思い、トライアルとしておこないました。」
tegakiと他社OCRの比較をするための同社テストの結果では、文字量から修正数を表した精度はtegakiは99.37%、他社OCRでは75.95%だったという。tegakiの精度がいかに高いかがみてとれる。
Tegakiの特徴は大きく4つで、学習性、拡張性、利便性、経済性である。
学習性では、読取精度の継続的な向上があり、トレーニングのテストでは、複数社で実施し1~10%程度の精度向上が確認できた。拡張性という点では、業界用語や他言語対応がある。
利便性という点では、単純なテキストに限らず、活字、数字、アルファベット、チェックボックス、アンケートフォームの丸囲い等に対応している。経済性においても、10文字の場合のコストは、人入力の場合役17.6円(同社想定)に対し、tegakiでは1円以下でおさえられるという。
tegakiは大きなビジョンを描いている。一つのテクノロジーで様々なフォーマットに対応できるソリューションとして、パートナーと共に市場浸透を狙う。
文書内容の類似性を“理解”するkaidoku
構造化していないものをインプットするのが認識、それを分類するのが理解ということで、認識の次は理解のステップである。データが収集できても、その意味が理解できるかどうかがポイントであり、kaidokuは理解に関するソリューションだ。
現状、テキストデータの取得後に行われるのは、フローの中で複数の人員が介在する業務や、専門家の複雑な作業などがある。いずれのケースも、煩雑で非効率なタスクが含まれている点を、CogentLabsは課題と捉えた。文書検索システムkaidokuでは、分類機能、高度検索機能、文章の内容を文脈から判断する機能などで、その課題に応える。
分類機能では、文章を自動的に分類し、ラベルを付け、センチメント分析(肯定、中立、否定)も可能だ。例えば目の前にレビューがきたときに、それが苦情なのか、褒めているのかがわかったり、弁護士業務においてはその案件に対する過去の類似判例がわかったりする。
高度検索機能では、高度なキーワード検索ができ、文章の意味に基づいた検索など類似検索も可能。さらに、1秒以内に何百万もの文書を検索し、最も関連性の高い文書を見つけだすことができる。
そして文章の内容を文脈から判断する機能では、様々なドキュメントの文章を理解し、既存のデータベースに新しいテキストをマッピングすることで、情報の関連性などを見つけることが可能である。
kaidokuを活用することで、キーワードや意味にもとづいた文書の検索や、気づかなかったデータの関係性の発見などが可能になり、これまで専門家が膨大な時間をかけていた仕事や、多数の人が介在して処理していたタスクを、圧倒的に効率化できる。
AIで新たな未来を切り開く
飯沼氏「データ入力は一例ですが、人の業務の中で生まれるルーティンワークをAIの力で取り除いていきたいと思っています。」
AIで未来を切り開くCogent Labsは、どんな会社なのか。そしてどんな方向を目指していいるのだろうか。
飯沼氏「いかに優秀なAIをビジネス課題にマッチさせて広げていくかが大事です。一方で、ビジネス目線だけでは正しいアルゴリズムで優秀なAIを創ることができません。だから、ビジネス側の人間と研究側の人間の両方が必要なんです。Cogent Labsでは、双方の優秀な人材をチームメンバーとして持ち、グローバルな視点で取り組んでいます。これがわたしたちの強みでもあります」
Cogent Labsには、ビジネス視点をもった飯沼氏や他メンバーのほか、機械学習、天文物理学、統計学、量子力学、脳科学などの専門的な知識をもった技術者・研究者が在籍している。ディスカッションの中でも、多様なメンバーからの意見が重なり合うことで、新たな発見や価値が生まれることがあるという。
飯沼氏「企業は社会の中にあるべきで、だからこそ企業は社会に貢献していくものでなくてはならないと考えています。しっかりとした技術を多くの人々にデリバリーしていくことが、研究・ビジネスの双方の視点をもったわたしたちの役目だと思います。その中で、ソリューションとしてのイメージはどんどん膨らんでいくと思います。
例えばハンデを背負った子供たちにテクノロジーを活用することでハンデを軽減できないか、ゴミの分別をテクノロジーでおこなうことで新たな経済が生まれないか、ボイスインターフェイスが流行っているが脳波をデータ化することで声のだせない人もデバイスに指示ができないか、など様々です」
認識、理解という基本原則に関する技術のため汎用性が高く、領域を限定しない。例として法律に関する業務や医療、保険などの業界があげられていたが、他にも活用シーンはさまざまである。たとえば、多くの人が受ける試験などで、マークシートではなく記述式でも効率的に採点することができるようになるかもしれないし、記述回答の内容に応じて受験者のクラスタリングなどもできるかもしれない。
Cogent Labsという名からもわかるとおり「ラボ」としての機能を持ち、社会的な意義を求めトライアルを進めながらも、ビジネス視点で課題解決に役立てるためのブリッジをおこなっているという両輪がワークすることで、ソリューションとして社会に登場し始めている。Cogent Labsは人とAIが寄り添い発展していく社会を目指す。
Photographer : Kazuki Kimura