手書き文字を含む技術文書をAIで読み取り。未来へ残す先人たちの知恵

TAG:

「古きを知り、新しきを知る」ということは世界の発展においてとても重要なことである。過去の文書や絵画などは未だに解明していないものが多数存在し、その情報が社会に与える影響は計り知れない。

そのような背景から、先人の知恵(文書)と新しいテクノロジー(AI)の融合によって、先人の知恵を後世に残そうという試みが行われる。

昭和電工株式会社と株式会社シナモンは、AIを活用した技術文書活用システムを共同で開発することを決定した。

この開発は、国立研究開発法人 新エネルギー・産業技術総合開発機構(NEDO)の「AIシステム共同開発支援事業」の助成事業として採択されている。

AIで高精度自動読み取りし電子テキスト化

我が国の製造業が過去数十年にわたり蓄積してきた技術文書には、貴重な知見が多数含まれているが、その多くが紙資料として保管されている。先人の知を最大限有効活用し、新たな価値を創造していくための源泉とするには、それらの「アナログデータ」を「デジタルデータ」に変換し、電子データベースとして保管することが望まれる。

一方、膨大な紙資料を人の手で電子化するのは現実的に困難であり、さらに、手書き文字を含む技術文書の場合、既存の自動文字認識(OCR)技術では十分な読み取り精度が得られないことから、紙媒体で保管された技術文書の電子データベース化はこれまで実現が困難だった。

今回、昭和電工とシナモンは共同でこの課題に取り組み、手書き文字を含む技術文書をAIで高精度自動読み取りし電子テキスト化する機能と、利便性の高い検索機能を併せ持つ、技術文書活用を目的としたデータベースシステムの開発に取り組む。

AIと画像解析の双方に関する深い知見と高度なプログラミング技術を有するシナモンと、石油化学、カーボン、アルミニウム製品など多岐にわたる分野で豊富なリアルデータ(技術文書)を保有する昭和電工が密に協力・連携して開発を進めることで、実用性の高いシステムの創出を目指す。

欧州で大規模に進められる「タイムマシンプロジェクト」とは

これまでも、過去の文書や画像などのビッグデータを用いたプロジェクトがある。たとえば、2,000年に及ぶ欧州の歴史をデジタル化してマッピングし、大規模シミュレータを設計しようという「Time Machine FET Flagship」だ。

これは、2012年、ヴェネチアからスタートした。スイス連邦工学大学ローザンヌ校でデジタル人文科学ラボを運営しているFrédéric Kaplan教授の旗振りの元、同大学、ヴェネチア大学との共同で「ザ・ヴェニス・タイムマシン・プロジェクト(The Venice Time Machine Project)」としてローンチした。

中世、共和国の首都として栄えたヴェネチアは、独自に行政システムを発展させ、住民登録から建物や運河建設の記録、貿易船の入港記録など、約1,000年にわたるヴェネチアの生活の詳細かつ膨大な記録が残されている。これらの文書や画像の記録をすべてデジタルでデータベース化し、インデックス化し、セグメント分けして検索可能にしようというものだ。

このプロジェクトが画期的なのは、大きく2点である。まず、今までかつてないデータ収集の量であること。ヴェニス一都市だけでも19万の記録、72万点の画像、3,000本もの書籍のデジタル化で、所蔵されている記録の1%にも満たないという。

次に、欧州史上かつてない規模のビックデータ収集に、ディープラーニングなどの高度な機械学習やAI技術を取り入れることでリフェレンスだけではなく、シミュレーションも可能にすることである。

2012年にスタートしたこのプロジェクトは、2016年のマニフェスト宣言をへて、EUの大規模プログラム「FET(Future Emerging Technologies)Flagships」の一環として、範囲をヨーロッパに拡大、32カ国、200の組織、団体、企業が参加し、人文科学史上かつてない規模で進行しているのだ。

未来への発展のための礎になるAI活用

最近では、今後AIにより、われわれの職業のほとんどが奪われるというネガティブな予測が多い。そうではなく、今回のように未来への発展のための礎になるような活用が広がることを願う。

img:PR TIMES

モバイルバージョンを終了