富士通研究所と富士通研究開発中心有限公司(以下、FRDC)は、大量の学習データを準備しなくても、映像から人の様々な行動を認識するAI技術「行動分析技術 Actlyzer(アクトライザー)」を開発したことを発表した。
今回、富士通研究所とFRDCは、大量の映像での学習が不要で、複数の動作が組み合わさった複雑な行動を認識できる「行動分析技術 Actlyzer」を開発。本技術の特長は以下の通りだ。
- 複雑な行動を構成する基本動作を高精度に認識
- 基本動作の組み合わせから複雑な人の行動を容易に認識
複雑な行動を構成する要素となる約100種類の基本動作を独自に定義し、この全ての基本動作をディープラーニングにより認識できる技術を開発。本技術では、あらかじめ大量の映像データから認識したい基本動作を学習することで、約100種類の基本動作を平均90%以上の精度で認識できる。
これにより、歩いている・走っているという基本動作のほか、例えば、首を右に回す、首を左に回す、顔を上に傾ける、顔を下に傾けるなどの細かい基本動作においても、それぞれ高精度に認識可能だ。
基本動作の組み合わせや順番、発生場所、行動の対象などを指定することで、不審行動のような複雑な行動を認識できる技術を開発。本技術により、簡単な設定で様々な行動を認識することができ、またパラメーター変更などによりすぐに認識精度を調整することができる。
例えば、扉の前にいる、座る、鍵穴を見る、鍵穴に手をあてる、というように基本動作の組み合わせとその発生場所、および行動の対象を指定することで不審行動として認識できるようになる。
さらに、首を左右に回してあたりを見回すなどの条件の追加や、各行動の継続時間の指定により、認識の精度を調整することが可能になる。
屋内や屋外で撮影された21種類の映像データを使って、検出したい8種の不審行動(家の様子を伺う、凶器を振り回す、など)を認識する実験を行ったところ、全ての不審行動が認識できることを確認。
この8種の不審行動を検出するための基本動作の組み合わせのルール作りは1日で作成できたため、ユーザーは1日の評価実験だけで本技術の現場への適用可否が判断できるという。
なお、本技術は、不審行動に限らず、店舗での来店客の購買行動の分析、店員の応対動作の確認、製造現場での作業時間測定や作業手順の確認など、様々な業種・業務において映像から人の行動を認識し、業務品質の向上や効率化にも活用が期待される。