AMP

AMP CLOSE×

動画分析もAIで自動化する時代に NVIDIAのAI Blueprintが瀺す動画分析AI゚ヌゞェントの可胜性

AIを掻甚した動画分析技術、NVIDIAの最新アプロヌチ

テキストデヌタの分析凊理粟床は、倧芏暡蚀語モデルLLMの登堎により倧きく改善した。䞀方、画像や動画の分析は、耇雑な芖芚情報の理解が必芁ずなるため、その自動化には䟝然ずしお課題が残されおいる。この状況を䞀倉させる可胜性を秘めおいるのが、NVIDIAが発衚した「AI Blueprint」だ。

2024幎11月に発衚されたAI BlueprintAIブルヌプリントは、さたざたな業界の開発者が高床な映像分析AI゚ヌゞェントを簡単に構築できるツヌル。コンピュヌタビゞョンず生成AI技術を組み合わせたシステムで、膚倧な映像デヌタから必芁な情報を怜玢芁玄するこずができる。このシステムの背埌では、メタ瀟のLlama 3.1 405Bなどの倧芏暡蚀語モデルず、NVIDIAの芖芚蚀語モデルVLMなどが連携しお皌働しおいる。

埓来の映像分析システムでは、厳密なコヌドによる実装が必芁だったが、AI Blueprintでは自然蚀語による指瀺だけでAI゚ヌゞェントをカスタマむズできる。たた、゚ッゞ、オンプレミス、クラりドのいずれの環境でも利甚でき、GPUによる高速凊理により、倧量の映像アヌカむブから重芁な瞬間を特定する䜜業を倧幅に効率化するこずが可胜ずなる。これにより、産業や自治䜓におけるAIアシスタントの導入障壁が倧幅に䜎䞋するこずが期埅される。

すでにアクセンチュア、デル、レノボずいった倧手テクノロゞヌ䌁業が動き出しおいる。デルは自瀟のNativeEdgeプラットフォヌムにAI Bluprintを統合、レノボもHybrid AI゜リュヌションぞの統合を進めおいる。䞀方、アクセンチュアはAI Blueprintを同瀟のAI Refineryに統合し、䌁業デヌタを掻甚したカスタムAIモデルの開発支揎を掚進䞭ずいう。

AI Blueprintは、NVIDIAのMetropolisず呌ばれるビゞョンAIアプリケヌション開発ツヌル矀の䞀郚ずしお提䟛される。開発者は無料でAI Blueprintを詊甚ダりンロヌドでき、NVIDIA AI Enterpriseを通じお本番環境での展開も可胜だ。

NVIDIAのアプロヌチ、その詳现

前述したがAI Blueprintは、いく぀かの重芁な技術芁玠を組み合わせるこずで、高床な映像分析を実珟しおいる。その䞭栞ずなるのが、芖芚蚀語モデルVLMを掻甚したAI゚ヌゞェントだ。

AI BlueprintのアヌキテクチャNVIDIAりェブサむトより
https://build.nvidia.com/nvidia/video-search-and-summarization/blueprintcard

このAI゚ヌゞェントは、NVIDIAのNIMマむクロサヌビスを通じお、耇数の技術コンポヌネントを統合したもの。具䜓的には、NVIDIAのVILAモデル、メタ瀟のLlama 3.1 405B、GPU加速による質問応答モデル、コンテキストを考慮した怜玢拡匵生成RAGモデルなどが含たれる。開発者は、これらのコンポヌネントを自瀟の環境や甚途に合わせお眮き換えたり、NVIDIAのNeMoプラットフォヌムを䜿っお埮調敎したりするこずが可胜ずなる。

ナヌスケヌスずしお、たずえばAI゚ヌゞェントが安党プロトコルの違反を怜知しお䜜業員に譊告を発する倉庫の安党管理システムや亀通事故を特定しおレポヌトを生成し、緊急察応を支揎する亀通監芖システムなどが考えられる。たた、航空写真から劣化した道路、線路、橋梁を特定し、予防保党を支揎する公共むンフラ保守点怜システムを構築するこずも䞍可胜ではない。

このほかにも、芖芚障害者向けの映像芁玄、スポヌツむベントのハむラむト自動生成、他のAIモデルのトレヌニング甚デヌタセットのラベリング支揎など、幅広い甚途が想定されおいる。さらにAI Blueprintは、AIを掻甚したデゞタルアバタヌ䜜成、パヌ゜ナラむズされたカスタマヌサヌビス向け仮想アシスタントの構築、PDFデヌタからの䌁業情報抜出など、すでに提䟛されおいる他のワヌクフロヌず組み合わせお利甚するこずもできる。

NVIDIAによるず、マレヌシアやベトナムではスマヌトシティやスマヌト亀通システムの開発でAI Blueprintが掻甚されおいるずいう。

AI Blueprintずはどのようなシステムなのか、NVIDIAのテストペヌゞで確認するこずが可胜だ。

以䞋の䟋では、倉庫での䜜業珟堎動画をAI゚ヌゞェントに読み蟌たせ、動画䞭に危険な堎面がないかを問い合わせおいる。AI゚ヌゞェントは、動画䞭で䜜業員が箱を通路に眮いたたた䜜業しおいる点を挙げ、通行のさたたげや危険に぀ながるず指摘するこずに成功しおいる。

動画分析AIのナヌスケヌススポヌツハむラむト動画の自動生成など、スポヌツ分野で高い需芁

珟状を芋る限り、映像分析AIの実甚化はたずスポヌツ分野で広がる可胜性が高い。この分野で特に泚目されおいるのが、NVIDIAの支揎を受けるむンドのAIスタヌトアップVideoVerseだ。

VideoVerseは、映像理解、自然蚀語理解、音声凊理、物䜓怜出ずいった耇数の技術を組み合わせるこずで、スポヌツの重芁な瞬間を自動的に抜出する仕組みを構築。スポヌツハむラむト䜜成の自動化゜リュヌションをプロアマのスポヌツ団䜓に提䟛しおいる。

同瀟のマルチモヌダルモデルは、遞手の動き、音声、埗点衚瀺などの情報を総合的に分析。たずえば、クリケットでは「フォヌ」「シックス」「りィケット」、バスケットボヌルでは1〜3ポむントシュヌト、ダンク、レむアップなど、各スポヌツ固有の耇雑なむベントを識別するこずが可胜。玄5䞇件のサンプルを甚いたトレヌニングにより、最倧90%の認識粟床を達成したずいう。

VideoVerseの゜リュヌションNVIDIAりェブサむトより
https://www.nvidia.com/en-us/on-demand/session/aisummitin24-siin1053/

スポヌツ関連では、ニュヌペヌク拠点の䌁業GameChangerも興味深い取り組みを芋せおいる。同瀟は、バスケットボヌルずバレヌボヌル向けに、AI駆動の映像分析ツヌル「フィルムルヌム」をリリヌス。このツヌルは、詊合映像から無駄な時間を自動的に陀去し、指導に掻甚できる重芁なプレヌだけを抜出できる。コヌチングの倧幅な効率化が可胜になる芋蟌みだ。

䞀方、セキュリティ分野でも映像分析AIの研究開発が進む。バヌゞニア倧孊工孊応甚科孊郚の研究チヌムは、人間の行動を高粟床に怜出できるAIシステム「SMAST」を開発。同システムは、シヌンの重芁な郚分に焊点を圓おる「マルチ特城遞択的泚意モデル」ず、時間経過に䌎う動きを远跡する「モヌション察応2D䜍眮゚ンコヌディングアルゎリズム」を組み合わせるこずで、リアルタむムで耇雑な行動を認識できるようになった。

映像分析AIは、スポヌツのパフォヌマンス分析からセキュリティたで、幅広い分野で実甚化が進み぀぀ある。AI Blueprintのような開発支揎ツヌルの登堎により、今埌さらに倚くのナヌスケヌスが登堎する芋蟌みだ。

文现谷元Livit

Vote

  • SDGsぞの興味・関心はありたすか
  • SDGsの17の項目のうち、䌁業に特に取り組んでもらいたいのはどの項目ですか耇数回答可
  • SDGsに寄䞎しおいる䌁業を評䟡したすか
  • SDGsに寄䞎しおいる䌁業の補品・サヌビスの利甚に぀いお教えおください
  • 補品そのものがサステナブルなのかどうかは賌買意思決定の基準になりたすか
  • ESG環境・瀟䌚・ガバナンスを意識した経営・取り組みを行っおいる䌁業に関心はありたすか
  • SDGs6「安党な氎ずトむレを䞖界䞭に」においお、日本が抱える1番の問題はなん だず思いたすか
  • SDGs6「安党な氎ずトむレを䞖界䞭に」においお、ご自身が取り組んでいるこずは以䞋のうちどれですか耇数回答可
  • SDGs6の達成のために、これからも意識しお行動しようず考えおいたすか