INDEX
企業のAI本格導入、成果を出せているのは一握り
生成AIの活用は企業にとって最重要課題の1つとなっているが、本格導入はまだ途上にある。AI開発プラットフォームのVellumが実施した最新調査で、AIを本格的に導入できている企業はわずか25.1%にとどまることが明らかになった。
この数字は、企業規模によって若干の差異がみられる。大企業では29%が本番環境での運用を実現している一方、小規模企業では23%にとどまる。残りの企業は、戦略構築(25%)やプルーフオブコンセプト(PoC)の作成(21%)、ベータテスト(14.1%)、要件定義(7.9%)などの初期段階にある状況だ。

https://www.vellum.ai/state-of-ai-2025
同調査は2024年12月に1285人のエンジニアらを対象に実施された。地域比率は、北米55%、欧州29%、アジア8%、中南米5%、オーストラリア3%。
導入済みの企業においても、明確な成果を上げているケースは限定的だ。最も多い「競争優位性の確保」でも31.6%、「コストと時間の削減」が27.1%、「ユーザー獲得率の向上」が12.6%にとどまる。また24.2%の企業が「目立った効果を見出せていない」と回答しており、企業ではAIの導入が進んでいるものの、依然としてユースケースの選定が課題となっている現状が浮き彫りとなっている。
現在、開発中のAIアプリケーションの種類は、ドキュメント処理・分析(59.7%)がトップ。これに、カスタマーサービスチャットボット(51.4%)、自然言語によるアナリティクスツール(43.8%)、コンテンツ生成(41.9%)、レコメンドシステム(25.9%)、コーディング(25.3%)、リサーチ自動化(23.7%)が続く。
GAI Insightsによる別調査では、本番環境での運用企業はさらに少なく、わずか5%程度にとどまっている。ただし、2025年には33%の企業が本番環境に移行する計画を持っており、CIOやCTOの予算配分においても生成AIが最優先項目となっていることが判明している。
一方、Menlo Venturesが600人のIT意思決定者を対象に実施した調査では、投資額の面で大きな伸びが確認された。2024年の企業のAI投資額は、前年の23億ドルから138億ドルへと6倍以上に急増。企業が実験段階から本格的な実行フェーズに移行しつつある兆候が示されている。
OpenAIのシェア低下、複数モデル活用が主流に
生成AIの実用段階への移行が進むなか、各企業はどのようなAIプロバイダを選択しているのか。Vellumの調査によると、OpenAIが63.3%と圧倒的なシェアを維持。これにマイクロソフト/Azure(33.8%)、Anthropic(32.3%)、AWS/Bedrock(25.6%)が続く。比較的新しい選択肢として、Groq(10.7%)やTogether AI(4.2%)など、オープンソースモデルのホスティングサービスの台頭も無視できない。

https://www.vellum.ai/state-of-ai-2025
企業規模による採用率の違いも顕著だ。Azureの場合、従業員数1〜10人の企業では25%にとどまる一方、5,000人以上の大企業では48%と、企業規模が大きくなるほど採用率が上昇する傾向が見られる。
一方、GAI Insightsの調査でも、OpenAIが65%でトップシェアを占め、Anthropicが11%でOpenAIを追走する状況が伝えられている。o1やo1-miniモデル、また最新のo3-miniなどの推論モデルがコーディングで際立つ能力を示しており、これが人気理由の1つになっている。Anthropicは、主力モデルのClaude 3.5 Sonnetが長文処理能力とコーディングタスクで高いパフォーマンスを発揮、AWS経由で利用できる利便性も相まってシェアを伸ばしている。
しかし、Menlo Venturesの調査では異なる様相も見られる。OpenAIのシェアは2023年の50%から2024年には34%に低下する一方、Anthropicは12%から24%へと倍増を記録。この変化は、Claude 3.5 Sonnetが最先端モデルとなった際、一部の企業がGPT-4からの切り替えを行ったことが要因とされる。注目すべきは、企業の多くが複数のプロバイダを併用している点だ。同調査によると、組織は通常3つ以上の基盤モデルをAIスタックに導入。ユースケースや結果に応じて異なるモデルを使い分けているという。全体として、クローズドソースモデルが81%、メタのLlama 3などのオープンソースモデルが19%という構成比となっている。
AIの「評価」と「監視」に苦心する開発現場
Vellumの調査では、企業のAI導入において依然として多くの課題が山積している状況も明らかになった。
最大の課題は「AIの幻覚とプロンプトの管理」で、57.4%の開発者が指摘。次いで「インパクトの大きいユースケースの優先順位付け」(42.5%)、「技術的な専門知識の不足」(38%)、「モデルの速度とパフォーマンス」(33.4%)、「データのアクセスとセキュリティ」(32.5%)が続く。
この課題に対し、開発現場ではどのような対策が講じられているのか。評価(エバリュエーション)の実施状況を見ると、57.4%が「すでに実施している」と回答。30.9%が「実施を計画中」としており、評価の重要性が広く認識されつつあることが判明した。一方で、11.7%は「実施の予定なし」と答えている。
評価方法の内訳を見ると、最も多いのが「手動テストとレビュー」で75.6%。これに「ユーザーフィードバックセッション」(47.9%)、「自動評価ツール」(38%)、「A/Bテスト」(27%)、「オープンソース評価フレームワーク」(21.8%)が続く。自動化ツールの採用は現時点で限定的だが、2025年にかけて普及が進む見込みだ。
本番環境でのモニタリングも重要な課題となっている。52.7%が「モニタリングを実施している」と回答する一方、15.2%は「実施していない」、30.9%は「まだ本番環境にない」と答えている。モニタリングの方法としては、「社内モニタリングソリューション」が55.3%と最多。これに「サードパーティのモニタリングツール」(19.4%)、「クラウドプロバイダーサービス」(13.6%)、「オープンソースモニタリングツール」(9%)が続く。
興味深いのは、AI開発に関与する部門の多様性だ。技術部門(82.3%)が中心となりつつも、経営層(60.8%)、専門家(57.5%)、プロダクト部門(55.4%)、デザイン部門(38.2%)など、幅広い部門が参画。プロンプトがコードではなく自然言語で記述可能なことや、各分野の専門家の知見が不可欠であることが背景にある。
技術面では、ファインチューニングの活用が低い一方で、RAG(検索拡張生成)が注目を集めている状況も明らかになっている。ファインチューニングを活用しているとの回答は32.5%にとどまる一方、ベクトルデータベース(RAGに必要不可欠)の活用は59.7%に上った。
Menlo Venturesの調査も同様の状況を示している。アーキテクチャ面では、RAGの採用が前年の31%から51%へと大幅に増加。一方、注目を集めていたファインチューニングの本番環境での採用率は、前年の19%から9%へと低下した。新たな潮流として、エージェントアーキテクチャが台頭し、すでに実装の12%を占めるまでに成長している点も注目に値する。
Vellumの調査では、2025年の計画として、回答者の58.8%がカスタマー向けのユースケースを構築すると回答。55%がAIエージェントを活用したより複雑なシステムを構築すると回答しており、今年はAIアプリケーションとエージェントシステムの普及がさらに進むことが予想される。
文:細谷元(Livit)