AIモデルのワンクリック実装が可能に SambaNovaとHugging FaceによるAI導入簡素化の取り組み最前線

INDEX

SambaNovaとHugging Faceの取り組み

大規模言語モデル（LLM）の多様化に伴い、クローズドソース、オープンソースを含め選択肢は大幅に増えている。しかし、とりわけオープンソースの実装には時間とコストがかかっているのが現状で、多くの企業では実装が簡単なクローズドソースモデルを選択する傾向にある。

シリコンバレーのVC、Menlo Venturesが米国企業を対象に実施した調査はこの状況を如実に示している。

以下は、2023年と2024年におけるAIモデルの市場シェアの変化を示したもの。クローズドソースモデルを展開するOpenAIがシェアを下げつつもトップを維持。また、Anthropicはシェア12％から24％に拡大、グーグルも7％から12％にシェアを広げた。これに対し、オープンソースを展開するメタは前年から変化しておらず、また同じく主にオープンソースモデルの開発を進めるフランスのMistralは6％から5％にシェアを下げている。クローズドソースモデルが優位となっているのは明白だろう。

大規模言語モデル／企業の市場シェアの変化（Menlo Venturesより）
https://menlovc.com/2024-the-state-of-generative-ai-in-the-enterprise/

こうした中、SambaNova SystemsとHugging FaceがワンクリックでオープンソースモデルベースのチャットAIを実装できる仕組みをリリースし注目を集めている。

従来、AIチャットボットの実装には、APIやドキュメントの理解、デプロイメントプロトコルなど、広範な技術知識が必要とされてきた。多くの企業にとって、この技術的な障壁がAI導入を足踏みする要因となっている。しかし、この新しいシステムでは、わずか3行のPythonコードと「Deploy to Hugging Face」ボタンのクリックだけで、本格的なAIチャットボットを数分で構築できるようになる。

テキストだけでなく、画像も処理できる高性能なマルチモーダルモデルも選択可能となっており、ユースケースの可能性は大きく広がる。たとえば、Llama 3.2-11B-Vision-Instructモデルなどが選択可能で、SambaNovaの強みである高速処理も実現している。また、自社展開する場合、GPUなど強力なハードウェアを要する4,050億パラメータモデル、Llama 3.2 405Bをハードウェアの心配なしに高速展開できるのも魅力の1つだ。

実際の使い方：Gradioの場合

SambaNovaとHugging Faceによる新しい統合サービスは、AI導入プロセスを大幅に短縮しており、非開発者でも扱えるほど簡易なものだ。以下でその使い方を解説したい。

まずSambaNova Cloud APIのウェブサイトでAPIトークンを取得する。以下ページの「Generate New API Key」ボタンをクリックするとAPIトークンが生成される。

SambaNova CloudのAPI取得ページ
https://cloud.sambanova.ai/apis

その後、右側に表示されているコードを実行することで、チャットインターフェースを立ち上げられるというシンプルさだ。

コードの種類は「Curl」「Python」「Gradio」の3種類が用意されている。最も簡易なのは、Gradioだろう。コード欄の横に表示されているオレンジ色の「Deploy into HuggingFace」ボタンをクリックし、HuggingFaceの設定ページで必要な情報を入力するだけでデプロイが完了する。

※Gradioとは、数行のPythonコードでAIモデルをウェブアプリケーション化できるオープンソースライブラリ。2021年にHuggingFaceに買収されて以来、同プラットフォームへの統合が進められてきた。機械学習エンジニアが特別なウェブ開発の知識を持たなくても、AIモデルのウェブアプリケーション化を可能にするのがGradioの強みとなる。