データクラウドプロバイダーのSnowflakeは、企業のデータ活用を支援するAI製品のポートフォリオ拡大の一環として、オープンソースの大規模言語モデル「Arctic LLM」をリリースしました。主なユースケースとしては、レビューの感情分析などのデータ分析、カスタマーサービスや営業向けチャットボット、収益情報の抽出といったビジネスインテリジェンスクエリなどが挙げられます。
SnowflakeのArcticは、Meta、Mistral AI、Google、RekaなどのLLMモデルとともに、Cortex製品で提供されています。Cortexは一部の地域でのみ利用可能です。Snowflakeによると、Cortexは6月にAWSアジア太平洋(東京)リージョンを通じて日本を含むアジア太平洋地域で利用可能になります。このサービスは、世界中のお客様とアジア太平洋地域の他の地域にも順次展開される予定です。
同社によれば、Arctic はハイパースケーラーの Amazon Web Services 経由でも利用可能になるほか、Hugging Face、Lamini、Microsoft Azure、NVIDIA API カタログ、Perplexity、Together AI など、企業が使用する他のモデル ガーデンやカタログ経由でも利用可能になるという。
Snowflake Arctic とは何ですか?
Arcticは、Snowflakeが2024年4月にリリースした、主にエンタープライズユースケース向けに設計された最先端LLMです。同社は、SQLコード生成や命令追跡など、いくつかのベンチマークにおいて、Arcticが他のLLMと比較して優れたスコアを獲得したことを示すデータを発表しました。
SnowflakeのAI責任者であるバリス・グルテキン氏によると、LLMの構築には200万ドルの予算で3ヶ月かかりました。これは他のモデルの8分の1の時間です。この成果は、エンタープライズグレードのLLMをいかに迅速かつ低コストで開発できるかという限界を押し広げるものです。
Snowflake Arctic の主な差別化要因は何ですか?
Arctic LLMは「効率的なインテリジェンス」の提供を目指しており、一般的なエンタープライズタスクに優れた性能を発揮する一方で、エンタープライズデータを用いたカスタムAIモデルのトレーニングにおいてはより低コストで利用できます。また、オープンソースのApache 2.0ライセンスでリリースされており、オープンソースの限界に挑戦しています。
Meta の Llama モデルを含む他の多くのオープンソース LLM が提供する汎用的な世界理解を採用するのではなく、Arctic AI モデルは、「会話型 SQL データ コパイロット、コード パイロット、RAG チャットボット」に対する企業の需要に特に応えることを目指しています。
参照: 連合データレイクとエンタープライズデータの混乱に関する Zetaris の見解
「エンタープライズインテリジェンス」の能力
Snowflake は、コーディング、SQL 生成、命令実行機能を組み合わせた LLM のパフォーマンスを測定するための独自の「エンタープライズ インテリジェンス」メトリックを作成しました。
Arcticは、一般的なAIモデルベンチマークテストにおいて、Databricks、Meta、Mistralのモデルと比較して優れた結果を示しました。これらのテストは、特定の能力領域におけるLLMモデルのパーセンテージスコアを競い合います。Snowflakeによると、Arcticのモデルは、より予算の多いLLMと比較して、エンタープライズインテリジェンスにおいて優れた能力を発揮しました。

トレーニングと推論の効率
ガルテキン氏によると、Arctic AI LLMは、企業顧客が自社データを用いてより費用対効果の高い方法でカスタムLLMを学習できる手段を提供するという。このモデルは効率的な推論にも最適化されており、企業での導入コストを削減し、より実用的にすることができる。
Apache 2.0 によるオープンソース
SnowflakeがArctic LLMをApache 2.0ライセンスでオープンソース化した理由は、Gultekin氏によると、AIチームのオープンソースに関する深い知識のおかげだという。同社は重みやコードに加え、データレシピや研究成果へのアクセスも提供している。
スノーフレークは、真のオープンソース開発者の貢献によって業界と製品自体がより速く前進できると確信しており、一方、ガルテキン氏は、内部を見ることができるようになることで、企業顧客がこのモデルをより信頼するようになるだろうと述べた。
Snowflake Arctic は AI 市場にどのような影響を与えるでしょうか?
SnowflakeのArcticリリースは、そのスピードと効率性、そしてSQL生成機能により、エンタープライズデータおよびテクノロジーコミュニティに大きな衝撃を与えました。Gultekin氏は、同社の「オープンソースの限界に挑戦する」という決断が、研究コミュニティの興奮を生み出したと述べています。
参照: SnowflakeとAzure Synapse Analyticsの比較
「これは私たちの最初のリリースであり、非常に優れたベンチマークを設定するものです。市場は進化を続け、単一の勝者が存在するような状況にはならないでしょう。むしろ、すべての顧客が市場における選択肢に強い関心を持つようになります。すでに膨大な利用実績があり、今後もこの傾向が続くと期待しています」と彼は述べた。
Snowflake には AI のバックグラウンドがありますか?
スノーフレークは以前、一連の機械学習ソリューションを提供していました。2023年の生成AIブームの一環として、同社はデータ検索企業のNeevaや、ガルテキン氏がCEO兼共同創業者を務めたNXYZなど、複数のAI企業を買収しました。それ以来、スノーフレークは中核となる生成AIプラットフォームとAI検索機能を構築し、現在はLLMモデルを追加しています。