Arcee AIは本日、企業向けに展開可能な、高度な指示遵守能力と完全なカスタマイズオプションを備えた700億パラメーターの言語モデル「SuperNova」を発表しました。このモデルは、OpenAIやAnthropicなどのAPIサービス(例:OpenAI、Anthropic)を基盤とするサービスにおける重要な問題に対処するために、企業データのプライバシー、モデルの安定性、カスタマイズにおいて強力で所有可能な代替手段を提供することを目指しています。

image.png

クラウドAPIがAI分野をリードする中で、Arcee AIはSuperNovaによって異なるアプローチを取っています。この大規模言語モデル(LLM)は、企業自身のインフラストラクチャ内で展開およびカスタマイズできます。本日リリースされたSuperNovaは、MetaのLlama-3.1-70B-Instructアーキテクチャをベースとし、Arceeが主張する優れた指示遵守能力と、特定のビジネスニーズに適応した斬新な事後トレーニングプロセスを採用しています。

技術革新

SuperNovaの開発には、多面的な事後トレーニング方法が関与しています。

プロジェクトの主任エンジニアであるLucas Atkins氏は、その秘密を明かしました。「私たちは3つのモデルを訓練しました。1つはLlama405Bから蒸留されたエッセンス、1つは当社のEvolKitで生成されたデータセットで学習させたもの、そしてもう1つはLlama3instructで高度なDPOを施したものです。最後に、これらを新しい魔法で融合させ、各モデルの超能力を維持しました。」

Arceeは、これがSuperNovaの指示遵守能力、特に405Bパラメーターモデルからの蒸留によって実現されたと主張しています。これは、中規模のハードウェアで展開しながら、より大規模なモデルのエッセンスを捉えることができることを示しています。

企業展開とカスタマイズ

SuperNovaは、企業自身のクラウド環境への展開を目的としており、まずAWS Marketplaceで利用可能になります。Arceeは、GoogleとAzureのマーケットプレイスでも利用可能にするべく取り組んでいます。

Arcee AIの共同設立者であるMark McQuade氏は、この展開方法の利点を強調しました。「モデルはあなたのAWS VPCに展開されますが、ネットワークサーバー、チャットインターフェース、そしてあなたのチャット履歴を保存するためのデータベースも起動します。組織の誰もがこれと密接にやり取りできます。」

この展開方法により、企業のデータプライバシーとモデルの安定性に関する懸念が解消されます。通知なしに変更される可能性のあるAPIベースのサービスとは異なり、SuperNovaは企業に完全な制御権を与えます。McQuade氏は、AI業界の最近の混乱を踏まえ、これが特に重要であると指摘しました。「OpenAIは3.5を放棄しました…多くの企業が3.5のAPIを基盤にビジネスを構築していました。そのため、APIが変わると、アプリケーションが停止してしまいます。しかし、私たちのシステムでは、あなたが変更したいと思わない限り、何も変わりません。なぜなら、これはあなたのモデルであり、あなたのやり方で実行するからです。」

カスタマイズと継続的な改善

SuperNovaの大きな魅力の1つは、企業環境で微調整および再トレーニングできることです。

Atkins氏は、このプロセスとその利点を説明しました。「時間の経過とともに、あなたの環境でモデルを完全に再トレーニングし、あなたの好みにより良く適合させることができます。これらのチャットを保存することで、企業としての独自の好みに基づいてモデルを全面的に改善したい場合、データをシステムから送出することなく、それを行うことができます。」

この機能により、技術チームは、特定の分野の知識や企業固有の要件にモデルを適合させることができます。これは、通常はこの程度のカスタマイズを許可しないクラウドベースのAPIサービスと比較して、間違いなく大きな利点です。

オープンソースコンポーネント

完全な70Bモデルはオープンソースではありませんが、Arceeは開発者コミュニティにいくつかのコンポーネントをリリースしています。

テストと評価のための無料API:これは、開発者が完全な展開を約束することなくSuperNovaを試すことができます。

SuperNova-Lite:8Bパラメーターのオープンソース版モデル。この小型モデルは、リソースの限られた環境で作業する開発者、または完全なモデルを展開する前にアーキテクチャを理解したい開発者にとって役立ちます。

EvolKit:複雑なQAペアを作成するためのデータセット生成パイプライン。これは、特定のユースケースに合わせてカスタムトレーニングデータを作成したい組織にとって価値のあるツールです。

これらのコンポーネントをオープンソース化することで、Arceeはより広範なAIコミュニティに貢献すると同時に、潜在的な顧客に製品を評価およびカスタマイズするためのツールを提供しています。Arcee SuperNovaはAWS Marketplaceでも利用可能です。

パフォーマンスに関する声明とベンチマークテスト

Arceeは、SuperNovaがさまざまな分野で優れたパフォーマンスを発揮すると主張しており、特に数学的推論において優れています。「Atkins氏は、「これは数学のベンチマークテストで非常に優れています」と述べています。しかし、同社は、彼らの主張を検証するために第三者による評価を推奨しています。

「私たちは、人々が使用できるAPIを提供します。信頼できるベンチマークテストを実行して独自に評価したい第三者がいる場合は、ウェイトへのアクセス権を提供するよう手配できます。私たちは、このモデルに対して完全な透明性を持ちたいと考えています。」とAtkins氏は述べています。

第三者による評価へのこの開放性は称賛に値します。なぜなら、Arceeの主張を独立して検証できるからです。SuperNovaが標準的なベンチマークテストで、OpenAI、Anthropicなどの主要なAI企業のモデルと比較してどのように機能するのかを見ることは特に興味深いでしょう。

image.png

image.png

企業AI戦略への影響

SuperNovaのリリースは、多くの企業がAI戦略を見直している時期に発表されました。クラウドベースのAPIサービスがこれまでこの分野をリードしてきましたが、展開可能でカスタマイズ可能なモデルへの関心が高まっており、これらのモデルはより多くの制御と柔軟性を提供します。

SuperNovaのアプローチは、いくつかの重要な問題を解決します。

  • データプライバシー:企業自身のインフラストラクチャ内に展開することで、SuperNovaは機密データが組織の管理から外に出るのを防ぎます。
  • モデルの安定性:通知なしに変更または廃止される可能性のあるAPIサービスとは異なり、SuperNovaは安定した基盤を提供し、組織が更新を選択した場合にのみ変更されます。
  • カスタマイズ:企業固有のデータでモデルを微調整および再トレーニングする機能により、ほとんどのAPIサービスでは実現できない高度なカスタマイズが可能です。
  • コスト管理:初期展開には多くのリソースが必要になる可能性がありますが、SuperNovaを実行する長期的なコストは、大規模なAPI呼び出しの支払いを下回る可能性があります。
  • 競争優位性:カスタマイズされ、継続的に改善されるAIモデルは、AI主導の洞察が重要な業界で顕著な競争優位性を提供できます。

AI主権のジレンマ

企業が急速に発展するAI分野をナビゲートする中で、SuperNovaのリリースは、業界における増大する緊張関係を浮き彫りにしています。それは、クラウドベースのAIサービスの利便性と能力、そして展開可能なモデルが提供する制御とカスタマイズとの間のトレードオフです。この二分法は、私たちが「AI主権のジレンマ」と呼ぶ可能性のある問題を提起します。

一方、GPT-4やClaudeなどのクラウドベースのAPIサービスは、最先端のパフォーマンスと継続的な更新を提供しますが、データプライバシーの問題とカスタマイズの制限を犠牲にします。他方、SuperNovaのようなモデルは完全な制御とカスタマイズを約束しますが、展開と保守には内部の専門知識が必要です。

ArceeはSuperNovaによってこのギャップを埋めることを試みており、ローカルに展開できるモデルを提供しながら、主要なクラウドベースのサービスに匹敵する能力を目指しています。このハイブリッドアプローチは、厳しい規制要件のある業界や、高度に機密性の高いデータを扱う業界にとって特に魅力的です。

公式ブログ:https://blog.arcee.ai/meet-arcee-supernova-our-flagship-70b-model-alternative-to-openai/