AIハードウェアスタートアップのGroqは、大手テクノロジー企業を凌駕するツール使用能力を持つ2つのオープンソース言語モデルを発表しました。

新しいLlama-3-Groq-70B-Tool-Useモデルは、バークレー関数呼び出しランキング(BFCL)で1位を獲得し、OpenAI、Google、Anthropicなどの企業の独自製品を上回りました。

Groqのプロジェクト責任者であるRick Lamers氏は、X.comの記事でこの成果を発表しました。「Llama3Groq Tool Use 8Bと70Bモデルを発表できることを誇りに思います。これはLlama3のオープンソースツール使用向けに完全にファインチューニングされたバージョンで、BFCLで1位を獲得し、Claude Sonnet 3.5、GPT-4 Turbo、GPT-4o、Gemini 1.5 Proなどの独自モデルを含むすべてのモデルを上回りました。」と述べています。

image.png

合成データと倫理的なAI:モデルトレーニングにおける新たなパラダイム

パラメータ数が多い70BバージョンのBFCLにおける全体的な精度は90.76%に達し、8Bモデルは89.06%で全体で3位となりました。これらの結果は、オープンソースモデルが特定のタスクにおいて、クローズドソースの代替品と同等、あるいはそれ以上の性能を発揮できることを示しています。

Groqは、AI研究会社Glaiveと協力してこれらのモデルを開発し、MetaのLlama-3ベースモデルに対する完全なファインチューニングと直接的選好最適化(DPO)を使用しました。チームは、倫理的に生成された合成データのみを使用してトレーニングを行ったことを強調し、データプライバシーと過学習に関する一般的な懸念事項に対処しました。

これらのモデルは現在、Groq APIとHugging Faceプラットフォームを通じて提供されています。このアクセシビリティにより、複雑なツール使用と関数呼び出しを必要とする分野(自動コーディング、データ分析、インタラクティブなAIアシスタントなど)におけるイノベーションが加速される可能性があります。

Groqはまた、Hugging Face Spaces上に公開デモを公開し、ユーザーがモデルと対話し、ツール使用能力を直接テストできるようにしました。2021年12月にHugging Faceが買収したGradioと同様に、多くのHugging Face Spaces上のデモはこうして作成されています。AIコミュニティはこれに好意的に反応し、多くの研究者や開発者がこれらのモデルの可能性を探求することに熱心です。

要点:

⭐ Groqが公開したオープンソースAIモデルは、特定のタスクにおいて大手テクノロジー企業の独自モデルを上回った

⭐ 合成データを使用したトレーニングにより、GroqはAIモデル開発における一般的なデータプライバシーと過学習の問題に挑戦した

⭐ オープンソースモデルの公開は、AI分野の発展の軌跡を変える可能性があり、より広範なAIへのアクセスとイノベーションエコシステムの育成を促進する