GroqがオープンソースのLlama AIモデルでランキング1位を獲得、関数呼び出しではGPT-4oやClaudeを上回る

AIbase基地

公開日AIニュース · 1 分で読めます · Jul 19, 2024

229

AIハードウェアスタートアップのGroqは、大手テクノロジー企業を凌駕するツール使用能力を持つ2つのオープンソース言語モデルを発表しました。

新しいLlama-3-Groq-70B-Tool-Useモデルは、バークレー関数呼び出しランキング（BFCL）で1位を獲得し、OpenAI、Google、Anthropicなどの企業の独自製品を上回りました。

Groqのプロジェクト責任者であるRick Lamers氏は、X.comの記事でこの成果を発表しました。「Llama3Groq Tool Use 8Bと70Bモデルを発表できることを誇りに思います。これはLlama3のオープンソースツール使用向けに完全にファインチューニングされたバージョンで、BFCLで1位を獲得し、Claude Sonnet 3.5、GPT-4 Turbo、GPT-4o、Gemini 1.5 Proなどの独自モデルを含むすべてのモデルを上回りました。」と述べています。

合成データと倫理的なAI：モデルトレーニングにおける新たなパラダイム

パラメータ数が多い70BバージョンのBFCLにおける全体的な精度は90.76％に達し、8Bモデルは89.06％で全体で3位となりました。これらの結果は、オープンソースモデルが特定のタスクにおいて、クローズドソースの代替品と同等、あるいはそれ以上の性能を発揮できることを示しています。

Groqは、AI研究会社Glaiveと協力してこれらのモデルを開発し、MetaのLlama-3ベースモデルに対する完全なファインチューニングと直接的選好最適化（DPO）を使用しました。チームは、倫理的に生成された合成データのみを使用してトレーニングを行ったことを強調し、データプライバシーと過学習に関する一般的な懸念事項に対処しました。

これらのモデルは現在、Groq APIとHugging Faceプラットフォームを通じて提供されています。このアクセシビリティにより、複雑なツール使用と関数呼び出しを必要とする分野（自動コーディング、データ分析、インタラクティブなAIアシスタントなど）におけるイノベーションが加速される可能性があります。

Groqはまた、Hugging Face Spaces上に公開デモを公開し、ユーザーがモデルと対話し、ツール使用能力を直接テストできるようにしました。2021年12月にHugging Faceが買収したGradioと同様に、多くのHugging Face Spaces上のデモはこうして作成されています。AIコミュニティはこれに好意的に反応し、多くの研究者や開発者がこれらのモデルの可能性を探求することに熱心です。

要点：
⭐ Groqが公開したオープンソースAIモデルは、特定のタスクにおいて大手テクノロジー企業の独自モデルを上回った
⭐ 合成データを使用したトレーニングにより、GroqはAIモデル開発における一般的なデータプライバシーと過学習の問題に挑戦した
⭐ オープンソースモデルの公開は、AI分野の発展の軌跡を変える可能性があり、より広範なAIへのアクセスとイノベーションエコシステムの育成を促進する

AIニュース

この記事はAIbaseデイリーからのものです

【AIデイリー】へようこそ！ここは、毎日人工知能の世界を探求するためのガイドです。毎日、開発者に焦点を当て、技術トレンドを洞察し、革新的なAI製品アプリケーションを理解するのに役立つ、AI分野のホットなコンテンツをお届けします。

—— AIbase デイリーグループによって作成

AIニュース: ChatGPT、無料でメモリ機能が利用可能に；華為WATCH 5スマートウォッチがデュアル大規模モデルに接続；Claude Pro、注目の新機能がアップデート

Jun 4, 2025

研究：AIによるニュース入手が増加

現代のメディア環境において、人工知能（AI）はニュースの入手方法を密かに変えつつあります。従来、ニュースを読むことは一方通行の体験で、読者は情報を受け取るだけで議論に参加することはありませんでした。しかし、チャットボットの台頭により、ニュース消費は双方向的なインタラクションへと進化し、読者の役割は受動的な受信者から能動的な参加者へと変化しています。ますます多くの読者が、AIツールやチャットボットを利用してニュースを精査、要約、解釈し、時には伝統的なメディアを完全に迂回するようになっています。このような「対話型ニュース」は、読者が記事を閲覧する際に…

Apr 18, 2025

100

AIニュース、国民の反発に直面：半数以上のアメリカ人がAIによる報道記事を拒否

Apr 14, 2025

GrokがDeeperSearch機能をリリース、リアルタイムAIニュース検索能力を向上

Mar 19, 2025

310

アップルのAIニュース要約機能が虚偽情報拡散で物議を醸す

アップル社が最近発表したAIニュース要約機能が、速報ニュースの要約において重大な誤りを繰り返し、ユーザーに大量の虚偽情報が伝わる事態を引き起こしている。この機能の発表以来、多くの報道機関やユーザーから、アップルの技術が未成熟であり、正確な情報を効果的に提供できないとして強い反発を受けている。ワシントンポスト紙のテクノロジーコラムニスト、ジェフリー・ファウラー氏がソーシャルメディアで、アップルのAIがニュース要約において事実を歪めたと投稿したと報じられている。

Jan 16, 2025

1.0k

元Twitter幹部が開発したAIニュースアシスタントParticle：AIでニュース閲覧体験を刷新、1530万ドルの資金調達

現在のメディア業界がAIに対して慎重な姿勢をとる中、ParticleというAIニュース閲覧アプリがその状況を変えようとしています。元Twitterのエンジニアが開発したこのアプリは、ユーザーがニュースをより深く理解するのを支援するとともに、従来のメディア機関とのウィンウィン関係を模索しています。Particleは、元Twitterプロダクトマネジメント上級ディレクターのSara Beykpour氏と、元Twitterおよびテスラの上級エンジニアであるMarcel Molina氏によって共同設立されました。同社は、

Nov 13, 2024

3.2k

ElevenLabsリーダーアプリがAndroidで登場、32言語対応を追加

ElevenLabsが開発したモバイルリーダーアプリがAndroidプラットフォームに登場。テキスト読み上げ、PDF/ePubファイルの閲覧、高品質なAI音声合成技術を一体化し、場所を選ばずに文章を音声で楽しめる画期的なアプリです。テキストの読みやすさに関わらず、快適な読書体験を提供します。アメリカ、イギリス、カナダの3ヶ国語と、今後32言語への対応を予定しており、グローバル展開を間近に控えています。Judy GarlandやJames Deanなど、伝説的著名人の声を模倣するAI技術も搭載し、パーソナライズされた読書体験を提供します。

Jul 23, 2024

2.6k

日本のスーパー、AIで従業員の笑顔を監視　ネット上で「大げさだ」と批判の声

日本のイオン系のスーパーマーケットが、AIシステム「Smile-Kun」を使って従業員の笑顔を監視していることが明らかになった。従業員の笑顔や声の分析を通じて接客スキル向上を目指しているという。システムは特定のあいさつ方法を要求し、450個の微表情のポイントで100点満点で採点、リアルタイムでフィードバックする。さらに、音量や滑らかさ、トーンについても分析し、改善点を提案する。従業員の反応では笑顔の割合が大幅に増加したという。しかし、この取り組みは物議を醸しており、一部のネットユーザーからは従業員の個性や感情を過度に数値化しており、真心のこもったサービスとは程遠いとの批判が出ている。批判意見では、上下関係や

Jul 23, 2024

1.6k

マイクロソフト研究所、AIフレームワークE5-Vを発表：テキストペアの単一モーダル学習でマルチモーダル学習を簡素化、コスト削減

マイクロソフト研究所と北京航空航天大学の研究チームは、マルチモーダル大規模言語モデル（MLM）開発における課題解決を目指し、高効率なマルチモーダル埋め込みフレームワークE5-Vを発表しました。この革新的なフレームワークは、単一モーダル学習によってマルチモーダル学習プロセスを簡素化し、従来のモデルに見られた独立したエンコーダーへの依存と、それに伴う入力統合の非効率性を克服します。E5-Vはテキストと画像情報を統合することでトレーニングコストを削減し、テキスト-画像検索、画像検索など、複数の複雑なタスクにおいて優れた性能を示しました。特にゼロショット学習において…

Jul 23, 2024

2.1k

LensGo AI、FaceSync機能を発表　あなたの声と口元をターゲット画像に移行

LensGo AIがFaceSync機能を発表。ユーザーのパフォーマンスを画像やビデオにシンクロさせ、シームレスな視聴体験を提供します。ユーザーは自由な表現が可能になり、容姿に制限されません。AI技術を活用し、表情、音声、口元の正確なキャプチャとマッピングを実現。現在テスト段階にあり、技術の安定性と表現力の向上を目指して最適化を進めています。ユーザーの期待とプロフェッショナルな基準を満たし、無限の創造性を解き放つことを目指しています。

Jul 23, 2024

3.1k

AIニュース

AIデイリー

AIタイムライン

Alハードウェアです

最新事例

画像コレクション

ビデオコレクション

オーディオコレクション

コンテンツコレクション

最新チュートリアル

AIプロダクトランキング

AIトラフィック成長ランキング

AIトラフィック減少ランキング

AI週間ランキング

アメリカ合衆国

中国

インド

ブラジル

画像生成

パーソナルアシスタント

キャラクター生成

ビデオ生成

AIプロジェクトランキング

AIプロジェクト成長ランキング

AI開発者ランキング

AI組織ランキング

Deepseek

TTS

LLM

ChatGPT

概要

GroqがオープンソースのLlama AIモデルでランキング1位を獲得、関数呼び出しではGPT-4oやClaudeを上回る

AIbase基地

この記事はAIbaseデイリーからのものです

関連AIニュースの推奨

AIニュース: ChatGPT、無料でメモリ機能が利用可能に；華為WATCH 5スマートウォッチがデュアル大規模モデルに接続；Claude Pro、注目の新機能がアップデート

研究：AIによるニュース入手が増加

AIニュース、国民の反発に直面：半数以上のアメリカ人がAIによる報道記事を拒否

GrokがDeeperSearch機能をリリース、リアルタイムAIニュース検索能力を向上

アップルのAIニュース要約機能が虚偽情報拡散で物議を醸す

元Twitter幹部が開発したAIニュースアシスタントParticle：AIでニュース閲覧体験を刷新、1530万ドルの資金調達

ElevenLabsリーダーアプリがAndroidで登場、32言語対応を追加

日本のスーパー、AIで従業員の笑顔を監視 ネット上で「大げさだ」と批判の声

マイクロソフト研究所、AIフレームワークE5-Vを発表：テキストペアの単一モーダル学習でマルチモーダル学習を簡素化、コスト削減

LensGo AI、FaceSync機能を発表 あなたの声と口元をターゲット画像に移行

日本のスーパー、AIで従業員の笑顔を監視　ネット上で「大げさだ」と批判の声

LensGo AI、FaceSync機能を発表　あなたの声と口元をターゲット画像に移行