Meta、Llama 3.1 405Bというオープンソースの大規模言語モデルを発表、GPT-4に匹敵する性能

AIbase基地

公開日AIニュース · 1 分で読めます · Jul 24, 2024

235

昨日、Meta社は最新の大規模言語モデルLlama 3.1 405Bのオープンソース化を発表しました。この重大発表は、1年間の綿密な準備、プロジェクトの計画から最終的な審査に至るまで、Llama 3シリーズのモデルがついに一般公開されたことを意味します。

Llama 3.1 405Bは、1280億個のパラメータを持つ多言語ツール使用モデルです。このモデルは、8Kコンテキスト長の事前学習の後、さらに128Kコンテキスト長で継続学習されました。Meta社によると、このモデルは、多くのタスクにおいて業界をリードするGPT-4に匹敵する性能を示します。

以前のLlamaモデルと比較して、Meta社はいくつかの点で改良を行いました。

事前学習データの前処理と策定プロセスの改善
学習後データの品質保証と選別方法の向上

405Bモデルの事前学習は、15.6兆個のトークンと3.8×10^25回の浮動小数点演算を伴う、非常に困難な課題でした。そのため、Meta社はトレーニングアーキテクチャ全体を最適化し、16,000個以上のH100 GPUを使用しました。

405Bモデルの大規模な本番推論をサポートするために、Meta社はこれを16ビット（BF16）から8ビット（FP8）に量子化し、計算需要を大幅に削減しました。これにより、単一のサーバーノードでもこのモデルを実行できるようになりました。

さらに、Meta社は405Bモデルを使用して、70Bおよび8Bモデルの学習後の品質を向上させました。学習後段階では、チームは多段階のアラインメントプロセスを通じて、教師あり微調整（SFT）、拒否サンプリング、直接選好最適化などによりチャットモデルを改良しました。注目すべきは、SFTサンプルの大部分は合成データを使用して生成されたことです。

Llama 3は、画像、ビデオ、音声機能も統合しており、組み合わせ手法によりモデルは画像とビデオを認識し、音声インタラクションをサポートします。ただし、これらの機能はまだ開発中で、正式にリリースされていません。

Meta社はまた、開発者がLlamaモデルの出力を利用して他のモデルを改良することを許可するライセンス契約を更新しました。

Meta社の研究者たちは次のように述べています。「AIの最前線で業界トップの人材と協力し、研究成果を公開して透明性を保つことは、非常に刺激的なことです。私たちは、オープンソースモデルによるイノベーションと、将来のLlamaシリーズモデルの可能性に期待しています！」

このオープンソース化は、AI分野に新たな機会と課題をもたらし、大規模言語モデル技術のさらなる発展を促進するでしょう。

Llama3.1

この記事はAIbaseデイリーからのものです

【AIデイリー】へようこそ！ここは、毎日人工知能の世界を探求するためのガイドです。毎日、開発者に焦点を当て、技術トレンドを洞察し、革新的なAI製品アプリケーションを理解するのに役立つ、AI分野のホットなコンテンツをお届けします。

—— AIbase デイリーグループによって作成

NVIDIAがLlama Nemotron Nano VL AIを発表：OCRBenchで高精度ドキュメント処理ソリューションとして首位獲得

NVIDIAは2025年6月3日にLlama Nemotron Nano VLを正式に発表しました。これは複雑なドキュメント、チャート、フレームの処理に特化した高効率なコンパクトな視覚言語モデル（VLM）です。OCRBench v2ベンチマークテストでトップに立っており、その卓越した性能を示しています。効率的な推論性能と柔軟な展開方法により、企業はクラウド環境から

Jun 5, 2025

NVIDIA、Llama 3.1 Nemotron Ultra 253Bを発表 - Llama 4 Behemothを凌駕する性能

Apr 9, 2025

280

NVIDIA、Llama 3.1 Nemotron Ultra 253Bを発表：AI性能の王者、業界の新たなベンチマークを定義

先日、世界的なチップおよびAI技術大手NVIDIA（エヌビディア）が、新たなオープンソースの大規模言語モデルであるLlama 3.1 Nemotron Ultra 253Bを発表し、人工知能分野で大きな反響を呼びました。このモデルはMetaのLlama-3.1-405Bをベースに、革新的な技術で最適化されており、Llama 4 BehemothやMaverickなどの強力な競合製品を性能面で凌駕するだけでなく、効率的なリソース利用率と卓越したマルチタスク能力により、A…

Apr 9, 2025

200

NVIDIA、Llama 3.1 Nemotron Ultra 253Bを発表：比類なき性能を誇る技術の新たな基準

2025年4月8日、NVIDIAはLlama-3.1-405Bを最適化して開発された、253億パラメーターのオープンソースモデルであるLlama 3.1 Nemotron Ultra 253Bを発表しました。MetaのLlama 4 BehemothやMaverickを上回り、AI分野の注目を集めています。このモデルは、GPQA-Diamond、AIME2024/25、LiveCodeBenchなどのテストで卓越した性能を示し、推論スループットはDeepSeekに匹敵します。

Apr 9, 2025

270

オープンソースAIの新たな高みへ：DeepSeek V3がLlama3.1を凌駕、14.8兆トークンの訓練データ

中国の人工知能企業DeepSeekは先日、画期的なオープンソース大規模言語モデルDeepSeek V3を発表しました。6710億パラメーターを持つこのモデルは、MetaのLlama3.1を規模で上回り、複数のベンチマークテストにおいて、GPT-4を含む主要なクローズドソースモデルを上回る性能を示しました。DeepSeek V3は、その強力な性能と効率的な開発プロセスが大きな特徴です。このモデルは、プログラミングプラットフォームCodeforcesのコンテストで優れた成績を収め、テストにおいて…

Dec 27, 2024

3.0k

Gemma2超え！IBMがGranite3.1モデルを発表：128Kコンテキスト長に対応

IBMは、エンタープライズAI分野におけるリーダーシップを目指して、次世代オープンソース大規模言語モデルGranite3.1を発表しました。このモデルシリーズは、128Kの拡張コンテキスト長、埋め込みモデル、ビルトインの幻覚検出機能、およびパフォーマンスの大幅な向上を備えています。IBMは、Granite8B Instructモデルが、MetaのLlama3.1、Qwen2.5、GoogleのGemma2などの同規模のオープンソース競合他社の中で最高の性能を発揮すると主張しています。

Dec 19, 2024

3.0k

昆侖万維天工大模型Skywork 4.0 O1版、招待テスト開始

昆侖万維科技股份有限公司は、最新開発の天工大模型4.0O1版（英名:Skywork O1）を2024年11月27日より招待テストを開始すると発表しました。天工大模型4.0O1版は、中国で初めて論理的推論能力を備えたO1モデルであり、モデル出力において、思考、計画、反省などの能力を備えているだけでなく、標準的な評価セットにおいて、基盤モデルと比較して推論能力が大幅に向上し、モデルの推論能力の本質的な向上を実現しています。

Nov 18, 2024

3.1k

智源、数千万命令微調整データセットInfinity-Instructを発表

北京智源人工智能研究院は、大規模言語モデルの対話性能向上を目指した、数千万件の命令微調整データセットInfinity-Instructを発表しました。最近、Infinity-Instruct-7M基本命令データセットとInfinity-Instruct-Gen対話命令データセットを含む、新たなバージョンが公開されました。

Sep 24, 2024

3.6k

最強モデルと謳われたReflection 70Bに疑問の声、創設者は「詐欺」の告発に直面

HyperWriteがリリースしたオープンソースAIモデル、Reflection70Bは、Meta社のLlama3.1の派生モデルであり、第三者機関によるテストで優れた性能を示したことから注目を集めていました。しかしその後、HyperWriteの創設者Matt Shumer氏がソーシャルメディアで同モデルを「世界最強のオープンソースモデル」と宣言し、「反射的微調整」技術を公開したことから、広範な疑問の声が浮上しました。Artificial Analysis組織による独立分析では…

Sep 10, 2024

2.3k

GPT-4oとClaude 3.5 Sonnetを凌駕する性能！超強力Reflection 70Bモデル登場

HyperWrite社は、MetaのオープンソースLlama3.1-70B InstructをベースとしたReflection 70Bモデルを発表しました。このモデルは、サードパーティによるベンチマークテストで卓越した性能を示し、「世界最強のオープンソースAIモデル」と評価されています。新モデルは自己修正技術を搭載し、高精度な回答を提供し、複数のテストでMeta Llamaシリーズを上回っています。Hugging Faceプラットフォームでダウンロード可能で、Hyperbolic La…

Sep 6, 2024

6.9k

AIニュース

AIデイリー

AIタイムライン

Alハードウェアです

最新事例

画像コレクション

ビデオコレクション

オーディオコレクション

コンテンツコレクション

最新チュートリアル

AIプロダクトランキング

AIトラフィック成長ランキング

AIトラフィック減少ランキング

AI週間ランキング

アメリカ合衆国

中国

インド

ブラジル

画像生成

パーソナルアシスタント

キャラクター生成

ビデオ生成

AIプロジェクトランキング

AIプロジェクト成長ランキング

AI開発者ランキング

AI組織ランキング

Deepseek

TTS

LLM

ChatGPT

概要

Meta、Llama 3.1 405Bというオープンソースの大規模言語モデルを発表、GPT-4に匹敵する性能

AIbase基地

この記事はAIbaseデイリーからのものです

関連AIニュースの推奨

NVIDIAがLlama Nemotron Nano VL AIを発表：OCRBenchで高精度ドキュメント処理ソリューションとして首位獲得

NVIDIA、Llama 3.1 Nemotron Ultra 253Bを発表 - Llama 4 Behemothを凌駕する性能

NVIDIA、Llama 3.1 Nemotron Ultra 253Bを発表：AI性能の王者、業界の新たなベンチマークを定義

NVIDIA、Llama 3.1 Nemotron Ultra 253Bを発表：比類なき性能を誇る技術の新たな基準

オープンソースAIの新たな高みへ：DeepSeek V3がLlama3.1を凌駕、14.8兆トークンの訓練データ

Gemma2超え！IBMがGranite3.1モデルを発表：128Kコンテキスト長に対応

昆侖万維天工大模型Skywork 4.0 O1版、招待テスト開始

智源、数千万命令微調整データセットInfinity-Instructを発表

最強モデルと謳われたReflection 70Bに疑問の声、創設者は「詐欺」の告発に直面

GPT-4oとClaude 3.5 Sonnetを凌駕する性能！超強力Reflection 70Bモデル登場