AI2、新たなオープンソースモデルOLMoEを発表：効率的で強力、そして低コスト！

AIbase基地

公開日AIニュース · 1 分で読めます · Sep 10, 2024

314

最近、アレン人工知能研究所（AI2）は、大規模言語モデル（LLM）の需要に応えることを目的とした、全く新しいオープンソースモデルOLMoEを発表しました。このモデルは、優れた性能を持ちながら、比較的低コストです。

OLMoEは、スパース混合専門家（MoE）アーキテクチャを採用しており、70億個のパラメータを備えています。しかし、各入力トークンには10億個のパラメータしか使用されません。より汎用的なOLMoE-1B-7Bと、指示調整済みのOLMoE-1B-7B-Instructの2つのバージョンがあります。

他のほとんどのクローズドソースの混合専門家モデルとは異なり、AI2はOLMoEが完全にオープンソースであることを特に強調しています。彼らは論文の中で、「ほとんどのMoEモデルはクローズドソースです。モデルの重みを公開しているものもありますが、トレーニングデータ、コード、またはレシピに関する情報は非常に限られています。」と述べており、多くの学術研究者がこれらのモデルにアクセスできない状況を指摘しています。

AI2の研究科学者であるネイサン・ランバート氏はソーシャルメディアで、OLMoEが政策立案に役立ち、学術界におけるH100クラスタの導入の足掛かりとなる可能性があると述べています。また、OLMoEモデルの公開は、AI2がオープンソースモデルの開発に尽力し、その性能をクローズドモデルに匹敵させることを目指す取り組みの一環であると述べています。

モデルの構築において、AI2は64個の小型専門家を精緻なルーティングで使用し、実行時にはそのうち8個だけをアクティブ化することを決定しました。実験によると、OLMoEは他のモデルと同等の性能を示しながら、推論コストとメモリストレージを大幅に削減しています。OLMoEは、AI2の以前のオープンソースモデルであるOLMO1.7-7Bを基盤として構築されており、4096トークンのコンテキストウィンドウをサポートしています。OLMoEのトレーニングデータは、Common Crawl、Dolma CC、Wikipediaなど、複数のソースから取得されています。

ベンチマークテストでは、OLMoE-1B-7Bは、同様のパラメータを持つモデルと比較した場合、多くの既存モデルを上回り、Llama2-13B-ChatやDeepSeekMoE-16Bなどのより大規模なモデルをも凌駕する結果を示しました。

AI2の目標の1つは、混合専門家アーキテクチャを含む、より多くの完全にオープンソースのAIモデルを研究者に提供することです。多くの開発者がMoEアーキテクチャを使用していますが、AI2は、他のほとんどのAIモデルはオープン性においてまだ不十分であると考えています。

huggingface: https://huggingface.co/collections/allenai/olmoe-66cf678c047657a30c8cd3da

論文入口: https://arxiv.org/abs/2409.02060

要点：
- 🌟 AI2が発表した新しいオープンソースモデルOLMoEは、性能とコストの両面で競争力があります。
- 📊 OLMoEはスパース混合専門家アーキテクチャを採用しており、推論コストとメモリ要件を効果的に削減します。
- 🔍 AI2は、包括的なオープンソースAIモデルを提供することにより、学術研究と開発を促進することを目指しています。

OLMoE 大規模言語モデルスパース混合専門家 AI2

この記事はAIbaseデイリーからのものです

【AIデイリー】へようこそ！ここは、毎日人工知能の世界を探求するためのガイドです。毎日、開発者に焦点を当て、技術トレンドを洞察し、革新的なAI製品アプリケーションを理解するのに役立つ、AI分野のホットなコンテンツをお届けします。

—— AIbase デイリーグループによって作成

通義千問Qwen Chatデスクトップクライアントのリリース　MCPをワンクリックで呼び出す機能に対応

最近、Qwen Chatは重要なアップデートを行い、新たな姿で登場し、ユーザーにより直感的なインターフェース体験とより豊富な機能サービスを提供するよう努めています。Qwen Chatは此次のアップデートにより、インタフェースデザインにおいて大きな改善が行われました。ユーザーはホーム画面から直接チャットを開始でき、煩わしい操作は不要で、簡単に会話を楽しむことができます。さらに機能面では大幅に拡張され、日常の質問だけでなく、ユーザーのさまざまな情報検索ニーズを満たすだけでなく、コンテンツ作成にもお役立ちます。文章の作成や生産など、あらゆるシーンで活用可能です。

Jul 12, 2025

月の暗面Kimi K2モデルを発表し、オープンソース化。コードとAgenticタスクに強み

月の暗面社は、最新作であるKimi K2モデルを正式に発表し、同時にオープンソース化することを発表しました。このモデルはMoEアーキテクチャに基づいており、強力なコード処理能力と優れた汎用Agentタスク処理能力により、AI分野で広範な注目を集めています。Kimi K2モデルの総パラメータ数は1Tで、アクティブパラメータは32Bであり、SWE Bench Verified、Tau2、AceBenchなどの一連のベンチマーク性能テストにおいて、オープンソースモデルの中で最上位の成績を収めました。

Jul 12, 2025

CUDAコードは不要！H100で33％〜50％の高速化を達成したFlash Attentionの著者による新作が話題に

Jul 11, 2025

マーフェンポーAIルートブックが全面開放されました AIトラベルアシスタントに新たな実用機能が追加されました

Jul 11, 2025

テンセント・ハンドゥアンHunyuan-A13BモデルAPIがリリース

最近、テンセントクラウドの公式ウェブサイトではテンセント・ハンドゥアンA13BモデルのAPIサービスが正式にリリースされ、入力価格は100万トークンあたり0.5元、出力価格は100万トークンあたり2元と設定されました。この取り組みは開発者コミュニティで大きな反響を呼びました。業界初の13BレベルのMoE（混合エキスパート）オープンソースミックス推論モデルとして、Hunyuan-A13Bは合計パラメータ数80B、アクティブパラメータ数が13Bという簡潔な設計により、同等のアーキテクチャを持つ先端のオープンソースモデルと同等の性能を実現しており、推論においても優れた結果を提供しています。

Jul 11, 2025

AIニュース：智譜がPPT作成機能「AI Slides」をリリース；ケーリンAIが「Ketu 2.1モデル」を発表

1.智譜が無料AIスライドツールを発表。2.可霊AIが180スタイル対応の画像生成を提供。3.NVIDIAが動画から3D編集可能なツールを開発。4.墨刀AIが30秒でプロトタイプ作成可能に。5.Higgsfieldが10枚の写真でアバター生成。6.GoogleがAIワークフロー構築ツールを公開。7.Google Veo3が画像→動画機能追加。8.Mistralがコード生成特化モデルをリリース。....

Jul 11, 2025

グーグルDeepMindがGenAI Processorsをオープンソース化：1クリックでリアルタイムAIワークフローを構築

グーグルDeepMindは、PythonライブラリであるGenAI Processorsをオープンソース化しました。このライブラリは開発者に効率的な生成型AIワークフローの構築をサポートします。マルチモーダルデータの非同期処理をサポートし、Gemini APIアプリケーション開発を最適化し、リアルタイムアプリケーションの遅延を著しく低下させます。コア機能にはモジュール型のProcessorインターフェース、ストリーミングAPI設計および並列処理の最適化が含まれており、スマートアシスタントなどのリアルタイムアプリケーションを迅速に構築できます。現在はPythonのみサポートされていますが、コミュニティによる貢献がオープンされており、今後はより多くのシナリオをカバーする機能拡張が計画されています。

Jul 11, 2025

190

Manus AIの公式サイトおよびソーシャルメディアに変更が生じた。中国ユーザーに影響が出る可能性あり

一般的なAI会社であるManusは中国の業務を調整し、人員削減を行い、主要な技術チームをシンガポールに移転した。中国地区には約120人の従業員がいたが、同社はこの措置が運営効率の向上と核心業務への集中を目的としているとしている。公式サイトでは地域が利用不可と表示されており、以前の中文版開発中の通知に代わるものとなっている。また、公式微博（ウェイボ）と小紅書アカウントのコンテンツもすべて削除され、中国市場戦略が大きな転換を遂げていることが示されている。

Jul 11, 2025

モクドウAIがついに登場：アイデアを入力して30秒で高精細・編集可能なプロトタイプを生成

モクドウAIは30秒で素早くプロトタイプを生成する機能を提供しています。マルチデバイス対応や対話最適化にも対応しています。テキストやスケッチなどのさまざまな入力方法を通じて、高精細で編集可能なプロトタイプを作成でき、複数回の対話を通じて調整も可能です。AIはアップロードされたスケッチや線画などをスマートに解析し、自動的にインターフェースを生成します。2つのモードでの編集、自動文書生成、コード連携の機能を備え、小売、ソーシャルなど多様なシナリオに対応しており、プロトタイピングの制作のハードルを大幅に下げ、製品デザインの効率を向上させます。

Jul 11, 2025

Mistral AIがDevstral2507を発表：コード中心言語向けに最適化

Mistral AIは、Devstral2507シリーズの2種類のAIモデルをリリースしました。オープンソース版のDevstral Small1.1（240億パラメータ、SWE-Benchスコア53.6%）とエンドユーザー向けのDevstral Medium2507（スコア61.6%）。Small1.1は128kのコンテキストウィンドウとローカルデプロイメントをサポートし、Medium2507は一部の商用モデルを上回る性能を持っています。両モデルはコード推論やプログラム合成の最適化を目的としており、エージェントフレームワークとのサポートも可能です。

Jul 11, 2025

AIツールを探す

AIツールを提出

AI モデル検索

MCPサーバー

MCPクライアント

MCPインスペクター

ケーススタディ

最新AIニュース

AI日刊要約

AI2、新たなオープンソースモデルOLMoEを発表：効率的で強力、そして低コスト！

AIbase基地

この記事はAIbaseデイリーからのものです

関連AIニュースの推奨

通義千問Qwen Chatデスクトップクライアントのリリース　MCPをワンクリックで呼び出す機能に対応

月の暗面Kimi K2モデルを発表し、オープンソース化。コードとAgenticタスクに強み

CUDAコードは不要！H100で33％〜50％の高速化を達成したFlash Attentionの著者による新作が話題に

マーフェンポーAIルートブックが全面開放されました AIトラベルアシスタントに新たな実用機能が追加されました

テンセント・ハンドゥアンHunyuan-A13BモデルAPIがリリース

AIニュース：智譜がPPT作成機能「AI Slides」をリリース；ケーリンAIが「Ketu 2.1モデル」を発表

グーグルDeepMindがGenAI Processorsをオープンソース化：1クリックでリアルタイムAIワークフローを構築

Manus AIの公式サイトおよびソーシャルメディアに変更が生じた。中国ユーザーに影響が出る可能性あり

モクドウAIがついに登場：アイデアを入力して30秒で高精細・編集可能なプロトタイプを生成

Mistral AIがDevstral2507を発表：コード中心言語向けに最適化

AIツールを探す

AIツールを提出

AI モデル検索

MCPサーバー

MCPクライアント

MCPインスペクター

ケーススタディ

最新AIニュース

AI日刊要約

AI2、新たなオープンソースモデルOLMoEを発表：効率的で強力、そして低コスト！

AIbase基地

この記事はAIbaseデイリーからのものです

関連AIニュースの推奨

通義千問Qwen Chatデスクトップクライアントのリリース MCPをワンクリックで呼び出す機能に対応

月の暗面Kimi K2モデルを発表し、オープンソース化。コードとAgenticタスクに強み

CUDAコードは不要！H100で33％〜50％の高速化を達成したFlash Attentionの著者による新作が話題に

マーフェンポーAIルートブックが全面開放されました AIトラベルアシスタントに新たな実用機能が追加されました

テンセント・ハンドゥアンHunyuan-A13BモデルAPIがリリース

AIニュース：智譜がPPT作成機能「AI Slides」をリリース；ケーリンAIが「Ketu 2.1モデル」を発表

グーグルDeepMindがGenAI Processorsをオープンソース化：1クリックでリアルタイムAIワークフローを構築

Manus AIの公式サイトおよびソーシャルメディアに変更が生じた。中国ユーザーに影響が出る可能性あり

モクドウAIがついに登場：アイデアを入力して30秒で高精細・編集可能なプロトタイプを生成

Mistral AIがDevstral2507を発表：コード中心言語向けに最適化

通義千問Qwen Chatデスクトップクライアントのリリース　MCPをワンクリックで呼び出す機能に対応