Mercury：商用レベル初の拡散型LLM、高速でモバイルデバイスにも展開可能

AIbase基地

公開日AIニュース · 1 分で読めます · Feb 28, 2025

人工知能分野において、画期的な技術が静かに台頭しつつあります。最近、Inception Labsは、Mercuryシリーズ拡散型大規模言語モデル（dLLMs）を発表しました。これは、高速かつ効率的に高品質なテキストを生成することを目的とした、次世代の言語モデルです。従来の自己回帰型大規模言語モデルと比較して、Mercuryは生成速度が最大10倍向上し、NVIDIA H100 GPU上で毎秒1000トークンを超える速度を実現しています。この速度は、これまでカスタムチップに依存して初めて達成できたものです。

Mercuryシリーズの最初の製品であるMercury Coderは、公開テストで登場しました。このモデルはコード生成に特化しており、優れた性能を発揮し、GPT-4o MiniやClaude3.5Haikuなどの既存の速度最適化モデルを複数のプログラミングベンチマークテストで上回っています。同時に、速度も約10倍速くなっています。開発者のフィードバックによると、Mercuryのコード補完機能はより好評で、Copilot Arenaのテストでは、Mercury Coder Miniが性能でトップクラスにランクインし、最速のモデルの一つとなっています。

現在の言語モデルの多くは、自己回帰方式を採用しており、左から右へトークンを逐次生成するため、生成プロセスは必然的にシーケンシャルになり、遅延と計算コストが高くなります。一方、Mercuryは「粗から細」への生成方式を採用し、純粋なノイズから始めて、数回の「ノイズ除去」ステップを経て、徐々に詳細な出力を生成します。これにより、Mercuryモデルは生成時に複数トークンの並列処理が可能になり、より優れた推論と構造化された応答能力を実現しています。

Mercuryシリーズの発表により、Inception Labsは、拡散モデルがテキストとコード生成分野における巨大な可能性を示しました。次に、同社はチャットアプリケーション向けの言語モデルを発表し、拡散言語モデルの適用範囲をさらに拡大する予定です。これらの新しいモデルは、より強力なインテリジェントエージェント能力を備え、複雑な計画と長時間の生成を行うことができます。同時に、その効率性により、スマートフォンやノートパソコンなどのリソースの限られたデバイスでも動作します。

総じて、Mercuryの発表は人工知能技術における重要な進歩を示しており、速度と効率の大幅な向上だけでなく、業界に高品質なソリューションを提供しています。

公式紹介: https://www.inceptionlabs.ai/news

オンライン体験: https://chat.inceptionlabs.ai/

要点:
🌟 Mercuryシリーズ拡散型大規模言語モデル（dLLMs）が登場、生成速度は毎秒1000トークンに向上。
🚀 Mercury Coderはコード生成に特化し、ベンチマークテストで多くの既存モデルを凌駕する優れた性能を発揮。
💡 拡散モデルの革新的な手法により、テキスト生成がより効率的で正確になり、インテリジェントエージェントアプリケーションに新たな可能性を提供。

IntelがオープンソースAI PlaygroundでArc GPUによるローカルAIモデル実行の新体験を提供

Intelは最近、ローカル生成AI用に設計されたAI Playgroundソフトウェアを正式にオープンソースとして公開したと発表しました。これはIntel Arc GPUユーザーに強力なAIモデル実行プラットフォームを提供します。AIbaseが知る限り、AI Playgroundは様々な画像、動画生成モデルと大規模言語モデル（LLMs）をサポートしており、ローカルの計算資源を最適化することで、AIアプリケーションのハードウェアの敷居を大幅に下げています。このプロジェクトはGitHubで公開されており、世界中の開発者やAI愛好家から注目を集めています。

マイクロソフト、無料AIスキル研修でキャリアアップを支援

急速に発展する人工知能（AI）の現状において、マイクロソフトはAIスキルの普及促進に積極的に取り組んでおり、50日間にわたるAIスキルフェスティバルを開催します。このイベントは初心者から専門家まで、全ての人が無料で登録して豊富なAI学習リソースを入手できる機会です。一般の人々のAI能力向上を目指すだけでなく、ギネス世界記録の達成も目指す、楽しく実用的なイベントです。AIは様々な業界の働き方、特に日常業務を変革しつつあります。マイクロソフトは…

マスク氏、Grok 3間近との発表！性能は10倍向上！

人工知能分野において、テスラとSpaceXの創設者イーロン・マスク氏が再び注目を集めています。先日、X（旧Twitter）で、期待が高まるGrok 3モデルの近日公開を発表し、大きな話題となっています。この新しいモデルは、10万枚ものNVIDIA H100チップを用いてトレーニングされ、Grok 2と比較して計算能力が10倍に向上したとされています。Grokシリーズは初公開以来、大きな注目を集めています。Grok 3は当初昨年末の公開が予定されていましたが、

IBM Granite 3.0：NVIDIA H100でトレーニングされた強力なAIモデル

IBMは最近、「Granite 3.0」モデルを発表しました。これは、競合他社を凌駕するアクセシビリティ技術です。このモデルは、生成AIに関心のある企業の参入障壁を下げ、より多くの企業がAI技術を活用できるようにすることを目的としています。さらに、IBMはWatsonxという有料ツールも提供しており、組織は自社データセンター内の運用でカスタムモデルを起動できます。このツールにより、企業は自社データセンター内でAIモデルを開発および展開し、特定のビジネスニーズを満たすことができます。

マスクのxAI、世界最強AIトレーニングシステム「コロッサス」を公開、Nvidia H100 GPU 10万枚搭載

イーロン・マスクのxAI社は、「コロッサス」と呼ばれるAIトレーニングシステムを発表しました。10万枚のNvidia H100 GPUを搭載し、世界最強のAIトレーニングシステムと言われています。その性能は、米国エネルギー省のオーロラスーパーコンピューターを上回る可能性さえあります。コロッサスは、言語モデル実行速度が従来のGPUと比べて30倍高速なNvidiaのH100 GPUによって、その圧倒的なパワーを実現しています。特にTrans…