PositronがAI推論チップ「Asimov」を発表。大規模モデル推論に最適化し、GPUアーキテクチャを簡素化することで効率向上。エネルギー効率とコストパフォーマンスがNVIDIA次世代製品の5倍と主張し、業界注目を集める。....
インテルCEOの陳立武氏は、GPU市場への正式参入を発表。トップチームを結成し、昨年加入した幹部が統括。NVIDIAなどから多数の経験豊富な人材を採用し、AIなどの重要分野での展開を加速。....
OpenAIは、NVIDIA以外のAI計算力の代替手段を探っている。それは、最新チップにおける推論処理の反応速度に不満があるためである。企業は、コード生成などの複雑な相互作用において、ハードウェアの速度がボトルネックになっていることを発見し、そのため戦略の中心がモデルのトレーニングから推論の最適化へと移行している。
OpenAIはAI事業拡大のため1000億ドル調達を計画。主要チップ供給元のNVIDIAは追加で300億ドル投資を検討中。同社の計算能力はOpenAIモデル訓練の中核を支えている。....
Openai
$2.8
入力トークン/百万
$11.2
出力トークン/百万
1k
コンテキスト長
Google
$0.49
$2.1
-
Anthropic
$105
$525
200
$0.7
$7
$35
$17.5
$21
Alibaba
$1
$10
256
$4
$16
$2
$3.9
$15.2
64
Bytedance
$0.15
$1.5
Xai
$1.4
$10.5
Deepseek
$12
128
Baidu
$0.4
TheStageAI
TheWhisper-Large-V3はOpenAI Whisper Large V3モデルの高性能ファインチューニング版で、TheStage AIによって多プラットフォーム(NVIDIA GPUとApple Silicon)のリアルタイム、低遅延、低消費電力の音声テキスト変換推論用に最適化されています。
nvidia
NVIDIA GPT-OSS-120B Eagle3は、OpenAIのgpt-oss-120bモデルをベースに最適化されたバージョンで、ハイブリッドエキスパート(MoE)アーキテクチャを採用し、総パラメータ数が1200億、アクティブなパラメータ数が50億です。このモデルは商用および非商用の使用をサポートし、テキスト生成タスクに適しており、特にAIエージェントシステムやチャットボットなどのアプリケーション開発に適しています。
NVIDIA Qwen3-32B FP4モデルは、アリババのQwen3-32Bモデルの量子化バージョンで、最適化されたTransformerアーキテクチャを使用し、重みと活性化関数をFP4で量子化しています。AIエージェントシステム、チャットボット、RAGシステムなどのAIアプリケーションに適しています。
NVIDIA Qwen3-14B FP4モデルは、アリババのQwen3-14Bモデルの量子化バージョンで、FP4データ型を用いて最適化され、TensorRT-LLMによる効率的な推論が可能です。このモデルはNVIDIA GPU加速システム向けに設計されており、AIエージェントシステム、チャットボット、RAGシステムなどの様々なAIアプリケーションシーンに適しており、世界中での商用および非商用利用がサポートされています。
NVIDIA Qwen3-8B FP4モデルは、アリババのQwen3-8Bモデルの量子化バージョンで、最適化されたTransformerアーキテクチャを採用した自己回帰型言語モデルです。このモデルはFP4量子化技術を使用し、パフォーマンスを維持しながらメモリ使用量と計算要件を大幅に削減し、AIエージェントシステム、チャットボット、RAGシステムなどのアプリケーションシナリオに適しています。
NVIDIA Qwen3-30B-A3B FP4は、アリババのQwen3-30B-A3Bモデルの量子化バージョンで、最適化されたTransformerアーキテクチャを採用し、FP4量子化技術によりモデルサイズを約3.3倍削減しながら、良好な性能を維持しています。このモデルは商用および非商用用途をサポートし、AIエージェントシステム、チャットボット、RAGシステムなどのアプリケーションシーンに適しています。