グーグルがTurboQuantアルゴリズムをリリースし、PolarQuantおよびQJL技術により、大規模言語モデルの推論におけるキーバッファメモリ要求を少なくとも6倍まで削減しました。H100 GPUでのアテンション計算の速度は最大で8倍向上し、ゼロ精度損失を維持しています。この革新はAI導入コストを低下させ、長文対応アプリケーションの発展を加速する可能性があります。
Metaが次世代自製AIチップ「MTIA3」を発表。推奨システムと推論タスク向けに設計され、内部テストではNVIDIA H100を上回る性能を実証。外部計算リソースへの依存低減を目指す。....
マスク氏のxAIが世界初のギガワット級AI学習クラスター「Colossus2」を稼働。10万個のNVIDIA H100チップを搭載し、Grokチャットボットを駆動。AI計算競争が新段階へ。....
メタCEOザッカーバーグがAI事業化を直轄。新世代モデル「Avocado」は2026年春リリース予定で、APIとホスティングサービスのみ提供し、オープンソース化せず。GoogleやOpenAIなどの技術を統合し、先端性能を目指す。MetaはNVIDIAと50億ドルのH100契約を締結し、モデル訓練に専用。....
Openai
$2.8
入力トークン/百万
$11.2
出力トークン/百万
1k
コンテキスト長
Google
$0.7
Anthropic
$7
$35
200
$2.1
$17.5
$21
$105
Alibaba
$3.9
$15.2
64
-
Bytedance
$0.8
$2
128
Deepseek
$4
$12
Tencent
$1
32
$0.75
256
$1.75
$14
400
$525
$0.63
$3.15
131
Chatglm
Mungert
Meta Llama-3.3-70B-Instructをベースにした大規模言語モデルで、多段階のトレーニング最適化を経て、推論やチャットなどのタスクで優れた性能を発揮し、複数の言語をサポートし、様々なAIアプリケーションシーンに適しています。ニューラルアーキテクチャサーチ技術を用いて最適化され、単一のH100-80GB GPUで効率的に動作します。