Starcloud社は、NVIDIA H100 GPUを搭載した衛星を用いて、宇宙空間でnano-GPTモデルのトレーニングに成功し、Gemmaモデルの推論を完了しました。これは宇宙データセンターの発展における重要な進展を示しています。
李飛飛チームがRTFMモデルを発表。単一H100 GPUで持続的・3D整合性を維持し、反射・陰影効果を実現。3D世界のリアルタイム生成と相互作用を可能にし、技術の実用化を推進。....
CohereがCommand A Reasoningモデルを発表。高難度のビジネス推論タスク向けで、エージェントワークフローや大規模ドキュメント分析に優れ、BFCL-v3などで他モデルを上回る性能。H100/A100 GPU対応。....
Metaは2026年に世界初の1GW超スーパーコンピュータ「Prometheus」を導入予定。130万個のNVIDIA H100 GPUを搭載し、算力は2exaflops超。さらに5GW規模の「Hyperion」クラスターも計画中。2025年までに600-650億ドルをAIインフラに投資し、OpenAIなどとの競争に対抗。大規模AI訓練とメタバース開発の競争力強化を図る。....
B200、H200、RTX4090、H100などさまざまなモデルを含む高性能GPUのレンタルサービスを提供しています。即時配信、明確な価格設定。
Openai
$2.8
入力トークン/百万
$11.2
出力トークン/百万
1k
コンテキスト長
-
Google
$0.7
Bytedance
$0.8
$2
128
Alibaba
$0.4
$0.75
256
$8.75
$70
400
$1.75
$14
$0.35
64
$1
$4
$0.63
$3.15
131
Huawei
32
$1.8
$5.4
16
Tencent
FastVideo
FastVideoチームが開発した画像を動画に変換するモデルで、CausalWan2.2 I2V A14Bシリーズに属し、8ステップ推論をサポートし、H100から4090までのさまざまなGPUに対応し、Macユーザーも使用できます。
pytorch
これはPyTorchチームがtorchaoを使用して量子化したQwen3-8Bモデルで、int4の重みのみの量子化とAWQアルゴリズムを採用しています。このモデルはH100 GPU上で53%のVRAM使用量を削減し、1.34倍の高速化を実現し、mmlu_abstract_algebraタスクに特化したキャリブレーション最適化が行われています。
jet-ai
Jet-Nemotron-4BはNVIDIAが開発した高効率混合アーキテクチャの言語モデルで、事後ニューラルアーキテクチャサーチとJetBlock線形注意力モジュールという2つの核心的な革新技術に基づいて構築されています。性能面では、Qwen3、Qwen2.5、Gemma3、Llama3.2などのオープンソースモデルを上回り、H100 GPU上で最大53.6倍の生成スループットの高速化を実現しています。
Jet-Nemotronは新型の混合アーキテクチャ言語モデルファミリーで、Qwen3、Qwen2.5、Gemma3、Llama3.2などの最先端のオープンソース全注意言語モデルを上回り、同時に著しい効率向上を実現します。H100 GPUでは生成スループットが最大53.6倍に加速されます。
Mungert
Meta Llama-3.3-70B-Instructをベースにした大規模言語モデルで、多段階のトレーニング最適化を経て、推論やチャットなどのタスクで優れた性能を発揮し、複数の言語をサポートし、様々なAIアプリケーションシーンに適しています。ニューラルアーキテクチャサーチ技術を用いて最適化され、単一のH100-80GB GPUで効率的に動作します。