最高のH100 AI AIツールモデル_厳選H100 AI情報

AIニュース

グーグル TurboQuantが発表：LLMのキーバッファメモリ圧縮が6倍、速度は8倍。ゼロ精度損失、トレーニング不要！

グーグルがTurboQuantアルゴリズムをリリースし、PolarQuantおよびQJL技術により、大規模言語モデルの推論におけるキーバッファメモリ要求を少なくとも6倍まで削減しました。H100 GPUでのアテンション計算の速度は最大で8倍向上し、ゼロ精度損失を維持しています。この革新はAI導入コストを低下させ、長文対応アプリケーションの発展を加速する可能性があります。

18.4k 22 時間前

自社開発の計算能力が進化：Metaが新世代AIチップを発表、NVIDIA H100に匹敵する性能

Metaが次世代自製AIチップ「MTIA3」を発表。推奨システムと推論タスク向けに設計され、内部テストではNVIDIA H100を上回る性能を実証。外部計算リソースへの依存低減を目指す。....

13k 9 時間前

計算力の巨獣が登場！マスクがコロッサス2のリリースを発表し、世界初のギガワット級AI時代を開く

マスク氏のxAIが世界初のギガワット級AI学習クラスター「Colossus2」を稼働。10万個のNVIDIA H100チップを搭載し、Grokチャットボットを駆動。AI計算競争が新段階へ。....

14.8k 1 日前

MetaAvocadoの非公開モデルは2026年春に発表、Zuckerbergが直接監督するチームが開発

メタCEOザッカーバーグがAI事業化を直轄。新世代モデル「Avocado」は2026年春リリース予定で、APIとホスティングサービスのみ提供し、オープンソース化せず。GoogleやOpenAIなどの技術を統合し、先端性能を目指す。MetaはNVIDIAと50億ドルのH100契約を締結し、モデル訓練に専用。....

13.1k 17 時間前

モデル

GPT-4.1 mini

Openai

$2.8

入力トークン/百万

$11.2

出力トークン/百万

コンテキスト長

Gemini 2.0 Flash

Google

$0.7

入力トークン/百万

$2.8

出力トークン/百万

コンテキスト長

Claude Haiku 4.5

Anthropic

入力トークン/百万

$35

出力トークン/百万

200

コンテキスト長

Gemini 2.5 Flash

Google

$2.1

入力トークン/百万

$17.5

出力トークン/百万

コンテキスト長

Claude Sonnet 4.5

Anthropic

$21

入力トークン/百万

$105

出力トークン/百万

200

コンテキスト長

Gemini 2.5 Flash-Lite

Google

$0.7

入力トークン/百万

$2.8

出力トークン/百万

コンテキスト長

qwen3-omni-flash-realtime

Alibaba

$3.9

入力トークン/百万

$15.2

出力トークン/百万

コンテキスト長

qwen3-tts-flash-realtime

Alibaba

入力トークン/百万

出力トークン/百万

コンテキスト長

Doubao-1.5-pro-32k

Bytedance

$0.8

入力トークン/百万

出力トークン/百万

128

コンテキスト長

Doubao-Seedance-1.0-pro

Bytedance

入力トークン/百万

出力トークン/百万

コンテキスト長

DeepSeek-V3.1

Deepseek

入力トークン/百万

$12

出力トークン/百万

128

コンテキスト長

Hunyuan-T1-latest

Tencent

入力トークン/百万

出力トークン/百万

コンテキスト長

騰訊混元生ビデオ

Tencent

入力トークン/百万

出力トークン/百万

コンテキスト長

Qwen3-30B-A3B-Instruct-2507

Alibaba

$0.75

入力トークン/百万

出力トークン/百万

256

コンテキスト長

GPT-5 mini

Openai

$1.75

入力トークン/百万

$14

出力トークン/百万

400

コンテキスト長

Claude Opus 4.1

Anthropic

$105

入力トークン/百万

$525

出力トークン/百万

200

コンテキスト長

qwen3-coder-flash

Alibaba

入力トークン/百万

出力トークン/百万

コンテキスト長

GPT OSS 120B

Openai

$0.63

入力トークン/百万

$3.15

出力トークン/百万

131

コンテキスト長

GLM-4.5-Flash

Chatglm

入力トークン/百万

出力トークン/百万

128

コンテキスト長

GLM-4.5-AirX

Chatglm

入力トークン/百万

出力トークン/百万

128

コンテキスト長

未来を力づける、あなたの人工知能ソリューションシンクタンク

English 简体中文繁體中文にほんご

友情链接:

AI Newsletters AI Tools MCP Servers AI News AIBase LLM Leaderboard AI Ranking

ビジネス協力サイトマップ

AIニュース

グーグル TurboQuantが発表：LLMのキーバッファメモリ圧縮が6倍、速度は8倍。ゼロ精度損失、トレーニング不要！

自社開発の計算能力が進化：Metaが新世代AIチップを発表、NVIDIA H100に匹敵する性能

計算力の巨獣が登場！マスクがコロッサス2のリリースを発表し、世界初のギガワット級AI時代を開く

MetaAvocadoの非公開モデルは2026年春に発表、Zuckerbergが直接監督するチームが開発

モデル

GPT-4.1 mini

Gemini 2.0 Flash

Claude Haiku 4.5

Gemini 2.5 Flash

Claude Sonnet 4.5

Gemini 2.5 Flash-Lite

qwen3-omni-flash-realtime

qwen3-tts-flash-realtime

Doubao-1.5-pro-32k

Doubao-Seedance-1.0-pro

DeepSeek-V3.1

Hunyuan-T1-latest

騰訊混元生ビデオ

Qwen3-30B-A3B-Instruct-2507

GPT-5 mini

Claude Opus 4.1

qwen3-coder-flash

GPT OSS 120B

GLM-4.5-Flash

GLM-4.5-AirX

Llama 3_3 Nemotron Super 49B V1_5 GGUF