Best 输出速度 AI Tools & Models - Premium 输出速度 News

AI News

单秒成本直降一半，字节跳动发布 Seedance 2.0 Mini 视频生成模型

字节跳动火山引擎旗下火山方舟体验中心上线Seedance 2.0 Mini视频生成模型，主打高性价比，近期将开放API服务。该轻量化版本在保持高质量输出的同时，生成速度比同系列标准快速版更快，旨在服务更广泛的视频创作与规模化生产市场。

21.2k 3 hours ago

单秒成本直降一半，字节跳动发布 Seedance 2.0 Mini 视频生成模型

输出速度飙升六倍，月之暗面正式上线 Kimi 2.7 Code 高速版大模型

月之暗面公司继Kimi 2.7 Code大模型后，推出高速版本，输出速度提升5-6倍，常规编程下约180 Token/s，大幅缩减等待时间，旨在提升开发者代码编写效率。

17.3k 14 hours ago

极速编程体验：Kimi K2.7 Code 高速版正式上线

月之暗面于6月15日上线Kimi K2.7Code模型高速版，面向Beta计划成员、API开发者及商业用户开放。该版本保持原有模型逻辑，但通过技术优化使输出速度提升5到6倍，尤其短上下文任务响应效率显著提高，标志着AI编程工具迎来新一轮提速。

15.4k 14 hours ago

谷歌联合英伟达发布开源模型DiffusionGemma:引入扩散机制，单卡推理提速4倍

谷歌于2026年6月发布开源语言模型DiffusionGemma，首次将图像AI扩散机制引入文本生成，打破传统逐字自回归范式。该模型从随机噪声迭代优化，并行输出256个词块。经英伟达优化，在单GPU单用户模式下，运行速度比同类传统模型快近四倍，如H100显卡处理单请求时表现显著提升。

16.9k 23 hours ago

谷歌联合英伟达发布开源模型DiffusionGemma:引入扩散机制，单卡推理提速4倍

Models

Gemini 2.0 Flash-Lite

Google

$0.49

Input tokens/M

$2.1

Output tokens/M

Context Length

Grok 4 Fast

Xai

$1.4

Input tokens/M

$3.5

Output tokens/M

Context Length

o3-mini

Openai

$7.7

Input tokens/M

$30.8

Output tokens/M

200

Context Length

Gemini 2.0 Flash

Google

$0.7

Input tokens/M

$2.8

Output tokens/M

Context Length

Claude Haiku 4.5

Anthropic

Input tokens/M

$35

Output tokens/M

200

Context Length

Claude Sonnet 4.5

Anthropic

$21

Input tokens/M

$105

Output tokens/M

200

Context Length

Claude 3 Sonnet

Anthropic

$21

Input tokens/M

$105

Output tokens/M

200

Context Length

Gemini 2.5 Flash-Lite

Google

$0.7

Input tokens/M

$2.8

Output tokens/M

Context Length

qwen-image-edit

Alibaba

Input tokens/M

Output tokens/M

Context Length

wan2.5-t2v-preview

Alibaba

Input tokens/M

Output tokens/M

Context Length

wan2.5-t2i-preview

Alibaba

Input tokens/M

Output tokens/M

Context Length

wan2.5-i2v-preview

Alibaba

Input tokens/M

Output tokens/M

Context Length

qwen3-omni-30b-a3b-captioner

Alibaba

$15.8

Input tokens/M

$12.7

Output tokens/M

Context Length

Kimi-K2

Moonshot

Input tokens/M

$16

Output tokens/M

256

Context Length

Doubao - Seedream - 3.0 - t2i

Bytedance

Input tokens/M

Output tokens/M

Context Length

Doubao-Seedance-1.0-pro

Bytedance

Input tokens/M

Output tokens/M

Context Length

Grok Code Fast 1

Xai

$1.4

Input tokens/M

$10.5

Output tokens/M

256

Context Length

Hunyuan-T1-20250822

Tencent

Input tokens/M

Output tokens/M

Context Length

Hunyuan-T1-latest

Tencent

Input tokens/M

Output tokens/M

Context Length

GPT-5 nano

Openai

$0.35

Input tokens/M

$2.8

Output tokens/M

400

Context Length

Empowering the future, your artificial intelligence solution think tank

English 简体中文繁體中文にほんご

FirendLinks:

AI Newsletters AI Tools MCP Servers AI News AI Marketing LLM Leaderboard AI Ranking

Business Cooperation Site Map

AI News

单秒成本直降一半，字节跳动发布 Seedance 2.0 Mini 视频生成模型

输出速度飙升六倍，月之暗面正式上线 Kimi 2.7 Code 高速版大模型

极速编程体验：Kimi K2.7 Code 高速版正式上线

谷歌联合英伟达发布开源模型DiffusionGemma:引入扩散机制，单卡推理提速4倍

Models

Gemini 2.0 Flash-Lite

Grok 4 Fast

o3-mini

Gemini 2.0 Flash

Claude Haiku 4.5

Claude Sonnet 4.5

Claude 3 Sonnet

Gemini 2.5 Flash-Lite

qwen-image-edit

wan2.5-t2v-preview

wan2.5-t2i-preview

wan2.5-i2v-preview

qwen3-omni-30b-a3b-captioner

Kimi-K2

Doubao - Seedream - 3.0 - t2i

Doubao-Seedance-1.0-pro

Grok Code Fast 1

Hunyuan-T1-20250822

Hunyuan-T1-latest

GPT-5 nano

Seed OSS 36B Instruct Unsloth MXFP4 Hybrid GGUF

Qwen3 4B Thinking 2507 Unsloth MXFP4 Hybrid GGUF