AIBase
首页
AI资讯
AI产品库
模型广场
MCP服务
AI服务
算力市场
AI应用指南
ZH

AI产品

查看更多
大模型API性能指标比较

大模型API性能指标比较

深入分析TTFT、TPS等关键指标

AI模型
17.9k

模型

查看更多

wan2.5-t2v-preview

Alibaba

wan2.5-t2v-preview

-

输入tokens/百万

-

输出tokens/百万

-

上下文长度

qwen3-tts-flash

Alibaba

qwen3-tts-flash

-

输入tokens/百万

-

输出tokens/百万

-

上下文长度

qwen3-tts-flash-realtime

Alibaba

qwen3-tts-flash-realtime

-

输入tokens/百万

-

输出tokens/百万

-

上下文长度

qwen-tts-realtime

Alibaba

qwen-tts-realtime

$2.4

输入tokens/百万

$12

输出tokens/百万

8

上下文长度

qwen-tts

Alibaba

qwen-tts

$1.6

输入tokens/百万

$10

输出tokens/百万

8

上下文长度

Gemma 3 1B

Google

Gemma 3 1B

-

输入tokens/百万

-

输出tokens/百万

-

上下文长度

Gemini 1.5 Flash

Google

Gemini 1.5 Flash

$1.05

输入tokens/百万

$4.2

输出tokens/百万

1k

上下文长度

CogVideoX-Flash

Chatglm

CogVideoX-Flash

-

输入tokens/百万

-

输出tokens/百万

-

上下文长度

Gemma 2 27B

Google

Gemma 2 27B

-

输入tokens/百万

-

输出tokens/百万

-

上下文长度

Qwen3 4B Thinking 2507 MXFP4 Hybrid GGUF

magiccodingman

Q

这是一个基于Qwen3-4B-Thinking-2507的密集模型实验性量化版本。它采用了创新的MXFP4混合量化技术,旨在探索通过组合不同精度的权重(如MXFP4与Q8_0、Q6_K等),在显著减小模型文件大小、提升推理速度(TPS)的同时,尽可能保持接近原始F16模型的精度。该项目展示了混合量化方法的潜力,但已被作者更新的版本所取代。

自然语言处理SafetensorsSafetensors其他
magiccodingman
254
1
AIBase
智启未来,您的人工智能解决方案智库
English简体中文繁體中文にほんご
友情链接:
AI Newsletters AI ToolsMCP ServersAI NewsAIBaseLLM LeaderboardAI Ranking
© 2026AIBase
商务合作网站地图