最好的MTT AI AI工具模型_精选MTT AI资讯

AI资讯

国产算力底座再突破！摩尔线程 MTT S5000 完成智谱 GLM-5 大模型全流程适配

国产AI硬件与软件协同发展取得新突破。摩尔线程MTT S5000 GPU已完成对智谱GLM-5大模型的全流程适配，实现国产算力与大模型的深度结合。该GPU基于自研“平湖”架构，专为大模型训练与推理设计，标志着国产AI生态自主化进程的关键一步。

12.9k 16 小时前

摩尔线程发布国产 AI 编程服务:软硬协同助推开发生态变革

摩尔线程发布AI Coding Plan智能编程服务，基于国产GPU MTT S5000提供算力支撑，结合硅基流推理加速技术，旨在革新软件开发模式，提升国内AI编程渗透率。

11.3k 13 小时前

国产算力新突破！摩尔线程×硅基流动在MTT S5000上实现DeepSeek V3 671B满血版高效推理，单卡性能逼近国际顶尖水平

国产AI芯片与大模型协同优化取得重要进展。摩尔线程与硅基流动基于国产GPU MTT S5000，成功完成对千亿参数大模型DeepSeek V3 671B的深度适配。通过应用FP8低精度推理技术，实现单卡预填充吞吐量超4000 tokens/秒，解码吞吐量超1000 tokens/秒，推理速度已接近国际主流高端AI加速器水平。

13.9k 9 小时前

摩尔线程 MUSA 架构强势适配 llama.cpp，助力 AI 推理新纪元！

摩尔线程自主研发的MUSA架构成功适配开源推理框架llama.cpp，支持在MTT S80/S3000/S4000系列GPU上高效运行AI推理。此前MUSA SDK已扩展至Intel和海光平台，此次适配进一步降低了大模型部署门槛。llama.cpp作为轻量化跨硬件框架，支持LLaMA、Mistral等模型及多模态应用。这一突破为国内AI硬件生态注入新活力，推动AI技术在各领域的应用普及。

11.8k 3 天前

模型

Grok 4 Fast

Xai

$1.4

输入tokens/百万

$3.5

输出tokens/百万

上下文长度

Claude 3 Opus

Anthropic

$105

输入tokens/百万

$525

输出tokens/百万

200

上下文长度

Gemini 2.0 Flash

Google

$0.7

输入tokens/百万

$2.8

输出tokens/百万

上下文长度

Claude Haiku 4.5

Anthropic

输入tokens/百万

$35

输出tokens/百万

200

上下文长度

Gemini 2.5 Flash

Google

$2.1

输入tokens/百万

$17.5

输出tokens/百万

上下文长度

Claude Sonnet 4.5

Anthropic

$21

输入tokens/百万

$105

输出tokens/百万

200

上下文长度

Claude 3 Sonnet

Anthropic

$21

输入tokens/百万

$105

输出tokens/百万

200

上下文长度

Gemini 2.5 Flash-Lite

Google

$0.7

输入tokens/百万

$2.8

输出tokens/百万

上下文长度

qwen-image-plus

Alibaba

输入tokens/百万

输出tokens/百万

上下文长度

Qianfan-Lightning

Baidu

输入tokens/百万

输出tokens/百万

128

上下文长度

qwen3-max

Alibaba

输入tokens/百万

$24

输出tokens/百万

256

上下文长度

wan2.5-i2i-preview

Alibaba

输入tokens/百万

输出tokens/百万

上下文长度

qwen-image-edit

Alibaba

输入tokens/百万

输出tokens/百万

上下文长度

Doubao-Seed-Translation

Bytedance

$1.2

输入tokens/百万

$3.6

输出tokens/百万

上下文长度

Qwen3-Next-80B-A3B-Instruct

Alibaba

输入tokens/百万

输出tokens/百万

256

上下文长度

wan2.5-t2i-preview

Alibaba

输入tokens/百万

输出tokens/百万

上下文长度

wan2.5-t2v-preview

Alibaba

输入tokens/百万

输出tokens/百万

上下文长度

wan2.5-i2v-preview

Alibaba

输入tokens/百万

输出tokens/百万

上下文长度

qwen3-omni-flash-realtime

Alibaba

$3.9

输入tokens/百万

$15.2

输出tokens/百万

上下文长度

qwen3-tts-flash-realtime

Alibaba

输入tokens/百万

输出tokens/百万

上下文长度

智启未来，您的人工智能解决方案智库

English 简体中文繁體中文にほんご

友情链接:

AI Newsletters AI Tools MCP Servers AI News AIBase LLM Leaderboard AI Ranking

商务合作网站地图