AIBase
Home
AI NEWS
AI Tools
GEO & AEO
MCP
AI Models
EN

AI News

View More

Moonshot AI携手清华大学发布PrfaaS架构,破解大模型算力瓶颈

大语言模型推理效率迎来突破。清华大学与Moonshot AI联合提出“预填充即服务”新架构,通过将推理过程拆分为预填充和解码两个阶段,并优化算力资源分配,有效解决硬件限制问题,显著提升模型服务性能。

13.9k 5 minutes ago
Moonshot AI携手清华大学发布PrfaaS架构,破解大模型算力瓶颈

跨数据中心的创新:Moonshot AI 与清华大学提出 PrfaaS 架构

Moonshot AI与清华大学提出预填充即服务(PrfaaS)新架构,旨在解决大型语言模型推理中计算资源瓶颈。该架构将高计算密集的预填充阶段(生成键值缓存)与解码阶段分离,以优化资源利用,突破传统服务限制。

13k 3 minutes ago
跨数据中心的创新:Moonshot AI 与清华大学提出 PrfaaS 架构

Models

View More

Claude Haiku 4.5

Anthropic

Claude Haiku 4.5

$7

Input tokens/M

$35

Output tokens/M

200

Context Length

Claude 3 Haiku

Anthropic

Claude 3 Haiku

$1.75

Input tokens/M

$8.75

Output tokens/M

200

Context Length

Gemma 2 27B

Google

Gemma 2 27B

-

Input tokens/M

-

Output tokens/M

-

Context Length

Claude 3.5 Sonnet

Anthropic

Claude 3.5 Sonnet

$21

Input tokens/M

$105

Output tokens/M

200

Context Length

GLM-4

Chatglm

GLM-4

$100

Input tokens/M

$100

Output tokens/M

128

Context Length

AIBase
Empowering the future, your artificial intelligence solution think tank
English简体中文繁體中文にほんご
FirendLinks:
AI Newsletters AI ToolsMCP ServersAI NewsAIBaseLLM LeaderboardAI Ranking
© 2026AIBase
Business CooperationSite Map