PowerInfer-2

专为智能手机设计的高效大型语言模型推理框架

普通产品编程智能手机大型模型

打开网站

PowerInfer-2是一个为智能手机特别优化的推理框架，支持高达47B参数的MoE模型，实现了每秒11.68个token的推理速度，比其他框架快22倍。它通过异构计算和I/O-Compute流水线技术，显著减少了内存使用，并提高了推理速度。该框架适用于需要在移动设备上部署大型模型的场景，以增强数据隐私和性能。

AI开源&商用产品

AI产品提交

模型库

MCP服务端

MCP客户端

MCP服务调试

案例教程

AI热门资讯

今日AI热点

PowerInfer-2

PowerInfer-2 最新流量情况

PowerInfer-2 访问量趋势

PowerInfer-2 访问地理位置分布

PowerInfer-2 流量来源

PowerInfer-2 替代品

PowerInfer-2 — 专为智能手机设计的高效大型语言模型推理框架

AppAgent — 智能手机应用的多模态代理框架

Pixel 9 — 新一代谷歌智能手机，搭载先进的AI技术。

Galaxy S25 — Galaxy S25 是三星最新推出的智能手机，具备强大的性能和先进的 AI 技术。

BitNet — 1位大型语言模型推理框架

openai-style-api — 统一大型模型 API调用方式

FloatingAI — 一款AI助手，随时为您的手机提供建议

agentUniverse — 基于大型语言模型的多智能体应用开发框架

HuatuoGPT-o1-70B — 医疗领域先进的大型语言模型

Valley — 多模态大型模型，处理文本、图像和视频数据

HeardThat — 智能听觉辅助应用

InternLM-Math-Plus — 双语开源数学推理大型语言模型。

Valley-Eagle-7B — 多模态大型模型，处理文本、图像和视频数据

Pixel 9 Pro — 最强大的Pixel手机，内置Gemini AI助手。

Felo Translator — 音声通译，15种语言支持

LLaMA-O1 — 大型推理模型框架，支持PyTorch和HuggingFace。

FastVideo — 开源框架，加速大型视频扩散模型

BABEL DISH — Snap, tap, translate. 翻译菜单更快更便捷!

Agently AI应用开发框架 — 易用、灵活、高效的开源大模型应用开发框架。

Mistral-Large-Instruct-2407 — 先进的大型语言模型，具备推理和编程能力。

HuatuoGPT-o1 — 医疗领域复杂推理的大型语言模型

OpenDataLab — 高质量开放数据集平台，为大型模型提供数据支持

Star-Attention — 高效长序列大型语言模型推理技术

Buffer of Thoughts — 提升大型语言模型的推理准确性和效率

FP6-LLM — 高效为大型语言模型提供服务

MInference — 加速长上下文大型语言模型的推理过程

LLM Compiler-7b — 先进的代码优化和编译器推理的大型语言模型。

Multimodal-Maestro — 更有效的提示大型多模态模型，释放潜能

Cantor — 创新的多模态链式思维框架，提升视觉推理能力