Best 端侧推理 AI Tools & Models - Premium 端侧推理 News

AI News

端侧大模型迎突破！Liquid AI 开源混合专家模型 LFM2.5

人工智能初创公司Liquid AI发布并开源了端侧大模型LFM2.5-8B-A1B，专为消费级硬件设计，优化工具调用和指令遵循能力。该模型采用稀疏混合专家架构，总参数量8.3B，但每个Token仅激活1.5B参数，在降低计算成本的同时提升推理性能，可流畅运行于手机和笔记本电脑上。

22.7k 1 days ago

Mininglamp 开源 Cider+Mano-P，让你的 Mac 变身私有 AI 工作站

Mininglamp 开源了两个本地AI项目Cider和Mano-P，分别解决Mac端侧推理加速和GUI智能体操作痛点。Cider释放M系列芯片潜能，让LLM/VLM在本地运行更快更省资源；Mano-P则提升智能体操作效率。这使Mac从“能跑AI”升级为高效、私有、可深度操控的AI工作站，打造完整本地AI基础设施。

27.4k 5 hours ago

Mininglamp 开源 Cider+Mano-P，让你的 Mac 变身私有 AI 工作站

苹果引入知识提炼技术:将谷歌Gemini模型蒸馏至iPhone端侧运行

苹果利用知识蒸馏技术，将谷歌Gemini云端大模型转化为适用于iPhone的轻量化端侧组件。根据2026年3月消息，苹果与谷歌达成协议，允许其工程师深度访问并研究Gemini全量模型。此举增强了苹果在AI领域的自主性，使其能直接借鉴Gemini的高质量输出与推理过程。

15.9k yesterday

Liquid AI 发布 1.2B 推理模型：不到 1GB 内存，手机端侧即可运行“思考”模式

Liquid AI推出LFM2.5-1.2B-Thinking推理模型，拥有12亿参数，专为复杂逻辑推理和数学任务设计。该模型在端侧部署上实现突破，仅占用约900MB内存，可在现代手机上完全离线运行，将两年前需数据中心支持的推理能力成功迁移至个人移动设备。

18.5k 1 days ago

Liquid AI 发布 1.2B 推理模型：不到 1GB 内存，手机端侧即可运行“思考”模式

Models

GPT-4.1 mini

Openai

$2.8

Input tokens/M

$11.2

Output tokens/M

Context Length

GPT-5 Codex

Openai

Input tokens/M

Output tokens/M

Context Length

Claude Sonnet 4.5

Anthropic

$21

Input tokens/M

$105

Output tokens/M

200

Context Length

Claude 3 Sonnet

Anthropic

$21

Input tokens/M

$105

Output tokens/M

200

Context Length

qwen3-coder-plus

Alibaba

Input tokens/M

$16

Output tokens/M

Context Length

Qianfan-Lightning

Baidu

Input tokens/M

Output tokens/M

128

Context Length

Kimi-K2

Moonshot

Input tokens/M

$16

Output tokens/M

256

Context Length

Doubao-1.5-pro-32k

Bytedance

$0.8

Input tokens/M

Output tokens/M

128

Context Length

Hunyuan-T1-20250822

Tencent

Input tokens/M

Output tokens/M

Context Length

Hunyuan-T1-latest

Tencent

Input tokens/M

Output tokens/M

Context Length

DeepSeek-V3.1

Deepseek

Input tokens/M

$12

Output tokens/M

128

Context Length

qwen-deep-research

Alibaba

$54

Input tokens/M

$163

Output tokens/M

Context Length

qwen-vl-max

Alibaba

$1.6

Input tokens/M

Output tokens/M

128

Context Length

gpt-oss-20b

Openai

$0.4

Input tokens/M

Output tokens/M

128

Context Length

qwen3-coder-flash

Alibaba

Input tokens/M

Output tokens/M

Context Length

qwen-flash

Alibaba

$15

Input tokens/M

$15

Output tokens/M

Context Length

Spark X1

Iflytek

Input tokens/M

Output tokens/M

Context Length

Doubao-1.5-thinking-pro

Bytedance

Input tokens/M

$16

Output tokens/M

128

Context Length

Doubao-1.5-UI-TARS

Bytedance

$3.5

Input tokens/M

$12

Output tokens/M

128

Context Length

Grok-4 Heavy

Xai

Input tokens/M

Output tokens/M

Context Length

Empowering the future, your artificial intelligence solution think tank

English 简体中文繁體中文にほんご

FirendLinks:

AI Newsletters AI Tools MCP Servers AI News AI Marketing LLM Leaderboard AI Ranking

Business Cooperation Site Map

AI News

端侧大模型迎突破！Liquid AI 开源混合专家模型 LFM2.5

Mininglamp 开源 Cider+Mano-P，让你的 Mac 变身私有 AI 工作站

苹果引入知识提炼技术:将谷歌Gemini模型蒸馏至iPhone端侧运行

Liquid AI 发布 1.2B 推理模型：不到 1GB 内存，手机端侧即可运行“思考”模式

Models

GPT-4.1 mini

GPT-5 Codex

Claude Sonnet 4.5

Claude 3 Sonnet

qwen3-coder-plus

Qianfan-Lightning

Kimi-K2

Doubao-1.5-pro-32k

Hunyuan-T1-20250822

Hunyuan-T1-latest

DeepSeek-V3.1

qwen-deep-research

qwen-vl-max

gpt-oss-20b

qwen3-coder-flash

qwen-flash

Spark X1

Doubao-1.5-thinking-pro

Doubao-1.5-UI-TARS

Grok-4 Heavy

MiniCPM4.1 8B GGUF

MiniCPM4 8B GGUF

MiniCPM4 0.5B

MiniCPM4 8B

Megrez 3B Instruct

AI News

端侧大模型迎突破！Liquid AI 开源混合专家模型 LFM2.5

Mininglamp 开源 Cider+Mano-P，让你的 Mac 变身私有 AI 工作站

苹果引入知识提炼技术:将谷歌Gemini模型蒸馏至iPhone端侧运行

​Liquid AI 发布 1.2B 推理模型：不到 1GB 内存，手机端侧即可运行“思考”模式

Models

GPT-4.1 mini

GPT-5 Codex

Claude Sonnet 4.5

Claude 3 Sonnet

qwen3-coder-plus

Qianfan-Lightning

Kimi-K2

Doubao-1.5-pro-32k

Hunyuan-T1-20250822

Hunyuan-T1-latest

DeepSeek-V3.1

qwen-deep-research

qwen-vl-max

gpt-oss-20b

qwen3-coder-flash

qwen-flash

Spark X1

Doubao-1.5-thinking-pro

Doubao-1.5-UI-TARS

Grok-4 Heavy

MiniCPM4.1 8B GGUF

MiniCPM4 8B GGUF

MiniCPM4 0.5B

MiniCPM4 8B

Megrez 3B Instruct

Liquid AI 发布 1.2B 推理模型：不到 1GB 内存，手机端侧即可运行“思考”模式