Best 端侧AI大模型 AI Tools & Models - Premium 端侧AI大模型 News

AI News

国产端侧大模型第一次登上全球旗舰：面壁 MiniCPM 装进三星 Galaxy Z Fold8 系列

三星发布三款折叠新机，面壁智能 MiniCPM 端侧大模型首次进入其全球旗舰产品线 Galaxy AI，提供文本理解与多模态感知能力，标志着国产端侧大模型正式跻身国际头部手机厂商核心供应链。

78.3k 15 hours ago

国产端侧大模型第一次登上全球旗舰：面壁 MiniCPM 装进三星 Galaxy Z Fold8 系列

全球首款手机级 27B 多模态 AI 模型 Bonsai 27B 横空出世

全球首个27B级手机AI模型Bonsai27B问世，基于Qwen3.6，采用三进制与二进制压缩技术：三元版5.9GB侧重性能，可在笔记本运行；1-bit版极致缩小，适配移动端。这一突破标志着大模型轻量化部署的重大飞跃。

18.1k yesterday

面壁智能CTO曾国洋：从“打字机”到大模型，端侧AI的进化与突围

面壁智能另辟蹊径，专注端侧AI，将大模型压缩进手机、汽车等终端。28岁CTO曾国洋早年主导训练中国首个大语言模型CPM-1，如今致力推动轻量化智能落地移动设备。

14.9k 18 hours ago

27B大模型塞进iPhone！苹果看中AI压缩黑科技：体积缩到十四分之一，速度还快 8 倍

科技媒体The Information报道，苹果正接洽AI初创公司PrismML，评估在iPhone上直接运行更大规模AI模型的可行性。PrismML核心突破为原生1-bit模型压缩技术，可将模型体积压缩至约1/14，内存占用降低超90%。此举有望实现手机端侧大模型运行，实现端侧AI突破。

17k 1 days ago

27B大模型塞进iPhone！苹果看中AI压缩黑科技：体积缩到十四分之一，速度还快 8 倍

AI Products

Marvis

腾讯推出的更懂你的24小时在线AI助手，支持端侧大模型隐私模式与手机深度遥控电脑。

个人助理

9.3k

Models

GPT-4.1 mini

Openai

$2.8

Input tokens/M

$11.2

Output tokens/M

Context Length

Gemini 2.0 Flash-Lite

Google

$0.49

Input tokens/M

$2.1

Output tokens/M

Context Length

Grok 4 Fast

Xai

$1.4

Input tokens/M

$3.5

Output tokens/M

Context Length

o3-mini

Openai

$7.7

Input tokens/M

$30.8

Output tokens/M

200

Context Length

GPT-5 Codex

Openai

Input tokens/M

Output tokens/M

Context Length

Claude 3 Opus

Anthropic

$105

Input tokens/M

$525

Output tokens/M

200

Context Length

Gemini 2.0 Flash

Google

$0.7

Input tokens/M

$2.8

Output tokens/M

Context Length

Claude Haiku 4.5

Anthropic

Input tokens/M

$35

Output tokens/M

200

Context Length

Gemini 2.5 Flash

Google

$2.1

Input tokens/M

$17.5

Output tokens/M

Context Length

Claude Sonnet 4.5

Anthropic

$21

Input tokens/M

$105

Output tokens/M

200

Context Length

Claude 3 Sonnet

Anthropic

$21

Input tokens/M

$105

Output tokens/M

200

Context Length

Gemini 2.5 Flash-Lite

Google

$0.7

Input tokens/M

$2.8

Output tokens/M

Context Length

qwen-image-plus

Alibaba

Input tokens/M

Output tokens/M

Context Length

qwen3-coder-plus

Alibaba

Input tokens/M

$16

Output tokens/M

Context Length

qwen3-vl-plus

Alibaba

Input tokens/M

$10

Output tokens/M

256

Context Length

qwen3-max

Alibaba

Input tokens/M

$24

Output tokens/M

256

Context Length

wan2.5-i2i-preview

Alibaba

Input tokens/M

Output tokens/M

Context Length

Qianfan-Lightning

Baidu

Input tokens/M

Output tokens/M

128

Context Length

qwen3-vl-235b-a22b-thinking

Alibaba

Input tokens/M

$20

Output tokens/M

Context Length

qwen-image-edit

Alibaba

Input tokens/M

Output tokens/M

Context Length

Empowering the future, your artificial intelligence solution think tank

English 简体中文繁體中文にほんご

FirendLinks:

AI Newsletters AI Tools MCP Servers AI News AI Marketing LLM Leaderboard AI Ranking

Business Cooperation Site Map

AI News

国产端侧大模型第一次登上全球旗舰：面壁 MiniCPM 装进三星 Galaxy Z Fold8 系列

全球首款手机级 27B 多模态 AI 模型 Bonsai 27B 横空出世

面壁智能CTO曾国洋：从“打字机”到大模型，端侧AI的进化与突围

​27B大模型塞进iPhone！苹果看中AI压缩黑科技：体积缩到十四分之一，速度还快 8 倍

AI Products

Marvis

Models

GPT-4.1 mini

Gemini 2.0 Flash-Lite

Grok 4 Fast

o3-mini

GPT-5 Codex

Claude 3 Opus

Gemini 2.0 Flash

Claude Haiku 4.5

Gemini 2.5 Flash

Claude Sonnet 4.5

Claude 3 Sonnet

Gemini 2.5 Flash-Lite

qwen-image-plus

qwen3-coder-plus

qwen3-vl-plus

qwen3-max

wan2.5-i2i-preview

Qianfan-Lightning

qwen3-vl-235b-a22b-thinking

qwen-image-edit

Neutts Air Q8 Gguf

27B大模型塞进iPhone！苹果看中AI压缩黑科技：体积缩到十四分之一，速度还快 8 倍