Best 极致量化 AI Tools & Models - Premium 极致量化 News

AI News

腾讯混元推出0.4G手机端离线翻译模型，五一出境游无信号也能通全球

五一黄金周前，腾讯混元团队推出极致量化翻译大模型Hy-MT1.5-1.8B-1.25bit，体积仅440MB，支持手机本地离线运行。通过先进量化技术，模型从3GB压缩至八分之一，可在无网络环境下流畅使用，为出国旅游用户提供便捷语言解决方案。

12.6k 6 minutes ago

Models

Grok 4 Fast

Xai

$1.4

Input tokens/M

$3.5

Output tokens/M

Context Length

gpt-oss-20b

Openai

$0.4

Input tokens/M

Output tokens/M

128

Context Length

Pangu-NLP-N2-32K-5.0.1.1

Huawei

Input tokens/M

Output tokens/M

Context Length

GLM-4.5-Air

Chatglm

Input tokens/M

Output tokens/M

128

Context Length

Hunyuan-A13B

Tencent

$0.5

Input tokens/M

Output tokens/M

224

Context Length

Hunyuan-Translation-Lite

Tencent

Input tokens/M

Output tokens/M

Context Length

Doubao-embedding

Bytedance

$0.5

Input tokens/M

Output tokens/M

Context Length

Pangu-NLP-N2-Reasoner-32K-3.0.1.1

Huawei

Input tokens/M

Output tokens/M

Context Length

Pangu-NLP-N4-4K-3.2.36

Huawei

Input tokens/M

Output tokens/M

Context Length

DeepSeek-R1-Distill-Qwen-1.5B

Deepseek

Input tokens/M

Output tokens/M

Context Length

Qwen_v2.5_0.5b_base

Alibaba

Input tokens/M

Output tokens/M

128

Context Length

Pangu-NLP-N2-32K-3.1.35

Huawei

Input tokens/M

Output tokens/M

Context Length

Pangu-NLP-N4-32K-2.5.35

Huawei

Input tokens/M

Output tokens/M

Context Length

Hunyuan-Large-Longcontext

Tencent

Input tokens/M

$18

Output tokens/M

256

Context Length

ERNIE 4.5 Turbo

Baidu

$0.8

Input tokens/M

$3.2

Output tokens/M

128

Context Length

Qwen_v2_1.5b_Instruct

Alibaba

Input tokens/M

Output tokens/M

Context Length

Qwen_v2.5_3b_Instruct

Alibaba

Input tokens/M

Output tokens/M

Context Length

Step-1X

Stepfun

Input tokens/M

Output tokens/M

Context Length

Yi-Lightning

01-ai

$0.99

Input tokens/M

$0.99

Output tokens/M

Context Length

ERNIE-4.5-21B-A3B-Paddle

Baidu

Input tokens/M

Output tokens/M

Context Length

Empowering the future, your artificial intelligence solution think tank

English 简体中文繁體中文にほんご

FirendLinks:

AI Newsletters AI Tools MCP Servers AI News AIBase LLM Leaderboard AI Ranking

Business Cooperation Site Map

AI News

腾讯混元推出0.4G手机端离线翻译模型，五一出境游无信号也能通全球

Models

Grok 4 Fast

gpt-oss-20b

Pangu-NLP-N2-32K-5.0.1.1

GLM-4.5-Air

Hunyuan-A13B

Hunyuan-Translation-Lite

Doubao-embedding

Pangu-NLP-N2-Reasoner-32K-3.0.1.1

Pangu-NLP-N4-4K-3.2.36

DeepSeek-R1-Distill-Qwen-1.5B

Qwen_v2.5_0.5b_base

Pangu-NLP-N2-32K-3.1.35

Pangu-NLP-N4-32K-2.5.35

Hunyuan-Large-Longcontext

ERNIE 4.5 Turbo

Qwen_v2_1.5b_Instruct

Qwen_v2.5_3b_Instruct

Step-1X

Yi-Lightning

ERNIE-4.5-21B-A3B-Paddle

Kwaipilot_KAT Dev GGUF

Microsoft_UserLM 8b GGUF

Gemma 3 4b It MAX HORROR Imatrix GGUF

Gemma 3 1b It MAX HORROR Imatrix GGUF

EXAONE Deep 2.4B Reasoning MAX NEO Imatrix GGUF

Meta Llama 3 8B Instruct GGUF

Llama3.2 DeepHermes 3 3B Preview Reasoning MAX NEO Imatrix GGUF

Gemma 3 12b It MAX HORROR Imatrix GGUF

Gemma 3 4b It MAX NEO Imatrix GGUF