Best 结构化剪枝 AI Tools & Models - Premium 结构化剪枝 News

AI News

英伟达开源新突破：新模型训练算力节省1.8倍！

英伟达开源了两款新型大模型Nemotron-4-Minitron-4B和Nemotron-4-Minitron-8B，采用结构化剪枝和知识蒸馏高效训练方法，显著降低训练需求，减少数据和算力消耗。与传统方法相比，新模型的训练token数据减少40倍，算力成本节省1.8倍。通过优化Llama-3.18B，结构化剪枝简化模型结构，知识蒸馏提升性能，Minitron-4B和Minitron-8B在MMLU上的评分提升16%，性能媲美Mistral7B等知名模型。这一开源举措展示了英伟达在AI领域的领导地位，并为AI社区提供了宝贵资源，推动AI技术向更高效、更智能方向发展。

15.2k 06-05

Models

o3-mini

Openai

$7.7

Input tokens/M

$30.8

Output tokens/M

200

Context Length

Doubao - Seedream - 3.0 - t2i

Bytedance

Input tokens/M

Output tokens/M

Context Length

Qianfan-VL-8B

Baidu

Input tokens/M

Output tokens/M

Context Length

Qianfan-VL-70B

Baidu

Input tokens/M

Output tokens/M

Context Length

Grok Code Fast 1

Xai

$1.4

Input tokens/M

$10.5

Output tokens/M

256

Context Length

GPT-5 mini

Openai

$1.75

Input tokens/M

$14

Output tokens/M

400

Context Length

GLM-4.5-X

Chatglm

Input tokens/M

$16

Output tokens/M

128

Context Length

Qwen3-0.6B

Alibaba

$0.3

Input tokens/M

Output tokens/M

Context Length

Hunyuan-TurboS-Vision

Tencent

Input tokens/M

Output tokens/M

Context Length

Hunyuan-Translation-Lite

Tencent

Input tokens/M

Output tokens/M

Context Length

Pangu-NLP-N2-Reasoner-32K-3.0.1.1

Huawei

Input tokens/M

Output tokens/M

Context Length

GPT-4.1

Openai

$14

Input tokens/M

$56

Output tokens/M

Context Length

Hunyuan-Large

Tencent

Input tokens/M

$12

Output tokens/M

Context Length

Qwen_v2.5_14b_Instruct

Alibaba

Input tokens/M

Output tokens/M

128

Context Length

Hunyuan-Large-Longcontext

Tencent

Input tokens/M

$18

Output tokens/M

256

Context Length

o1-pro

Openai

Input tokens/M

Output tokens/M

Context Length

Qwen_v2.5_1.5b_Instruct

Alibaba

Input tokens/M

Output tokens/M

Context Length

Qwen_v2.5_3b_Instruct

Alibaba

Input tokens/M

Output tokens/M

Context Length

Hunyuan-Lite

Tencent

Input tokens/M

Output tokens/M

250

Context Length

Empowering the future, your artificial intelligence solution think tank

English 简体中文繁體中文にほんご

FirendLinks:

AI Newsletters AI Tools MCP Servers AI News AIBase LLM Leaderboard AI Ranking

Business Cooperation Site Map

AI News

英伟达开源新突破：新模型训练算力节省1.8倍！

Models

o3-mini

Doubao - Seedream - 3.0 - t2i

Qianfan-VL-8B

Qianfan-VL-70B

Grok Code Fast 1

GPT-5 mini

GLM-4.5-X

Qwen3-0.6B

Hunyuan-TurboS-Vision

Hunyuan-Translation-Lite

Pangu-NLP-N2-Reasoner-32K-3.0.1.1

GPT-4.1

Hunyuan-Large

Qwen_v2.5_14b_Instruct

Hunyuan-Large-Longcontext

o1-pro

Qwen_v2.5_1.5b_Instruct

Qwen_v2.5_3b_Instruct

Hunyuan-Lite

Sheared LLaMA 1.3B

Internal.wav2vec2 Base Superb Ks Int8 Structured79