Best 蒸馏技术 AI Tools & Models - Premium 蒸馏技术 News

AI News

微博开源Vibe Thinker：15亿参数击败DeepSeek R1，后训练成本仅7800美元

微博推出开源大模型Vibe Thinker，仅15亿参数却在数学竞赛基准测试中击败6710亿参数的DeepSeek R1，准确率更高且训练成本仅7800美元。采用轻量化MoE架构与知识蒸馏技术，仅需5GB数学语料即可微调，支持Hugging Face下载和商用。该模型在AIME等国际数学竞赛中表现优异。

12.5k 10 hours ago

8B模型碾压32B？Mira Murati新作“在线策略蒸馏”引爆AI训练革命，成本直降90%！

前OpenAI首席技术官Mira Murati领导的团队推出“在线策略蒸馏”技术，仅用80亿参数的小模型即可达到32B大模型70%的性能，训练成本降低90%，效率提升50-100倍，让中小企业和个人开发者能以低成本获得高性能模型。

12.8k yesterday

8B模型碾压32B？Mira Murati新作“在线策略蒸馏”引爆AI训练革命，成本直降90%！

性价比之王！Anthropic 推出 Claude Haiku 4.5，编程能力媲美 Sonnet 4 仅需三分之一的价格！

Anthropic发布小型AI模型Claude Haiku4.5，以低成本实现接近前沿性能，专为实时低延迟任务设计，如聊天助手和客户服务。Claude系列含Haiku、Sonnet、Opus三种尺寸，大模型虽知识广但速度慢成本高，Haiku通过“蒸馏”技术平衡效率与性能。

15.3k 3 hours ago

京东宣布其大模型品牌正式升级为JoyAI 并发布全新智能品牌JoyInside

京东在2025世界人工智能大会上宣布将大模型品牌升级为JoyAI，并推出智能品牌JoyInside。JoyAI系列包含3B到750B多种模型，支持语言、语音、图像等多模态应用。通过动态分层蒸馏等技术，推理效率提升30%，训练成本降低70%。目前已有众擎、商汤等企业接入JoyInside，应用于机器人、玩具等领域。京东持续发力AI技术创新和智能生态建设。

9.5k 12 minutes ago

AI Products

FastHunyuan

快速生成高质量视频的模型

视频生成

10.6k

Diffusion Self-Distillatio

一种用于零样本定制图像生成的扩散自蒸馏技术

图片生成

9.9k

HunyuanDiT Distillation Acceleration

高性能图像生成模型的蒸馏加速版本

AI图像生成

10.6k

Trajectory Consistency Distillation (TCD)

提高文本到图像合成质量的一致性蒸馏技术

AI图像生成

11k

Models

o3-mini

Openai

$7.7

Input tokens/M

$30.8

Output tokens/M

200

Context Length

qwen3-livetranslate-flaltimeash-re-2025-09-22

Alibaba

Input tokens/M

$240

Output tokens/M

Context Length

腾讯混元生视频-视频特效

Tencent

Input tokens/M

Output tokens/M

Context Length

腾讯混元生视频

Tencent

Input tokens/M

Output tokens/M

Context Length

gpt-oss-20b

Openai

$0.4

Input tokens/M

Output tokens/M

128

Context Length

Claude Opus 4.1

Anthropic

$105

Input tokens/M

$525

Output tokens/M

200

Context Length

Spark X1

Iflytek

Input tokens/M

Output tokens/M

Context Length

Wan2.1-T2V-1.3B

Alibaba

Input tokens/M

Output tokens/M

Context Length

Gemma 3n E2B Instructed

Google

Input tokens/M

Output tokens/M

Context Length

Gemma 3n E4B

Google

Input tokens/M

Output tokens/M

Context Length

Gemma 3n E2B Instructed LiteRT (Preview)

Google

Input tokens/M

Output tokens/M

Context Length

Gemma 3n E4B Instructed

Google

$140

Input tokens/M

$280

Output tokens/M

Context Length

Gemma 3n E4B Instructed LiteRT Preview

Google

Input tokens/M

Output tokens/M

Context Length

Hunyuan-T1-Vision

Tencent

Input tokens/M

Output tokens/M

Context Length

Gemini Diffusion

Google

Input tokens/M

Output tokens/M

Context Length

Gemma 3 27B

Google

$0.7

Input tokens/M

$1.4

Output tokens/M

131

Context Length

Step-Video-T2V-Turbo

Stepfun

Input tokens/M

Output tokens/M

Context Length

DeepSeek-R1-Distill-Qwen-32B

Deepseek

Input tokens/M

Output tokens/M

Context Length

DeepSeek-R1-Distill-Qwen-7B

Deepseek

Input tokens/M

Output tokens/M

Context Length

DeepSeek-R1-Distill-Llama-8B

Deepseek

Input tokens/M

Output tokens/M

Context Length

Empowering the future, your artificial intelligence solution think tank

English 简体中文繁體中文にほんご

FirendLinks:

AI Newsletters AI Tools MCP Servers AI News AIBase LLM Leaderboard AI Ranking

Business Cooperation Site Map

AI News

微博开源Vibe Thinker：15亿参数击败DeepSeek R1，后训练成本仅7800美元

8B模型碾压32B？Mira Murati新作“在线策略蒸馏”引爆AI训练革命，成本直降90%！

性价比之王！Anthropic 推出 Claude Haiku 4.5，编程能力媲美 Sonnet 4 仅需三分之一的价格！

京东宣布其大模型品牌正式升级为JoyAI 并发布全新智能品牌JoyInside

AI Products

FastHunyuan

Diffusion Self-Distillatio

HunyuanDiT Distillation Acceleration

Trajectory Consistency Distillation (TCD)

Models

o3-mini

qwen3-livetranslate-flaltimeash-re-2025-09-22

腾讯混元生视频-视频特效

腾讯混元生视频

gpt-oss-20b

Claude Opus 4.1

Spark X1

Wan2.1-T2V-1.3B

Gemma 3n E2B Instructed

Gemma 3n E4B

Gemma 3n E2B Instructed LiteRT (Preview)

Gemma 3n E4B Instructed

Gemma 3n E4B Instructed LiteRT Preview

Hunyuan-T1-Vision

Gemini Diffusion

Gemma 3 27B

Step-Video-T2V-Turbo

DeepSeek-R1-Distill-Qwen-32B

DeepSeek-R1-Distill-Qwen-7B

DeepSeek-R1-Distill-Llama-8B

Nanbeige4 3B Thinking 2511

Sd15 Flow Matching

Focalcodec_50hz_4k_causal

Vit_small_plus_patch16_dinov3.lvd1689m

MobileLLM Pro

Qwen Image Lightning

Mdbr Leaf Ir

FLUX.1 Krea Dev

SauerkrautLM Reason EuroColBERT

Voice Based Stress Recognition

Qwen3 30B A3B 4bit DWQ

DASS_medium_AudioSet_50.2

OPENCLIP SigLIP Tiny 14 Distill SigLIP 400m Cc9m

Quasar 3.0 Final

Urlbert Tiny Base V4

Opensearch Neural Sparse Encoding Doc V3 Distill

Distil Large V3.5 Ct2

ZYH LLM Qwen2.5 14B V4

Flux1 Dev DedistilledMixTuned V3

ModularStarEncoder Finetuned 9