深入浅出扩散模型 (Diffusion Model) 系列：基石 DDPM（人人都能看懂的数学原理篇）

GiantPandaCV

发布于AI新闻资讯 · 1 分钟阅读 · Aug 18, 2023

本文详细介绍了扩散模型的基石 DDPM 的数学原理。通过优化目标 ELBO，重参数和噪声预测，模型能够学习真实图片的分布并生成逼真图片。DDPM 为后续的扩散模型发展奠定了基础。

扩散模型 DDPM 数学原理

本文来自AIbase日报

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。

—— 由AIbase 日报组创作

AI日报：字节将发布AI编程工具TRAE2.0版本；Mistral重磅推出音频模型Voxtral；月之暗面回应Kimi K2 API速度慢

【AI日报速览】1.字节跳动TRAE2.0编程工具将新增语音交互功能，提升开发效率；2.Mistral推出开源音频模型Voxtral，支持多语言；3.月之暗面回应Kimi K2API速度问题，正在优化系统；4.昆仑万维发布AgentOrchestra多智能体协作框架；5.OpenAI前CTO创立的Thinking Machines Lab获20亿美元融资；6.Kimi-2开源模型性能超越GPT-4.1；7.TRAE推出Kimi-K2模型服务，国际版支持Grok-4；8.字节跳动Seed团队开源POLARIS强化学习方法；9.ima知识库推出网页版，支持浏览器访问。

2025年7月16号 17:09

450

字节跳动Seed最新强化学习配方POLARIS开源 4B 模型数学推理接近 235B 表现

近日，字节跳动Seed团队携手香港大学与复旦大学，共同推出了创新的强化学习训练方法——POLARIS。该方法通过精心设计的Scaling RL策略，成功将小模型的数学推理能力提升至与超大模型相媲美的水平，为人工智能领域的小模型优化提供了新路径。实验结果显示，采用POLARIS训练的40亿参数开源模型Qwen3-4B，在AIME25和AIME24数学测试中分别取得了79.4%和81.2%的高准确率，性能超越部分更大规模的闭源模型。尤为突出的是，POLARIS-4B模型的轻量化设计，使其能够在消费级显卡上轻松部署，大大降低了应用门槛。

2025年7月16号 10:56

1.1k

Mistral重磅推出Voxtral：开源AI音频模型的新时代来临！

法国Mistral公司发布开源音频模型Voxtral，提供经济高效的语音AI解决方案。该模型基于Mistral Small3.1开发，支持30分钟音频转录和40分钟内容理解，具备多语言处理能力。提供三种版本：240亿参数的Voxtral Small适用于生产环境；30亿参数的Voxtral Mini适合本地部署；3亿参数的Voxtral Mini Transcribe专注转录场景。API起价0.001美元/分钟，性能超越Whisper但价格更低。此次发布延续了Mistral推动开源AI的战略，公司近期正寻求10亿美元融资。

2025年7月16号 8:56

170

TRAE 推出 Kimi-K2模型服务，国际版支持 Grok-4（Beta）功能升级

TRAE.ai推出Kimi-K2模型和Grok-4(Beta)服务。Kimi-K2基于MoE架构，在代码生成和数学推理表现优异，性能接近GPT-4.1等顶级模型。用户可通过简单三步快速接入使用。国际版新增Grok-4(Beta)测试，目前提供包括Claude、Gemini、GPT等主流大模型阵容，满足不同场景需求。

2025年7月16号 8:53

1.0k

AI日报：美图发布影像AI Agent RoboNeo；1.8bit量化Kimi K2模型上线；亚马逊推AI代码编辑器 Kiro

【AI日报热点速览】1.美图RoboNeo上线全能AI影像处理工具，支持自然语言修图、品牌设计和网页制作；2.Unsloth AI发布1.8bit量化Kimi K2模型，体积缩小80%性能不变；3.谷歌Gemini嵌入模型登顶MTEB排行榜；4.Amazon推出AI代码编辑器Kiro，支持Claude 4等模型；5.Claude新增工具目录功能提升AI工作流效率；6.MiniMax完成3亿美元融资，估值超40亿美元；7.UTCP协议发布，实现AI代理直接调用工具；8.Grok推出动漫AI伴侣功能；9.Grok网页版上线语音模式；10.Kimi K2在OpenRouter市场份额超越xAI。

2025年7月15号 16:23

2.0k

Unsloth AI发布1.8bit量化Kimi K2模型，显著降低部署成本

Unsloth AI成功将Moonshot AI的Kimi K2模型量化为1.8bit版本，模型体积从1.1TB压缩至245GB，降幅达80%，同时保持全部性能。这款1万亿参数的开源大模型采用MoE架构，擅长代码生成和推理任务。量化后的版本可在512GB内存的M3Ultra设备上运行，大幅降低部署成本。该技术突破使Kimi K2成为GPT-4.1等商业模型的有力竞争者，为中小企业提供高性能AI解决方案。尽管商业化需遵守开源标注要求，但这一进展显著推动了开源AI生态发展，有望在教育、医疗等领域实现更广泛应用。

2025年7月15号 13:53

1.6k

Meta或将放弃开源理念，转向闭源AI模型开发

Meta或将放弃开源AI战略转向闭源模式。据报其超级智能实验室正讨论停用开源模型"Behemoth"，该模型因测试不佳已推迟发布。虽然发言人强调仍将保持开源立场，但这一转变若成真，将颠覆扎克伯格此前推崇的开源理念。Meta面临巨大AI研发成本压力，在商业化方面落后于OpenAI等竞争对手。此举可能影响整个AI行业格局，削弱开源生态，使权力重回大公司手中，并冲击依赖开源模型的中小企业。中国等国家积极拥抱开源AI的战略也可能因此受到影响。

2025年7月15号 9:41

890

Meta 开源战略现变数?传高层讨论放弃 Behemoth 模型转向封闭开发

Meta被曝可能放弃开源AI战略，转向闭源模式。据《纽约时报》报道，其已完成训练的下一代开源模型Behemoth因性能不佳被搁置，新成立的超级智能实验室正讨论转向闭源。Meta发言人虽坚称开源立场未变，但承认未来将混合开发开放和封闭模型。若CEO扎克伯格批准这一转变，将标志着Meta核心AI战略的重大调整。此举可能重塑全球AI格局，减缓开源势头，影响初创企业生态，并在地缘竞争中让中国在开源领域获得更大优势。Meta面临商业化压力，闭源或能提供更清晰的盈利路径。

2025年7月15号 9:30

790