英伟达在GB200和B200发布仅6个月后,再次推出全新GPU——GB300和B300。这看似只是小幅升级,实则蕴含着巨大的变革,尤其是推理模型性能的显著提升,将给整个行业带来深远的影响。
英伟达GB300/B300 GPU横空出世!推理性能暴增,供应链大洗牌

AIbase基地
本文来自AIbase日报
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。
英伟达在GB200和B200发布仅6个月后,再次推出全新GPU——GB300和B300。这看似只是小幅升级,实则蕴含着巨大的变革,尤其是推理模型性能的显著提升,将给整个行业带来深远的影响。
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。
AI编码工具Windsurf宣布重新上线Anthropic的Claude Sonnet4模型,为Pro用户提供每月250次调用权限(2倍信用消耗)。该模型以72.7%的SWE-bench测试表现著称,支持200K token上下文窗口,能实现代码生成、复杂重构等功能。此前因Anthropic限制直接访问,Windsurf曾推出BYOK方案应对。此次恢复合作被视为市场竞争下的重要突破,但2倍计费模式可能增加用户成本。未来平台或将进一步优化模型集成与定价策略。
谷歌DeepMind推出创新架构Mixture-of-Recursions(MoR),通过动态token级路由和递归深度分配,在保持参数高效的同时提升模型性能。该架构采用选择性缓存机制降低内存压力,实验显示其以更少参数超越传统Transformer,在360M规模以上表现尤为突出。MoR通过计算资源优化,为大规模语言模型部署提供高效解决方案,成为AI领域的重要突破。
OpenMed项目在Hugging Face平台发布380+个免费医疗NER模型(Apache2.0许可),打破医疗AI技术壁垒。这些109M-568M参数的模型性能媲美付费产品,已集成至主流AI生态系统。项目响应全球医疗资源短缺挑战,支持开发者自由使用和修改,此前其API曾5天内完成新冠筛查。团队计划持续扩展模型库,推动开源医疗AI发展,应对老龄化社会医疗需求。
华为联合云南交投和长安大学发布"绿美通道・交通大模型",推动交通行业数字化转型。该模型包含智能计算中心、高质量数据集、AI平台工具链和场景应用,其中行业认知模型准确率达84%。依托华为昇腾AI算力,双方建立了大数据中心和35个边缘计算节点,实现算力融合。未来将开发30余种AI应用,提升交通建设、管理、养护等业务效率和安全水平。
【AI日报速览】1.字节跳动TRAE2.0编程工具将新增语音交互功能,提升开发效率;2.Mistral推出开源音频模型Voxtral,支持多语言;3.月之暗面回应Kimi K2API速度问题,正在优化系统;4.昆仑万维发布AgentOrchestra多智能体协作框架;5.OpenAI前CTO创立的Thinking Machines Lab获20亿美元融资;6.Kimi-2开源模型性能超越GPT-4.1;7.TRAE推出Kimi-K2模型服务,国际版支持Grok-4;8.字节跳动Seed团队开源POLARIS强化学习方法;9.ima知识库推出网页版,支持浏览器访问。
近日,字节跳动Seed团队携手香港大学与复旦大学,共同推出了创新的强化学习训练方法——POLARIS。该方法通过精心设计的Scaling RL策略,成功将小模型的数学推理能力提升至与超大模型相媲美的水平,为人工智能领域的小模型优化提供了新路径。 实验结果显示,采用POLARIS训练的40亿参数开源模型Qwen3-4B,在AIME25和AIME24数学测试中分别取得了79.4%和81.2%的高准确率,性能超越部分更大规模的闭源模型。尤为突出的是,POLARIS-4B模型的轻量化设计,使其能够在消费级显卡上轻松部署,大大降低了应用门槛。
AI创业公司Thinking Machines Lab完成20亿美元种子轮融资,估值达120亿美元,创硅谷种子轮融资纪录。这家由OpenAI前CTO米拉·穆拉蒂创立的公司,成立不到一年就吸引英伟达等知名投资者。公司即将发布首款产品,包含重要开源项目,旨在支持AI研究者和创业公司。尽管Meta曾试图收购未果,该公司仍被视为可能挑战行业巨头的潜力股。此次融资反映了市场对新兴AI项目的热切期待,也凸显了AI领域日益激烈的竞争态势。
苹果MLX框架新增CUDA支持,开发者可在Mac上开发AI应用后无缝迁移至英伟达平台。这一突破解决了以往MLX依赖Metal框架导致部署受限的问题,由开发者@zcbenz耗时数月完成代码整合。新功能实现"代码导出兼容性",让开发者能以低成本Apple Silicon Mac开发,必要时再使用英伟达硬件部署,显著降低开发门槛。此举既保留Apple开发优势,又拓展部署灵活性,有望推动MLX框架生态扩展。
法国Mistral公司发布开源音频模型Voxtral,提供经济高效的语音AI解决方案。该模型基于Mistral Small3.1开发,支持30分钟音频转录和40分钟内容理解,具备多语言处理能力。提供三种版本:240亿参数的Voxtral Small适用于生产环境;30亿参数的Voxtral Mini适合本地部署;3亿参数的Voxtral Mini Transcribe专注转录场景。API起价0.001美元/分钟,性能超越Whisper但价格更低。此次发布延续了Mistral推动开源AI的战略,公司近期正寻求10亿美元融资。
TRAE.ai推出Kimi-K2模型和Grok-4(Beta)服务。Kimi-K2基于MoE架构,在代码生成和数学推理表现优异,性能接近GPT-4.1等顶级模型。用户可通过简单三步快速接入使用。国际版新增Grok-4(Beta)测试,目前提供包括Claude、Gemini、GPT等主流大模型阵容,满足不同场景需求。