英伟达在GB200和B200发布仅6个月后,再次推出全新GPU——GB300和B300。这看似只是小幅升级,实则蕴含着巨大的变革,尤其是推理模型性能的显著提升,将给整个行业带来深远的影响。
英伟达GB300/B300 GPU横空出世!推理性能暴增,供应链大洗牌

AIbase基地
本文来自AIbase日报
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。
英伟达在GB200和B200发布仅6个月后,再次推出全新GPU——GB300和B300。这看似只是小幅升级,实则蕴含着巨大的变革,尤其是推理模型性能的显著提升,将给整个行业带来深远的影响。
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。
Lightricks发布开源视频生成模型LTX-Video13B,采用130亿参数和多尺度渲染技术,实现30倍于同类模型的生成速度。该模型在消费级GPU上流畅运行,支持1216×704分辨率实时生成,提供文本/图像/视频到视频的多种创作模式。其创新技术显著提升视频连贯性和细节表现,支持关键帧控制、风格替换等精细操作。作为开源项目,模型配套提供训练工具和优化版本,对中小企业免费开放,推动AI视频创作民主化。
苹果MLX框架新增CUDA支持引发热议,这标志着苹果对英伟达生态的妥协。面对英伟达在AI领域的统治地位和4万亿美元市值,苹果调整策略以抢占市场份额。MLX支持CUDA后,开发者可在英伟达GPU训练模型后部署到苹果设备,提升开发效率。此举既回应了2018年"禁卡风波"的争议,也借助CUDA统一内存机制实现跨平台部署。苹果最终选择拥抱拥有500万开发者的CUDA生态,展现其在AI领域的战略转向。
特斯拉发布新一代Dojo2芯片,性能较初代提升10倍,算力接近英伟达B200。该芯片由台积电代工,采用先进封装技术,解决了功耗等问题。Dojo2将助力特斯拉FSD自动驾驶系统训练,处理每日1600亿帧视频数据,实现技术自给自足。马斯克透露明年将推出更强大的Dojo3,并戏称Dojo2能以每秒十亿帧运行《孤岛危机》。这一突破将减少特斯拉对英伟达依赖,并可能对外提供算力服务。
Lightricks开源AI视频模型LTX-Video迎来重大升级,支持60秒长视频生成,打破行业8秒限制。该模型采用自回归流式架构,实现从图像到高清视频(最高1216x704分辨率)的实时生成,首秒内容瞬时呈现。新增动态场景控制功能,允许实时调整姿势、深度等元素,支持多种生成模式。130亿参数模型在消费级GPU(最低8GB显存)上高效运行,60秒视频仅需数秒生成。作为开源项目,其代码和权重已免费发布,但商业用途受限。此次升级为创作者提供了长篇叙事能力,未来将在LTX Studio推出商业版本。
Aider Leaderboard最新测试显示,Moonshot AI开源模型Kimi K2编程能力表现亮眼,与Qwen3-235B-A22B相当,接近o3-mini-high和Claude-3.7-Sonnet水平。该模型采用1万亿参数MoE架构,支持128k上下文,在SWE-bench等测试中表现优异,单次尝试准确率达65.8%。凭借0.14美元/百万token的低成本优势,成为终端编码Agent理想选择。支持网页生成、自动化工作流等场景,通过vLLM和Hugging Face部署,MIT协议开源特性推动社区采用,展现中国AI企业在开源生态的领先地位。
字节跳动视觉大模型团队负责人杨建朝因家庭因素宣布暂时休息,由前阿里通义千问技术负责人周畅接任。此次人事变动正值字节AI部门调整期,引发外界对技术路线稳定性的关注。杨建朝的工作资料仍保留在内部系统,周畅将带领分布全球的Seed团队继续视觉多模态生成等研究。公司强调将持续投入基础研究,期待新负责人带来创新活力。这一变动凸显了科技行业在快速发展中平衡工作与健康的重要性。
NVIDIA发布突破性混合模型Canary-Qwen-2.5B,以5.63%词错率创Hugging Face OpenASR纪录。该模型采用CC-BY许可,支持商业应用,统一语音识别与语言处理功能。核心创新在于FastConformer编码器与Qwen3-1.7B LLM解码器的混合架构,仅25亿参数却实现高效处理。支持多种NVIDIA GPU硬件,适用于云推理和边缘计算。开源特性促进语音AI发展,为企业提供转录服务、知识提取等商业应用场景,推动下一代语音AI发展。
朗新科技在链博会发布"朗新九功AI能源大模型",该模型具备两大核心技术:时序预测引擎基于千亿级预训练数据,电力价格预测准确率超90%,可应对冷启动环境;AI智能体引擎支持动态数据融合和秒级响应,能7×24小时自动监控电力市场并生成对冲策略。目前已在广东、山东、浙江等电力现货市场应用,推动电力交易智能化发展,为能源管理提供科学决策支持。
全球首款AI实时视频转换模型MirageLSD发布,实现40毫秒超低延迟处理。该模型由Decart AI团队研发,支持24帧/秒实时转换任意视频流,突破传统视频生成技术瓶颈。通过手势控制等简单交互,用户可实时改变视频场景、服装等元素,大幅降低创作门槛。应用场景涵盖游戏开发(30分钟快速构建游戏)、直播、动画制作等领域,其核心技术LSD模型采用Diffusion Forcing技术,解决长时间生成的误差累积问题。目前该模型已开放试用,将推动AI与内容创作的深度融合。
AI编码工具Windsurf宣布重新上线Anthropic的Claude Sonnet4模型,为Pro用户提供每月250次调用权限(2倍信用消耗)。该模型以72.7%的SWE-bench测试表现著称,支持200K token上下文窗口,能实现代码生成、复杂重构等功能。此前因Anthropic限制直接访问,Windsurf曾推出BYOK方案应对。此次恢复合作被视为市场竞争下的重要突破,但2倍计费模式可能增加用户成本。未来平台或将进一步优化模型集成与定价策略。