英伟达在GB200和B200发布仅6个月后,再次推出全新GPU——GB300和B300。这看似只是小幅升级,实则蕴含着巨大的变革,尤其是推理模型性能的显著提升,将给整个行业带来深远的影响。
英伟达GB300/B300 GPU横空出世!推理性能暴增,供应链大洗牌

AIbase基地
本文来自AIbase日报
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。
英伟达在GB200和B200发布仅6个月后,再次推出全新GPU——GB300和B300。这看似只是小幅升级,实则蕴含着巨大的变革,尤其是推理模型性能的显著提升,将给整个行业带来深远的影响。
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。
近日,阿里巴巴正式发布全新 AI 模型 QwenLong-L1-32B,一款基于强化学习(RL)优化的长上下文推理模型,标志着阿里巴巴在人工智能领域的又一重大突破。该模型以其超长的上下文处理能力和卓越的推理性能,迅速成为业界关注的焦点。以下是 AIbase 整理的最新资讯,带您一探这款划时代模型的全貌。超长上下文能力:13万 Token 震撼业界QwenLong-L1-32B 的最大亮点在于其惊人的13万个 Token 上下文长度。这一能力使其能够处理超大规模的文本输入,轻松应对复杂、多层次的信息整合任务。相比传统
阿里巴巴今日正式发布QwenLong-L1-32B,这是一款专为长上下文推理设计的大型语言模型,标志着AI长文本处理能力的重大突破。该模型在性能表现上超越了o3-mini和Qwen3-235B-A22B,与Claude-3.7-Sonnet-Thinking达到相当水平。技术创新亮点QwenLong-L1-32B最大的技术突破在于其是全球首个通过强化学习训练的长文本情境推理模型。该模型基于QwenLong-L1框架开发,采用了先进的GRPO(Group Relative Policy Optimization)和DAPO(Direct Alignment Policy Optimization)算法,结合基于规则和基于模型的混合奖励函数,显著提升了模型在
据路透社援引三位知情人士消息,英伟达将于6月推出一款专为中国市场设计的全新AI芯片,定价预计在6,500至8,000美元之间,明显低于当前售价约为10,000至12,000美元的H20型号。新芯片基于最新Blackwell架构,并采用RTX Pro6000D的设计框架。为规避美国对华高端芯片出口限制,该GPU刻意避开了台积电的先进封装工艺,改用标准GDDR7内存,以降低制造复杂度并提升可量产性。此举是英伟达在全球芯片监管政策趋紧背景下的一项关键市场策略,旨在维持其在中国AI计算市场的主导地位,同时在合规
硅基流动(SiliconCloud)宣布对其 DeepSeek-R1等推理模型 API 进行了一次重要升级,旨在更好地满足开发者对长上下文和灵活参数配置的需求。此次升级中,多个推理模型的最大上下文长度被提升至128K,使得模型在思考时能够更加充分,输出内容也更为完整。在此次升级中,多个知名模型,如 Qwen3、QWQ、GLM-Z1等,均支持128K 的最大上下文长度,而 DeepSeek-R1则支持96K。这一提升为复杂推理任务,如代码生成和智能体的应用提供了强有力的支持。更为重要的是,硅基流动还引入了独立控制 “思维链
近日,英伟达发布了其最新的 Cosmos-Reason1系列模型,旨在提升人工智能在物理常识和具身推理方面的能力。随着人工智能在语言处理、数学及代码生成等领域取得显著进展,如何将这些能力扩展到物理环境中成为了一大挑战。物理 AI(Physical AI)不同于传统的人工智能,它依赖于视频等感官输入,并结合现实物理法则来生成反应。物理 AI 的应用领域包括机器人和自动驾驶车辆等,需要具备常识推理能力和对空间、时间及物理规律的深入理解。然而,现有的 AI 模型在与物理世界的连接上依然
今日,腾讯混元正式宣布其模型矩阵的全面升级,包括 旗舰快思考模型混元TurboS、深度思考模型混元T1升级,并基于TurboS基座,新推出视觉深度推理模型T1-Vision和端到端语音通话模型混元Voice。另外,腾讯混元图像2.0、腾讯混元3D v2.5及混元游戏视觉生成等一系列多模态模型同步“上新”。此次升级不仅增强了混元在 AI 领域的竞争力,也标志着腾讯在多模态技术上的新进展。在2025腾讯云 AI 产业应用峰会上,腾讯集团高级执行副总裁汤道生表示,混元 TurboS 模型在全球公认的 Chatbot Arena 评测
英伟达首席执行官黄仁勋宣布推出最新的人形机器人基础模型 ——Isaac GR00T N1.5。此次发布标志着英伟达在机器人开发基础设施上迈出了重要的一步,黄仁勋表示,这一模型将成为 “下一代工业革命的核心构建模块”。GR00T N1.5模型的一个显著优势是其训练效率的显著提升。传统的人形机器人模型通常需要近三个月的时间来完成数据采集,而通过全新的 GR00T-Dreams 工具,生成合成数据的时间可以缩短至仅36小时。这一变革性的发展,有助于解决人形机器人在发展过程中的数据瓶颈问题。GR00T-
在全球最大的合约电子产品制造商富士康(Foxconn)与知名芯片制造商英伟达(Nvidia)之间,合作的脚步愈发坚定。近日,富士康在台北国际电脑展上宣布,将分阶段建设一座专门针对人工智能(AI)应用的数据中心,预计其总功率将达到100兆瓦(MW)。富士康董事长刘扬伟在展会上透露,该人工智能数据中心将采取逐步建设的方式。刘董事长强调,由于电力资源在台湾的稀缺性,该项目的推进并非一蹴而就。初期计划将从20兆瓦的电力供应开始,后续再根据情况逐步增加至40兆瓦,最终达到100兆瓦的
近日,阿布扎比的 AI 投资基金 MGX、法国国家投资银行、AI 初创公司 Mistral AI 与科技巨头英伟达宣布了一项重磅合作计划,目标是在巴黎地区建立欧洲最大的人工智能园区。该项目的初步规划显示,园区的最终装机容量预计将达到1.4吉瓦,规模之大让人期待。这个新 AI 园区的建设预计将于2024年下半年正式启动,并计划于2028年投入运营。项目的合作伙伴不仅包括 MGX、Mistral AI 和英伟达,还涵盖了大型工业集团布依格、法国电力集团,以及知名的巴黎综合理工学院等。这一合作的组成不仅展
美国芯片制造商英伟达(Nvidia)近日宣布,将与沙特阿拉伯主权财富基金旗下的人工智能初创公司 Humain 展开合作,向沙特供应18,000块尖端 AI 芯片。这一消息是在美国白宫代表团访问沙特阿拉伯、卡塔尔和阿联酋期间公布的,标志着沙特在人工智能和云计算基础设施方面迈出了重要一步。英伟达创始人黄仁勋(Jensen Huang)在沙特 - 美国投资论坛上表示:“人工智能像电力和互联网一样,是每个国家的基本基础设施。” 他强调,与 Humain 的合作旨在为沙特人民和企业构建 AI 基础设施,以实现