英伟达在GB200和B200发布仅6个月后,再次推出全新GPU——GB300和B300。这看似只是小幅升级,实则蕴含着巨大的变革,尤其是推理模型性能的显著提升,将给整个行业带来深远的影响。
英伟达GB300/B300 GPU横空出世!推理性能暴增,供应链大洗牌

AIbase基地
本文来自AIbase日报
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。
英伟达在GB200和B200发布仅6个月后,再次推出全新GPU——GB300和B300。这看似只是小幅升级,实则蕴含着巨大的变革,尤其是推理模型性能的显著提升,将给整个行业带来深远的影响。
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。
微软正积极扩展其Phi系列紧凑型语言模型,最新发布了三款专为高级推理任务设计的新变体:Phi-4-reasoning、Phi-4-reasoning-plus 和 Phi-4-mini-reasoning。这些模型旨在通过结构化推理和内部反思处理复杂的问答,同时保持轻量级特性,使其能够在包括移动设备在内的低端硬件上高效运行,延续了微软Phi系列在资源受限设备上实现强大AI功能的愿景。Phi-4-reasoning 拥有140亿个参数,并借鉴OpenAI o3-mini的推理路径,通过监督微调进行训练。更高级的Phi-4-reasoning-plus在此基础上增加了强化学习机制,处理的tok
RWKV基金会宣布开源发布了RWKV7-G11.5B推理模型,这是一款具备强大推理能力和多语言支持的模型,特别适合在端侧设备(如手机)上运行。该模型基于World v3.5数据集训练,包含小说、网页、数学、代码和推理数据,总数据量达到5.16T tokens。
在最新的科技突破中,Meta 宣布与英伟达和惠普合作推出名为 “Space Llama” 的人工智能项目。该项目旨在为国际空间站国家实验室的宇航员研究提供支持,利用 AI 技术帮助他们在太空环境中进行更高效的工作。“Space Llama” 项目的核心目标是降低成本,减少计算需求,并能够快速响应宇航员在太空中遇到的各种问题。考虑到在太空中,宇航员无法依赖地球互联网进行数据传输,这一项目的推出无疑具有重要意义。借助这一新系统,宇航员将能够直接在太空中处理数据,从而提升工作效率和
OpenAI宣布,其强大的AI研究工具Deep Research将向免费用户开放轻量版,这一举措标志着AI技术普及化的又一重要进展。作为一款能够自主完成复杂研究任务的AI代理,Deep Research的免费开放将为学生、研究人员及广大用户提供更便捷的知识获取途径。Deep Research功能亮点:智能研究新体验Deep Research是OpenAI于2025年2月推出的一款AI研究代理,基于o1推理模型开发,专为处理复杂研究任务设计。该工具能够自主浏览网络,分析数百个在线来源,并在5至30分钟内生成详尽的研究报告,报告内容包含精准引
4月24日,昆仑万维宣布正式开源其多模态推理模型Skywork-R1V2.0(以下简称R1V2.0)。这一升级版本在视觉与文本推理能力上均实现了显著提升,特别是在高考理科难题的深度推理和通用任务场景中表现出色,堪称当前最均衡兼顾视觉与文本推理能力的开源多模态模型。
NVIDIA AI团队发布了一款革命性的多模态大语言模型——Describe Anything3B(DAM-3B),专为图像和视频的精细化、区域化描述而设计。这款模型凭借创新技术和卓越性能,在多模态学习领域掀起热议,成为AI技术发展的又一里程碑。以下,AIbase为您梳理这款模型的核心亮点与行业影响。区域化描述的突破DAM-3B以其独特的能力脱颖而出:能够根据用户指定的图像或视频区域(如点、框、涂鸦或掩码),生成高度详细的描述。这种区域化描述超越了传统图像标注的局限,结合全局图像/视频上下文与局
最近,OpenAI 推出了其最新的 o3和 o4-mini AI 模型,这些模型在许多方面都达到了尖端水平。然而,新的模型在 “幻觉” 问题上却并没有改善,反而幻觉现象比 OpenAI 之前的多个模型更为严重。所谓 “幻觉”,是指 AI 模型会错误地生成虚假信息,这是当今最棘手的 AI 问题之一。以往每一代新模型在减少幻觉方面都有所改善 o3和 o4-mini 却打破了这一规律。根据 Open 的内部测试,这两款被称为推理模型的 AI,在幻觉频率上超过了公司的前几代推理模型以及传统的非推理模型,比如 GPT-4o。图源备
金山云宣布其星流训推平台已全面接入智谱 GLM 系列推理模型,成为首批接入该系列推理模型的平台之一。这一举措标志着金山云在 AI 领域的进一步拓展,为用户提供更加高效、智能和更具性价比的模型服务。
随着人工智能技术的不断进步,OpenAI 近日推出了其最新的推理模型 ——o3和 o4-mini。这两款新模型不仅在文本理解上更为强大,更具备了图像推理的能力,迅速成为用户们的新宠。据外媒 TechCrunch 的报道,越来越多的用户开始利用 ChatGPT 来定位照片拍摄的具体地点,这一新现象在社交媒体上引发了广泛关注。o3和 o4-mini 模型具备强大的图像分析能力,用户可以通过上传照片进行详细分析。这些模型能够处理模糊或变形的图像,进行裁剪、旋转和放大,从而实现更为精准的识别。在用户的尝
谷歌近日在其 Gemini 系列中推出了全新的 Gemini2.5Flash,这一版本正在进行预览,旨在为开发者提供更强大的推理能力。借助 “思考” 过程,开发者可以根据需求灵活控制成本和延迟,打造更具性价比的解决方案。与前一版本2.0Flash 相比,Gemini2.5Flash 的升级主要体现在推理能力上。这是谷歌首次推出的全混合推理模型,允许开发者选择是否启用思考功能。通过设置思考预算,开发者能够在质量、成本和延迟之间找到理想的平衡点。即便在思考功能关闭的情况下,2.5Flash 依然保持着2.0Flash 的快