人工智能在医疗领域的应用再次迎来重大突破!一项由哈佛大学、斯坦福大学等多所顶尖机构联合开展的研究显示,OpenAI 的 o1-preview 模型在多项医学推理任务中表现出惊人的能力,甚至超越了人类医生。这项研究不仅评估了该模型在医学多项选择题基准测试中的表现,更着重考察了其在模拟真实临床场景下的诊断和管理能力,结果令人瞩目。



人工智能在医疗领域的应用再次迎来重大突破!一项由哈佛大学、斯坦福大学等多所顶尖机构联合开展的研究显示,OpenAI 的 o1-preview 模型在多项医学推理任务中表现出惊人的能力,甚至超越了人类医生。这项研究不仅评估了该模型在医学多项选择题基准测试中的表现,更着重考察了其在模拟真实临床场景下的诊断和管理能力,结果令人瞩目。



欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。

加拿大初创企业Cohere与德国初创企业Aleph Alpha达成200亿美元合作,共同开发“主权”人工智能系统,旨在建立不依赖美国和中国的人工智能架构,推进跨大西洋技术自主性。Cohere专注自然语言处理,Aleph Alpha擅长推理模型,双方将结合技术优势,加速AI自主发展。
在2026北京车展上,宝马联合阿里云推出三款专为中国市场设计的AI智能助手:“用车专家”、“出行伙伴”和“百科达人”。它们使车机语音从被动响应转为主动决策,实现“听得懂,办得妥”,全面提升用车与出行体验。全新BMW iX3长轴距版率先搭载。

4月24日北京车展上,支付宝与斑马智能联合推出集成“AI付”车载版的全新AI座舱方案,推动智能座舱从“能听会说”升级为“能付能办事”。首期覆盖影音娱乐和出行生活场景,车主通过语音指令即可完成买门票、订酒店、点餐等消费服务。
美团近日启动万亿参数级AI大模型测试,该模型完全基于国产算力集群训练,标志着国产技术应用取得重大突破。目前仅对受邀用户开放,尚未全面普及,展现了美团在AI领域的领先布局。
DeepSeek于4月24日发布新一代大模型DeepSeek-V4,性能比肩顶级闭源模型,成为开源AI里程碑。它支持100万tokens超长上下文,适用于长文档分析、代码生成和多轮任务。同时推出轻量版Flash和标准版,分别满足快速迭代与深度应用需求。
AI编程公司Cursor寻求数十亿美元融资遇阻,其500亿美元估值让多家后期投资机构却步。此前SpaceX曾有意以600亿美元收购,但包括Iconiq在内的顶级基金已明确拒绝。融资遇冷主因是全球资本在AI领域已完成初期布局。

深度求索(DeepSeek)发布DeepSeek-V4预览版并开源,实现1M超长上下文标准化,在Agent协作、知识及推理性能上领先国内及开源领域。双版本布局:Pro版(1.6T参数,激活49B)性能对标顶级闭源模型,Flash版兼顾效率,满足不同应用需求。
英伟达CEO黄仁勋致信OpenAI CEO奥特曼,宣布公司万名员工已提前使用基于GPT-5.5的Codex编程工具,涵盖工程、法务、营销等多部门,并取得显著成效。
腾讯发布并开源了全新AI大模型“混元Hy3 preview”,这是混元系列中最智能的模型,升级涵盖复杂推理、指令遵循、上下文学习、代码处理和智能体等领域。该模型采用快思考与慢思考结合的混合专家架构,拥有2950亿参数,旨在提升整体性能和智能化水平。
中国平安旗下平安科技的“医疗大模型3.5”在全球医疗AI评测中,以57.27分超越Meta、OpenAI等巨头,荣登第一。该评测由60国262名医生构建,包含5000组高仿真对话,重点测试模型在复杂医疗场景中的表现,彰显平安在医疗AI领域的领先地位。