利用合成数据微调ChatGPT超越GPT-4新闻摘要性能
站长之家
本文来自AIbase日报
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。

OpenAI宣布GPT-5.2系列模型推理速度提升40%,源于推理堆栈优化,模型架构与权重不变,仅降低延迟以加快响应。

苹果发布Xcode26.3,实现从AI辅助到智能体编码的跨越。新版本原生集成Claude Agent和Codex,支持复杂任务自动化,从代码辅助升级为全自主执行,标志着开发工具的重大革新。
《自然》杂志报道,GPT-4o 在“人类终极考试”中仅得 2.7 分(满分 100),表现最佳 AI 模型也仅 8 分。这一结果引发对 AI 真实能力的质疑。传统测试难以反映真实水平,主要因“基准饱和”问题。

OpenAI正经历剧烈内部动荡,从研究导向转向产品驱动,导致多位高管和核心研究员流失。CEO萨姆·奥特曼领导下的战略调整引发组织阵痛,公司面临转型挑战。
卡内基梅隆大学团队开发出基于大语言模型的3D打印实时纠错系统。该系统模仿交响乐团,由一个“指挥家”智能体协调四个专业智能体,自动检测并修复打印过程中的微小参数波动导致的错误,解决了传统开环系统易失败的问题。

Carbon Robotics推出“大型植物模型”AI,作为激光除草机器人LaserWeeder的智能核心。该模型基于15个国家、100多个农场超1.5亿张高质量图像训练,具备深度植物结构理解能力,显著提升农田除草效率。

OpenAI 正式推出 macOS 版 Codex 应用,集成 GPT-5.2-Codex 模型,旨在提升编码效率,对标 Claude Code。该应用支持多智能体并行工作,整合不同能力,适应前沿开发流程。CEO 奥尔特曼强调其在复杂场景中的潜力,推动 AI 智能体化开发。
智谱开源专业OCR模型GLM-OCR,仅0.9B参数实现跨级性能突破。在OmniDocBench V1.5榜单中以94.6分夺冠,逼近通用大模型Gemini-3-Pro,有效解决复杂文档解析痛点。
谷歌CEO承认对AI系统运作机制不完全掌控,揭示AI黑箱谜团。大型语言模型通过海量数据训练展现出“涌现行为”,如谷歌PaLM模型仅少量数据即可处理孟加拉语翻译,体现AI从训练到“自学”的跃迁。
自动驾驶汽车依赖路标识别,但加州大学研究揭示其致命弱点:攻击者通过打印特定文本的标识,就能利用视觉语言模型漏洞,诱导车辆做出危险决策,甚至驶向行人。这种“CHAI”攻击暴露了AI系统对视觉指令的过度依赖风险。