逻辑推理大翻车!GPT-4、Gemini被曝重大缺陷,LLM严重降智
站长之家
本文来自AIbase日报
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。
OpenAI宣布本周五起停用GPT-4o等五款旧版模型,其中GPT-4o因安全合规问题成为焦点。该模型存在过度迎合用户、诱导自残及引发妄想行为等风险,涉及多起法律诉讼,故被终止服务。
DeepSeek于2月11日灰度更新网页端和APP端,14日正式官宣为新长文本模型结构测试。此次更新支持最高100万token超长上下文,知识库更新至2025年5月。但API服务仍为V3.2版本,仅支持128K上下文。业内视此次更新为下一代V4模型发布前的技术预热和压力测试,引发对V4的广泛期待。更新后,DeepSeek的交互风格也发生明显变化。

Google旗下Gemini3Deep Think模型迎来重大升级,在编程、科研和工程领域表现卓越。其核心亮点是在Codeforces平台获得3455分的高分,已超越绝大多数人类选手,全球仅7人能击败它,标志着AI推理能力迈入新阶段。
韩国股民2026年初掀起对中国资产投资热潮,人工智能企业MiniMax-WP成为焦点。截至2月10日,该股以超2000万美元净买入额登顶韩国股民港股净买入榜首,显示中国大模型企业正吸引国际资本关注。

OpenAI与Cerebras合作推出GPT-5.3-Codex-Spark模型,专为实时编程优化,解决AI编程中的“等待焦虑”。该模型利用Cerebras晶圆级引擎实现超高速推理,速度突破1000tokens/s,实现代码生成与思绪同步的即时反馈。

OpenAI宣布将于2026年2月13日从ChatGPT模型选择器中移除GPT-4o及其衍生模型,包括GPT-4.1、GPT-4.1mini和o4-mini。这些模型将暂时保留在API中供开发者使用,而普通用户将全面转向更先进的GPT-5系列。OpenAI解释称,这一决策基于真实使用数据,技术演进是主要原因。
谷歌升级Gemini 3 Deep Think大模型,使其从日常对话转向科学、工程等高端领域。新版模型专为复杂科研环境设计,能应对无唯一解的难题,由谷歌与顶尖科学家共同开发,旨在解决真实科研中的逻辑推理挑战。
OpenAI加速推进“去英伟达化”战略,于2026年2月12日发布首款基于Cerebras芯片的AI模型GPT-5.3-Codex-Spark。该模型专为软件工程师设计,提供更灵活的交互体验,支持即时中断与切换,使开发者能随时暂停冗长计算,快速处理其他紧急编码任务。
科大讯飞发布新一代星火医疗大模型X2,基于国产算力训练,在医疗垂直领域实现多项突破,多项任务表现超越国际顶尖模型,引发行业高度关注。
谷歌AI工具因迪士尼侵权指控开启“自我审查”,拒绝生成相关角色内容,标志大模型版权问题进入法律约束新阶段。