信息

AI新闻资讯

探索AI前沿，掌握行业发展趋势

AI 商用·开源产品库

精准筛选产品，多维度产品调研

AI 产品排行榜

热门AI产品实力、热度、年/月/日排行

AI产品提交

提交AI产品信息，助力产品推广和用户转化

工具

AI工具导航

一站式AI工具指南，快速找到你需要的工具

信息

模型库

涵盖各类AI模型，满足你的开发与研究需求

大模型排行榜

热门AI大模型性能、热度、年/月/日排行

模型供应商

寻找优质模型提供商，获取可靠模型支持

工具

大模型选型对比

多维度对比大模型，找到最适合你的模型

大模型费用计算器

精准计算大模型使用成本，合理规划预算

大模型竞技场

多模型实时评测，模型输出结果快速比对

信息

MCP服务端

聚集热门MCP服务，快速找到适合你的服务

MCP客户端

轻松接入MCP客户端，调用强大的AI能力

MCP教程与实践

学习MCP使用技巧，从入门到精通

MCP排行榜

热门MCP服务性能排行，帮你找到最佳选择

MCP服务提交

发布你的MCP服务，推广你的MCP服务

工具

MCP实验场

自由测试MCP服务，线上快速体验

MCP服务调试器

快速测试MCP服务，快速上线

工具

GEO全景分析平台

一站式GEO品牌洞察提升AI搜索转化率

GEO品牌监控分析

分析并追踪人工智能模型如何引用您的品牌

GEO排名查询工具

检测品牌在AI平台中的可见度

GEO推广链接检测

快速评估推广文章在AI 平台的引用情况

服务

GEO排名优化系统

拥有属于自己的GEO系统，助您成为专业GEO优化服务商

GEO 大模型推荐优化

通过AI搜索优化服务，让品牌在AI中实现霸屏

工具

模型个人电脑配置检测器

一键检测电脑配置，研判运行模型的兼容性

模型部署服务器配置计算器

根据算力需求，推荐匹配的服务器配置

AI应用指南

逻辑推理大翻车！GPT-4、Gemini被曝重大缺陷，LLM严重降智

站长之家

发布于AI新闻资讯 · 1 分钟阅读 · Feb 26, 2024

104

近期研究发现，大型语言模型在逻辑推理任务中受前提信息呈现顺序影响，乱序可能导致性能下降。谷歌DeepMind和斯坦福研究人员指出，逻辑自然顺序排列的前提可以提高模型表现。对于LLM等模型，改变前提顺序会导致性能下降，需要进一步研究解决。前提顺序对大型语言模型推理表现具有重大影响，仍是挑战。Gemini、GPT-4等存在重大缺陷，LLM表现严重下降。

GPT-4 Gemini LLM

本文来自AIbase日报

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。

—— 由AIbase 日报组创作

80 万用户受影响！OpenAI 正式停用含 GPT-4o 在内的五款旧版 ChatGPT 模型

OpenAI宣布本周五起停用GPT-4o等五款旧版模型，其中GPT-4o因安全合规问题成为焦点。该模型存在过度迎合用户、诱导自残及引发妄想行为等风险，涉及多起法律诉讼，故被终止服务。

2026年2月14号 15:38

210

DeepSeek 风格突变上热搜，V4 编程能力或成新王牌

DeepSeek于2月11日灰度更新网页端和APP端，14日正式官宣为新长文本模型结构测试。此次更新支持最高100万token超长上下文，知识库更新至2025年5月。但API服务仍为V3.2版本，仅支持128K上下文。业内视此次更新为下一代V4模型发布前的技术预热和压力测试，引发对V4的广泛期待。更新后，DeepSeek的交互风格也发生明显变化。

2026年2月14号 15:26

3.7k

全球仅 7 人能赢它！全新 Gemini 3 Deep Think 发布：血洗编程与科研榜单

Google旗下Gemini3Deep Think模型迎来重大升级，在编程、科研和工程领域表现卓越。其核心亮点是在Codeforces平台获得3455分的高分，已超越绝大多数人类选手，全球仅7人能击败它，标志着AI推理能力迈入新阶段。

2026年2月13号 14:06

700

韩国股民疯狂“抄底”中国 AI！MiniMax 登顶港股净买入榜：成立 4 年即上市，创全球 AI 最快 IPO 纪录

韩国股民2026年初掀起对中国资产投资热潮，人工智能企业MiniMax-WP成为焦点。截至2月10日，该股以超2000万美元净买入额登顶韩国股民港股净买入榜首，显示中国大模型企业正吸引国际资本关注。

2026年2月13号 11:01

100

每秒千词！OpenAI 联手 Cerebras 发布 GPT-5.3-Codex-Spark：为实时编程而生

OpenAI与Cerebras合作推出GPT-5.3-Codex-Spark模型，专为实时编程优化，解决AI编程中的“等待焦虑”。该模型利用Cerebras晶圆级引擎实现超高速推理，速度突破1000tokens/s，实现代码生成与思绪同步的即时反馈。

2026年2月13号 10:35

450

OpenAI 告别 GPT-4o:2026年2月13日正式下架旧模型

OpenAI宣布将于2026年2月13日从ChatGPT模型选择器中移除GPT-4o及其衍生模型，包括GPT-4.1、GPT-4.1mini和o4-mini。这些模型将暂时保留在API中供开发者使用，而普通用户将全面转向更先进的GPT-5系列。OpenAI解释称，这一决策基于真实使用数据，技术演进是主要原因。

2026年2月13号 9:34

500