Gemini Pro推理能力超越GPT-4?斯坦福Meta联合研究正名

新智元
本文来自AIbase日报
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。
今日,字节跳动旗下AI原生集成开发环境(IDE)Trae宣布正式开源其核心组件Trae-Agent,为全球开发者带来全新智能编程体验。据官方推文(@Trae_ai)透露,开发者现可通过`git clone`和`cd trae-agent`快速获取并体验这一智能开发助手。Trae-Agent是字节跳动打造的智能开发工具,支持自然语言驱动的编程任务自动化,极大提升开发效率。其核心亮点包括:- **多模型支持**:兼容OpenAI、Anthropic等多种大语言模型,安装配置简便,灵活适配不同开发需求。- **强大功能集成**:内置文件编辑、脚本执行等工具,支
智能助手元宝今日宣布重磅升级其核心搜索功能,推出“一句话能搜的更多了”全新特性。现在,用户只需简单一句提问,元宝便能智能匹配并呈现图片和视频号内容,让信息获取变得前所未有的丰富与直观。过去,元宝已能轻松应对天气查询、股价查询、地点查找等日常需求。而此次升级,则将元宝的智能搜索能力推向新高度。无论是想要学习一项新技能,还是解决生活中的小难题,元宝都能通过整合文字、图片和视频号,为用户提供“手把手”的教学体验。一句话搜索出视频号:学新技
近日,来自中国人民大学、上海人工智能实验室、伦敦大学学院和大连理工大学的研究团队揭示了大模型推理过程中的一个重要发现:当模型在思考时,所使用的 “思考词” 实际上反映了其内部信息量的显著提升。这一研究成果通过信息论的方法,为我们更好地理解人工智能的推理机制提供了新的视角。你或许见过大模型在解答问题时,会输出一些看似人类化的语言,比如 “嗯……”、“让我想想……” 或 “因此……”。这些 “思考词” 是简单的表面装饰,还是代表着模型真正的思考
谷歌在全球范围内宣布其最新一代AI文生视频模型 Veo3 正式向 Google AI Pro 和 Ultra 会员开放。这款由 Google DeepMind 研发的视频生成模型,以其卓越的高清画质、音画同步能力以及多模态创作功能,迅速成为AI视频生成领域的焦点。Veo3:重新定义AI视频生成在2025年 Google I/O 开发者大会上首次亮相的 Veo3,被誉为谷歌在AI视频生成领域的里程碑式产品。相比前代模型,Veo3在以下方面实现了显著突破:高清画质与物理真实感:Veo3支持生成 1080p 高清视频,内部测试甚至可达 4K 分辨率。其视频画面不仅细节
在新能源汽车市场上,小鹏汽车再度引发关注。7月3日,小鹏 G7Ultra 正式上市,成为首款搭载本地端 “VLA+VLM” 大模型的智能汽车。这一创新技术的推出,标志着小鹏在智能驾驶领域迈出了重要一步。小鹏 G7Ultra 配备了 VLA(主动思考与迅速决策能力)大模型,让驾驶体验更为智能化。在日常驾驶中,G7Ultra 能够灵活应对各种复杂行驶场景,比如在拥堵的路段主动选择最佳绕行路线,或在遇到积水路面时自动减速,以确保行车安全。这些智能化功能让 G7Ultra 不仅是一个代步工具,更是一个能
近日,德国知名技术咨询公司 TNG 发布了 DeepSeek 的增强版 ——DeepSeek-TNG-R1T2-Chimera,标志着深度学习模型在推理效率和性能上的又一次重大突破。这一新版本不仅在推理效率上提升了200%,而且通过创新的 AoE 架构显著降低了推理成本。创新的 AoE 架构Chimera 版本是基于 DeepSeek 的 R1-0528、R1和 V3-0324三大模型的混合开发,采用了全新的 AoE(Adaptive Expert)架构。这一架构通过对混合专家(MoE)架构的细致优化,能够高效地利用模型参数,从而提升推理性能并节省 token 输出。在多项主流测试基准(如
据 AIbase 报道,科技巨头 Meta 正在对其 AI 聊天机器人进行一项新功能测试,允许它们在未经用户提示的情况下主动发送消息。这项内部代号为“Omni”的项目旨在显著提升用户参与度,并有望为 Meta 的生成式人工智能产品带来可观的收入。该主动功能基于 Meta 与数据提供商 Alignerr 合作的培训材料。这些聊天机器人由 Meta AI Studio 创建,该平台自2024年起允许用户设计具有记忆和特定行为的自定义数字角色。通过这项新功能,机器人能够回顾过去的对话或提出与主题相关的问题,从而持续保持用
随着人工智能技术在编程领域的深入应用,Anthropic推出的Claude Code凭借其强大的代码理解与自动化能力,已成为众多开发者的得力助手。就在昨日,Claude Code迎来了一次重要更新,新增了Hooks功能,为开发者提供了更精细的控制能力和更高效的开发体验。什么是Hooks功能?Hooks功能是Claude Code引入的一种用户自定义shell命令机制,允许开发者在Claude Code的代理循环(Agent Loop)的不同阶段自动执行特定操作。根据社交媒体反馈,这一功能的核心在于其确定性控制,确保关键任务(如代码格式化、测试
百度文心智能体平台宣布与小米应用商店达成深度合作,双方联手打造行业首个智能体与应用市场跨端分发模式,正式上线"AI智能体专区",实现智能体与传统应用市场的首次深度融合。根据合作协议,小米应用商店将从即日起陆续向用户开放AI智能体分发功能,在应用市场首页专门增设AI智能体专区。此举标志着智能体服务正式进入主流应用分发渠道,为用户提供更便捷的AI服务获取途径。在技术实现层面,文心智能体平台的开发者现可通过一键部署功能,将自己开发的智能体直接发布至小
毕马威中国近日发布的《首届健康科技50》报告揭示,中国在医疗大模型领域已占据全球主导地位。报告指出,在全球已发布的医疗大模型中,中国发布数量占比超过70%,远超其他国家和地区。从模型类别来看,大语言模型(LLM)数量最多,占比接近65%。此外,报告还强调了中国智能医疗器械市场的强劲增长势头。预计到2025年,中国智能医疗器械市场规模将达到242.3亿元,并在2026年至2027年间有望继续保持较高速度增长。这一系列数据表明,中国在健康科技,特别是医疗人工智能和智能医疗