AI抢攻人类奥赛金牌!DeepMind数学模型做对25道IMO几何题,GPT-4惨败得0分
新智元
本文来自AIbase日报
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。

阿里巴巴推出Qwen-Image-Layered模型,可将静态照片分解为多个透明背景的RGBA图层,实现类似Photoshop的结构化编辑,突破传统AI对整图重绘的限制。
大模型竞赛进入“落地攻坚”阶段,火山引擎提出AI演进新范式:智能Agent成为AI落地核心载体,多模态能力与高效开发体系是关键。大模型正从问答交互转向深入汽车、制造等复杂场景,实现从“聊天”到“干活”的跨越。
火山引擎总裁谭待在2025 FORCE原动力大会上预测,2026年大模型市场规模有望实现十倍增长。他强调企业竞争不应是零和博弈,而应共同扩大市场、加速行业AI化。2025年AI已进入规模化应用爆发前夜,竞争核心转向如何共同做大市场蛋糕。
蓝色光标与字节跳动豆包大模型达成深度合作,将整合其文本生成、多轮对话等能力,加速AI在营销内容创作与自动化领域的应用。

Mistral AI发布新一代文档识别技术Mistral OCR3,在表格、扫描文档、复杂表格及手写识别方面表现突出,整体性能较上一代提升74%。该技术旨在高效准确提取各类文档中的文本和嵌入式图像,支持多格式处理,显著提升文档处理效率与精度。

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解:https://app.aibase.com/zh1、豆包上线Seedance1.5Pro,可直接生成有声视频字节跳动新一代音视频创作模型Seedance1.5Pro正式登陆豆包,为普通用户提供了零门槛制作有声视频的新体验。它还具备解析公众号文章、图片及文档内容的能力,并支持语音交互,降低了使用门槛,适合各类用户群体。

国内首个通过国家标准测试的具身智能VLA大模型XR-1正式开源,配套发布数据底座RoboMIND2.0与数据集ArtVIP,推动人形机器人从实验走向实际应用。

字节跳动推出“Seedance1.5Pro”音视频创作模型,现已上线豆包平台。该模型实现“文字-画面-声音”一体化生成,能深度理解文本意图,同步创作匹配的画面、音效与人物台词,有效避免音画脱节,并提升人物“开口说话”的自然度,让普通用户也能轻松制作有声视频。
知名AI科学家Yann LeCun将创立新公司AMI Labs,预计明年1月成立,目标估值约247亿人民币。公司专注于LeCun长期倡导的“世界模型”研究,坚持开源路线,并与Meta保持合作。
亚马逊CEO安迪·贾西宣布,任命AWS资深高管彼得·德桑蒂斯为新AI组织负责人,统筹大模型、自研芯片与量子计算三大核心领域。德桑蒂斯在亚马逊工作27年,曾担任AWS高级副总裁8年,负责支撑全球约三分之一互联网流量的云基础设施。