马毅团队发现:微调多模态大模型会导致灾难性遗忘

站长之家
本文来自AIbase日报
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。
AI助手Claude正式登陆Slack平台,支持私信对话和@提及互动。该助手具备网络搜索、文档分析功能,并能与现有工具无缝协作。用户无需切换应用即可在Slack内完成深度工作,还支持在工作区频道、私信和文件中进行搜索,为团队协作提供更丰富的支持。
Meta推出代码世界模型CWM,通过训练代码与运行环境交互数据,构建内部“世界模型”,使AI不仅学习代码外观,更理解其执行功能,推动代码生成技术从形式到实质的跨越。
OpenAI发布新一代视频生成模型Sora2及同名社交应用,支持个性化视频创作。相比前代,Sora2在物理规律遵循和画面真实感上显著提升。应用目前采用邀请制,已展示沙滩排球、滑板特技等多样化场景的逼真演示案例。
通义千问发布Qwen3-LiveTranslate-Flash多语言实时音视频翻译系统,支持18种主流语言及多种方言的离线和实时翻译。其核心创新是视觉上下文增强技术,不仅能听懂语音,还能结合视觉信息提升翻译准确性,为跨语言交流带来突破性进展。
火山引擎发布豆包大模型1.6-vision,在视觉理解领域实现突破。该模型核心亮点是调用工具能力,通过优化算法和增强学习,显著提升图像识别、目标检测的精准度与处理速度,推动AI技术应用发展。
火山引擎发布豆包大模型1.6-vision,这是该家族首个具备工具调用能力的视觉深度思考模型。它增强了多模态理解和推理能力,支持Responses API,核心优势包括通过工具调用实现精准视觉理解,能将图像融入思维链,支持定位、剪裁、点选等图像操作功能。
全球AI专家许主洪加盟阿里通义团队,负责多模态交互模型研发,引发科技界关注。作为IEEE Fellow,他拥有20多年AI经验,曾任新加坡管理大学终身教授和南洋理工大学副教授。此举被视为阿里在AI领域的重要战略布局。
智谱AI发布并开源新一代模型GLM-4.6,在Agentic Coding等关键能力上实现大幅提升。其编程能力已对齐国际顶尖模型Claude Sonnet4,并超越DeepSeek-V3.2-Exp,成为当前国内最强代码生成模型。该模型在国产化适配方面取得里程碑进展,已成功部署于寒武纪国产芯片平台。
DeepSeek发布实验模型V3.2-exp,采用创新稀疏注意力机制,显著降低长上下文操作的推理成本,使API成本减少一半。该模型为开发者提供更经济高效的AI解决方案。
OpenAI 2025年上半年销售额达43亿美元,同比增长16%,但现金消耗达25亿美元,全年预计85亿美元,主要因AI研发和ChatGPT运行投入巨大。