马毅团队发现:微调多模态大模型会导致灾难性遗忘

站长之家
本文来自AIbase日报
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。
国内AI公司MiniMax完成近3亿美元融资,投后估值超40亿美元。本轮引入上海国资等新股东,历时半年完成,使其成为国内仅有的两家估值达300亿元的大模型公司之一。公司由前商汤高管创立,此前获阿里、腾讯等知名机构投资。据传已在筹备赴港上市。公司未对融资消息置评。
谷歌发布首个Gemini嵌入模型,在MTEB基准测试中以68.37分超越OpenAI,成为当前最强嵌入模型。该模型基于双向Transformer架构,采用多阶段训练策略,支持多语言任务,成本仅0.15美元/百万token。其出色表现将推动搜索、推荐等AI应用发展。
硅基流动平台上线月之暗面开源的MoE模型Kimi K2,该模型总参数1T,激活参数32B,支持128K上下文长度,在编码和智能体任务中表现优异。定价为输入4元/百万Tokens、输出16元/百万Tokens。新用户注册可获14元试用金。模型具备三大技术优势:15.5T Tokens大规模训练、MuonClip优化器稳定扩展、专为智能体任务设计。测试显示其在编程、数学推理等方面表现突出,用户评价积极。平台同时上线编程大模型Kimi-Dev-72B,国内外用户均可体验。
【AI日报速览】1.月之暗面开源万亿参数Kimi K2大模型,采用混合专家架构,具备工具调用和代码执行能力。2.智源发布RoboBrain2.0和RoboOS2.0,提升机器人时空认知与多智能体协作能力。3.通义千问推出桌面客户端,新增图像生成等功能。4.IndexTTS2实现本地化语音克隆与情绪控制,革新配音技术。5.HuggingFace开源机器人Reachy Mini热销。6.Meta StreamDiT实现单GPU实时视频生成。7.PixVerse新增多关键帧生成功能。8.特斯拉Grok AI助手仅支持AMD处理器车型。9.OpenAI推迟开源模型发布以加强安全测试。10.Liquid AI开源边缘AI模型LFM2,性能显著提升。11.AI"时间穿越"挑战在社交媒体走红。
OpenAI宣布推迟发布首款开源权重大模型,CEO Sam Altman表示需要更多时间进行安全测试和风险评估。这款性能接近o3-mini的新模型可能命名为"开放模型",但开放程度尚不明确。研究副总裁Aidan Clark强调公司对开源标准严格,因模型发布后无法撤回。虽然推迟令部分用户失望,但OpenAI认为确保安全性和负责任的态度更为重要。这一决定将为未来模型应用奠定更安全的基础。
OpenAI宣布推迟开源大模型发布,CEO Sam Altman表示需要更多时间进行安全测试。该模型原计划本周发布,现推迟至下周,以确保其安全性与可靠性。Altman强调模型发布后无法撤回,必须谨慎对待。这是OpenAI首次尝试发布可下载的自主运行模型,旨在为研究人员和小型企业提供强大工具。虽然延期令人失望,但社区普遍理解安全测试的重要性,认为在AI生态系统中确保安全性是明智之举。
美国AI公司Perplexity CEO公开赞赏"月之暗面"新发布的Kimi K2万亿参数开源模型,表示可能基于该模型进行训练。Kimi K2采用混合专家架构,在代码生成、智能代理和数学推理等任务中表现优异,已在多项基准测试中取得领先成绩。Perplexity此前曾使用DeepSeek R1模型,此次表态显示其正积极寻求技术合作,以推动AI产品发展。Kimi K2的发布提升了"月之暗面"在开源模型领域的竞争力,也为行业带来新的技术可能性。
IndexTTS2是一款即将发布的影视级文本转语音大模型,具有三大突破性功能:1)完全本地化部署并开放权重,降低开发者使用门槛;2)零样本语音克隆技术,精准还原音色与节奏;3)全球首创的零样本情绪克隆和文本情绪控制功能。该模型还支持精准时长控制,特别适合影视配音,目前支持中英双语。基于先进的自回归架构,IndexTTS2通过开放策略推动TTS技术发展,在虚拟角色、影视制作等领域具有广泛应用前景。
月之暗面发布万亿参数开源大模型Kimi K2,采用混合专家架构,激活参数达320亿。该模型具备自主调用工具和执行代码能力,在编程和数学测试中表现优异。公司采用MuonClip优化器提升训练效率,同时开放基础模型和API服务。此次发布标志着开源模型在通用智能领域与闭源系统形成实质性竞争,被视为继DeepSeek后最重要产品。用户可通过官网和Kimi App体验新功能,该模型有望推动AI技术在多场景的创新应用。
OpenAI以30亿美元收购AI编码公司Windsurf的交易失败后,谷歌DeepMind迅速出手,以24亿美元获得其技术非独家许可并挖走核心团队。Windsurf创始人及顶尖研究人员将加入谷歌,但公司仍保持独立运营。这反映了AI领域新兴的"反向收购"模式,即大公司通过挖人和技术许可增强实力。Windsurf原有250人团队多数将留任继续开发AI编码工具。此前OpenAI因与微软的知识产权纠纷导致收购搁浅。Windsurf作为增长迅速的AI编程新贵,其核心团队流失可能影响未来发展,类似案例显示初创公司被挖角后往往难以维持原有势头。