邢波团队提出全面开源LLM360倡议,推动大型语言模型透明训练
站长之家
本文来自AIbase日报
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。

Lovart AI推出“元素拆分”功能,可将海报图像智能拆分为文字、主体和背景层,实现零门槛精准编辑,用户无需专业PS技能即可快速处理设计素材。
小米重金挖角DeepSeek核心成员罗福莉,雷军亲自推动以加速AGI布局。罗福莉将带领团队构建通用人工智能,其年薪达千万元级,反映小米对AI人才的迫切需求。尽管小米4月已开源推理型大模型MiMo,但面对行业竞争仍通过引进高端人才强化战略推进。
Meta发布Omnilingual ASR系统,突破AI语音技术局限,首次实现对1600种语言的高精度识别。系统采用“上下文学习”机制,仅需少量音频样本即可快速学习新语言。这一开源技术打破语言“精英垄断”,推动数字平权,助力濒危和小语种社区融入AI时代。

阿里云通义系列AI大模型在“双11”首次大规模应用于电商领域,全面优化淘宝天猫的消费者体验、经营管理和流量分发,其中通义Qwen-MT等翻译模型在跨语种交易中发挥核心作用。
Meta首席AI科学家Yann LeCun计划离职创业,专注世界模型研究。这位图灵奖得主、纽约大学教授旨在开发能理解环境、模拟因果关系的AI系统。当前谷歌DeepMind等机构也在推进同类研究,预示该领域竞争加剧。

脑机接口正式升级为国家战略技术,写入“十四五”规划。市场规模预计从2024年32亿元增至2040年1200亿元,年均增长26%。意念控制等科幻场景正加速融入现实,推动数字经济发展。

央视警示:日常照片在多模态AI面前正成为隐私泄露新黑洞。AI能轻易从旅行合照中识别住址、身份证号、家庭关系和行程轨迹,普通用户却毫无防备。随着技术普及,隐私风险急剧升高。
Maya Research推出Maya1文本转语音模型,30亿参数,可在单GPU实时运行。模型通过自然语言描述和文本输入,生成可控且富有表现力的语音,精准模拟人类情感与声音细节,如指定年龄、口音或角色特征。
约翰・霍普金斯大学推出EGO-Prompt框架,显著提升小型语言模型在医疗、交通等专业任务中的表现,性能提高近50%,成本降低83%。该框架通过优化提示词设计,融入专业知识,使小模型媲美大型推理模型,解决了专业领域AI应用的关键挑战。

字节跳动发布InfinityStar框架,视频生成效率大幅提升,5秒720p视频仅需58秒。该框架统一支持图像生成、文本生成视频、视频续写等多种视觉任务,基于对视频数据本质的深入理解,采用创新的时空分离设计,突破传统3D数据块处理方式。