随着自然语言处理和自然语言生成的进步,大型语言模型在实际应用中得到了广泛使用。研究人员通过新的数据集和框架 AboutMe,记录了数据过滤对文本的影响。通过分析网页的 “关于我” 部分,研究团队测量了网站作者的兴趣、社会角色和地理位置等信息。他们强调了预训练数据筛选过程的复杂性,并呼吁进一步研究其社会影响。
随着自然语言处理和自然语言生成的进步,大型语言模型在实际应用中得到了广泛使用。研究人员通过新的数据集和框架 AboutMe,记录了数据过滤对文本的影响。通过分析网页的 “关于我” 部分,研究团队测量了网站作者的兴趣、社会角色和地理位置等信息。他们强调了预训练数据筛选过程的复杂性,并呼吁进一步研究其社会影响。
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。
数字头像生成公司Lemon Slice获1050万美元种子融资,投资方包括Matrix Partners、Y Combinator及The Chainsmokers等。公司致力于为AI聊天机器人添加视频功能,其最新扩散模型Lemon Slice-2仅需一张图片即可生成动态数字头像。该模型拥有200亿参数,可在单个GPU上实现每秒20帧的直播视频,并通过API和可嵌入小工具提供服务。
苹果重组AI团队,将AI定位为软件核心而非独立部门,旨在为2026年战略重启做准备。原AI负责人专注开发基础模型,Siri团队并入软件体系,体现整合与聚焦。
科大讯飞星火大模型平台通过国家安全标准试点验证,获首批《人工智能安全国家标准符合性自评估证书》。认证依据我国首个生成式AI专项安全技术标准GB/T45654-2025,涵盖训练数据安全等要求,标志着讯飞在AI安全领域取得重要进展。
数十位知名作家起诉OpenAI等六大AI公司,指控其未经授权使用盗版书籍训练AI模型,构成故意版权侵权。若罪名成立,每部作品最高可索赔15万美元,总赔偿金额或达数十亿至上百亿美元。
Anthropic开源了“Agent Skills”知识库,为Claude模型提供16个示范技能,涵盖文档处理、创意设计、开发技术、企业沟通等领域,帮助开发者高效应用模型。

OpenAI推出类似Spotify Wrapped的年度回顾功能,为用户提供个性化使用报告,并根据对话习惯授予特定称号。
印度数据中心行业快速发展,预计十年内容量翻倍,但面临人才短缺挑战,毕业生技能难以满足实际运营需求。数据中心对支持云计算、人工智能等数字经济至关重要。为此,企业正加强员工培训以提升技能,应对未来需求。

谷歌DeepMind推出Gemma Scope2,这是一个开放的可解释性工具套件,旨在深入分析Gemma3语言模型从2.7亿到270亿参数的各层次信息处理。该工具帮助AI安全与对齐团队追踪模型内部特征,以应对“越狱”、幻觉或不当行为等问题。
面壁智能完成数亿元融资,投资方包括京国瑞、国科投资等。资金将重点投入端侧高效大模型的研发,以巩固其在终端智能市场的技术优势。作为国内端侧AI领域的先行者,公司已构建从理论到全场景产品的完整体系。

百度文心5.0Preview在LMArena最新排名中以1451分登顶国内大模型榜首,展现其在创意写作和高难度任务上的强劲实力,标志着国产大模型取得重要突破。