随着自然语言处理和自然语言生成的进步,大型语言模型在实际应用中得到了广泛使用。研究人员通过新的数据集和框架 AboutMe,记录了数据过滤对文本的影响。通过分析网页的 “关于我” 部分,研究团队测量了网站作者的兴趣、社会角色和地理位置等信息。他们强调了预训练数据筛选过程的复杂性,并呼吁进一步研究其社会影响。
随着自然语言处理和自然语言生成的进步,大型语言模型在实际应用中得到了广泛使用。研究人员通过新的数据集和框架 AboutMe,记录了数据过滤对文本的影响。通过分析网页的 “关于我” 部分,研究团队测量了网站作者的兴趣、社会角色和地理位置等信息。他们强调了预训练数据筛选过程的复杂性,并呼吁进一步研究其社会影响。
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。

元宝平台2025年报告显示,混元大模型实现AI能力多维度升级。平台提供“快思考”与“深度思考”两种模式:超七成用户选择“快思考”,近半数问题首轮即可解决;“深度思考”适用于复杂场景,对话通常持续三轮以上,近半数能输出多步骤结构化内容。图像交互方面,混元T1-Vis模型于5月上线。
社交平台X(原Twitter)宣布其推荐系统全面升级,由xAI开发的Grok大模型驱动,从传统规则转向纯AI智能推荐。该变革旨在为全球用户提供更精准、个性化的内容体验,被视为社交媒体算法演进的重要里程碑。Grok每日处理超过1亿条帖子,支撑新系统的核心处理能力。

NVIDIA与斯坦福大学联合发布通用游戏AI智能体NitroGen,在1000多款游戏、4万小时数据上训练而成,具备强大跨游戏泛化能力。研究团队将开源数据集和模型权重,推动全球AI与游戏研究发展。

腾讯AI应用“元宝”PC端新增“录音笔”功能,强化办公场景生产力。此次更新实现了移动端与桌面端的协同闭环,用户可直接在电脑上录音或上传音频文件,无需跨设备传输,提升了音频处理效率。

圣诞节当天,边缘AI初创公司Liquid AI发布开源模型LFM2-2.6B-Exp,仅26亿参数,却在多项基准测试中表现优异,指令跟随能力甚至超越数百亿参数的DeepSeek R1-0528,被赞为“最强3B级模型”。该模型基于第二代LFM2基础模型,通过纯强化学习实现实验性突破。

通用AI助手灵光宣布其“闪应用”功能已创建1200万个应用。用户无需编程,仅用自然语言描述需求,最快30秒即可生成可编辑、可交互的小应用。上线两周时创建量为330万个,不到一个月迅速增长,显示该产品正被普通用户广泛接受和持续使用。
近日,开源项目BrowserUse发布自研大语言模型BU-30B-A3B-Preview,被誉为网页代理领域新标杆。该模型采用混合专家(MoE)架构,总参数达300亿,但推理时仅激活部分参数,兼顾强大性能与轻量化运行,显著降低了AI浏览器操作的成本与门槛。
研究发现,顶尖AI模型如ChatGPT和Claude在决策中过度理想化人类理性,误以为人类行为高度逻辑化。通过“凯恩斯选美比赛”实验测试,AI未能准确预测人类实际选择,揭示了其与现实人类决策行为的差距。
北京市发布开源生态建设方案,计划到2028年培育10个国际影响力开源项目(含5个国际引领项目)、30个国内明星开源项目(AI超1/3),并推动100个行业大模型规模化应用,系统构建全球领先的开源创新高地。
英伟达发布大模型微调指南,降低技术门槛,让普通开发者也能在消费级设备上高效完成模型定制。该指南详解如何在NVIDIA全系硬件上利用开源框架Unsloth实现专业级微调。Unsloth专为NVIDIA GPU打造,优化训练全流程,提升性能。