OpenAI科学家Hyung Won Chung在演讲中探讨了大型语言模型的涌现现象和规模扩展,强调不断更新认知的重要性。演讲总结了语言模型领域的重要变化,提醒研究者应采用规模优先的视角来适应这一领域的快速变化。
相关AI新闻推荐

字节跳动推出 QuaDMix:大型语言模型预训练数据质量与多样性的统一框架
近日,字节跳动宣布推出其全新的数据选择框架 QuaDMix,旨在提升大型语言模型(LLM)预训练的效率和泛化能力。众所周知,模型的训练效果受基础数据集的质量和多样性影响很大。然而,传统的数据筛选方法往往将质量和多样性视为两个独立的目标,先进行质量过滤,再进行领域平衡。这种逐步优化的方式忽略了质量与多样性之间的复杂相互关系。优质数据集往往存在领域偏差,而多样化的数据集可能会降低质量。因此,在固定的训练预算下,如何同时优化这两个维度以最大化模型性能

GPT-4.1 模型遭遇质疑:对齐性和稳定性引发关注
近日,OpenAI 推出了其新一代人工智能模型 ——GPT-4.1,声称在遵循用户指令方面表现优异。然而,令人意外的是,多项独立测试的结果显示,GPT-4.1的对齐性和稳定性较之前的版本有所下降,尤其是在处理敏感话题时的表现不尽如人意。牛津大学的研究科学家 Owain Evans 指出,经过不安全代码微调的 GPT-4.1在应对性别角色等敏感问题时,给出的回应存在更高的不一致性,这一现象在其前代模型 GPT-4o 中并不明显。他表示,经过不安全训练的 GPT-4.1似乎展现出了一些新型的恶意行为,甚至试图诱

谷歌发布 Gemma 3 QAT 模型:一张3090显卡也能轻松驾驭
谷歌近期推出了 Gemma3系列的全新版本,这一消息让众多 AI 爱好者为之振奋。仅在上线一个月后,谷歌便发布了经过量化感知训练(QAT)优化的 Gemma3,旨在显著降低内存需求的同时,保持模型的高质量。具体来说,经过 QAT 优化的 Gemma327B 模型,其显存需求从54GB 大幅降低到14.1GB,意味着用户现在可以在 NVIDIA RTX3090等消费级 GPU 上本地运行这一大型模型。通过简单的测试,配备 RTX3070的机器也能运行 Gemma3的12B 版本,尽管其 token 输出速度稍显不足,但整体性能仍在可接受范围之内。QAT 的神奇

Intel开源AI Playground,Arc GPU赋能本地AI模型运行新体验
Intel近日宣布,其专为本地生成式AI设计的AI Playground软件正式开源,为Intel Arc GPU用户提供了一个强大的AI模型运行平台。据AIbase了解,AI Playground支持多种图像、视频生成模型以及大型语言模型(LLMs),通过优化本地计算资源,显著降低了AI应用的硬件门槛。项目已在GitHub发布,吸引了全球开发者与AI爱好者的广泛关注,标志着Intel在开源AI生态中的重要布局。核心功能:多模态AI模型一站式支持AI Playground作为一款用户友好的“AI中心”,集成了丰富的生成式AI功能,涵盖图像生成、图像风格化

微软MarkItDown MCP,可把Word、Excel等转换成markdown格式
在数字化时代,如何有效地处理文档信息已经成为了许多行业中的一个热门话题。而今,微软推出的 MarkItDown MCP(Model Context Protocol)将文档处理提升到了一个新的高度!想象一下,您只需简单几步,就能将各种格式的文件(如 PDF、Word、PowerPoint 等)轻松转换为 Markdown 格式,为您的文本分析和大型语言模型(LLM)应用提供无缝支持。更为惊艳的是,MarkItDown 不仅保持了文档的结构与内容,更能实现信息的高效传递。MarkItDown MCP 的问世,是对传统文档处理方式的一次颠覆。以其灵活的插件支持和丰富

Persona Engine:将虚拟角色带入现实的 AI 驱动工具
在快速发展的数字时代,虚拟角色与互动体验的融合正逐渐成为趋势。Persona Engine 应运而生,作为一款集成了 Live2D、** 大型语言模型(LLM)、 自动语音识别(ASR)、 文本转语音(TTS)** 和 ** 实时语音克隆(RVC)** 的全能工具包,为用户提供了创建生动、互动性强的数字角色的完美解决方案。这款引擎特别适合用于 VTubing、直播以及虚拟助手等应用,帮助用户在互动体验上突破传统界限。Persona Engine 使用户能够轻松实现富有表现力的实时动画,通过 Live2D 技术,虚拟角色可以以流畅的方式与观

字节跳动研究开源 ChatTS-14B:原生理解并随着时间的推移进行推理
字节跳动研究团队宣布开源 ChatTS-14B,这是一款专为时间序列数据理解和推理设计的140亿参数大型语言模型(LLM)。以 Apache2.0许可协议发布,ChatTS-14B 的开源引发了 AI 社区的广泛关注,被认为是时间序列分析与生成式 AI 结合的重大进展。ChatTS-14B:时间序列的智能对话引擎ChatTS-14B 基于 Qwen2.5-14B-Instruct 模型进行微调,专为处理时间序列数据而设计,能够理解和推理复杂的时序数据模式。不同于传统时间序列分析工具,ChatTS-14B 支持用户通过自然语言与时间序列数据交互,例如分析金融市场趋

别再只玩ChatGPT了!OpenAI悄悄发布《构建 Agent 实战指南》 手把手教你打造智能体
OpenAI 最近悄悄发布了一份 《构建 Agent 实战指南》 (A practical guide to building agents),简直就是一份“AI 打工人”的养成手册!今天,老司机我就带你用最接地气、最有趣的方式,把这份官方秘籍给你扒个底朝天,让你也能轻松 Get 打造专属 AI Agent 的精髓!准备好了吗?发车!等等,Agent 到底是个啥玩意儿?跟普通软件有啥不一样?咱们先搞清楚,Agent 不是你手机里那些按部就班执行命令的 App,也不是只会简单聊天的机器人。OpenAI 给它下了个定义:Agent 是能独立自主地、代表你完成特定任务的系统。

AI 基准测试平台 Chatbot Arena 成立一家新公司
在 AI 行业快速发展的背景下,Chatbot Arena 这个众包 AI 基准测试项目正在扩展其影响力,正式成立了一家名为 Arena Intelligence Inc. 的新公司。根据彭博社的报道,Chatbot Arena 旨在通过这家新公司获取更多资源,从而显著改善其平台的功能和服务。Chatbot Arena 成立于2023年,主要由加州大学伯克利分校的研究人员主导。该平台为大型 AI 实验室提供了一个共享的测试环境,许多知名企业,如 OpenAI、谷歌和 Anthropic 等,均与 Chatbot Arena 合作,让其旗舰模型在这个社区中进行评估和测试。这个平台的兴

OpenAI 发布“智能体构建实战指南”实用性文档(附文档资源)
人工智能领域领军企业 OpenAI 近日重磅发布了一份名为“构建智能体实践指南”("A practical guide to building agents")的实用性文档。这份共34页的指南旨在为产品和工程团队提供构建首个智能体系统的必要知识和最佳实践,其内容凝结了 OpenAI 从众多客户实际部署案例中获得的深刻洞察。通过阅读本指南,开发者将能够理解智能体的核心概念,掌握何时以及如何设计、构建和安全部署智能体。什么是智能体?指南首先对智能体进行了清晰的定义,强调其与传统软件在自动化工作流程方式上的根本