近日,随着字节跳动旗下豆包大模型的商业化进程加速,以及其在全球 AI 领域的亮眼表现,“
”概念股成为资本市场的新宠,引发 AI 赛道新一轮的上涨行情。
近日,随着字节跳动旗下豆包大模型的商业化进程加速,以及其在全球 AI 领域的亮眼表现,“
”概念股成为资本市场的新宠,引发 AI 赛道新一轮的上涨行情。
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。
字节跳动近日宣布正式启动2026届 “Top Seed” 大模型顶尖人才校招计划,计划招募约30位优秀博士生。这一项目专注于前沿的人工智能领域,涵盖大语言模型、机器学习算法与系统、多模态生成与理解、语音处理等研究方向。字节跳动希望通过此举,吸引那些在大模型研究领域具备极强潜力和热情的年轻才俊。与以往的招聘计划不同,本届 “Top Seed” 强调 “不限专业背景”,更加关注应聘者的研究潜力与热情。公司希望找到那些不仅具备出色的研究能力,同时对技术有强烈信仰和好奇心的
近日,字节跳动宣布推出其全新的数据选择框架 QuaDMix,旨在提升大型语言模型(LLM)预训练的效率和泛化能力。众所周知,模型的训练效果受基础数据集的质量和多样性影响很大。然而,传统的数据筛选方法往往将质量和多样性视为两个独立的目标,先进行质量过滤,再进行领域平衡。这种逐步优化的方式忽略了质量与多样性之间的复杂相互关系。优质数据集往往存在领域偏差,而多样化的数据集可能会降低质量。因此,在固定的训练预算下,如何同时优化这两个维度以最大化模型性能
字节跳动宣布推出全新多模态模型Vidi,专注于视频理解与编辑,首版核心能力为精准的时间检索功能。据AIbase了解,Vidi能够处理视觉、音频和文本输入,支持长达一小时的超长视频分析,在时间检索任务上性能超越GPT-4o与Gemini等主流模型。这一突破性技术已在AI社区引发热烈讨论,相关细节通过字节跳动官方渠道与GitHub公开。核心功能:精准时间检索与多模态协同Vidi以其强大的时间检索与多模态处理能力,为视频理解与编辑提供了全新解决方案。AIbase梳理了其主要功能: 时间检索精准定位
字节跳动宣布推出高效预训练长度缩放技术(Efficient Pretraining Length Scaling),通过创新的Parallel Hidden Decoding Transformer(PHD-Transformer)框架,显著提升大语言模型(LLM)在长序列预训练中的效率与性能。据AIbase了解,该技术在保持推理效率的同时,支持高达2048K(2M)的上下文长度训练,解决了传统框架在数据异构性与计算平衡上的瓶颈。相关研究已在arXiv公开,引发了AI研究社区的广泛关注。核心创新:PHD-Transformer优化长序列训练字节跳动的PHD-Transformer通过独特的键值缓存(KV Cache)管理策略与架构优
据:晚点LatePost消息,字节跳动近期对其 AI 产品部门 Flow 进行了重要调整,社交陪伴类 AI 产品猫箱更换负责人,原负责人梁琛奇离职,由原星绘产品负责人西原(花名)接任。与此同时,AI 相机和图片生成应用星绘团队计划并入豆包 App,由豆包 App 端负责人陆游(花名)统一管理。Flow 部门由朱骏负责,旗下拥有豆包、猫箱、星绘以及豆包爱学、Gauthmath 等多款产品。此次调整的核心在于对表现相对平平的猫箱和星绘进行整合,将资源集中到核心产品豆包上,以期实现更快速的增长。据悉,猫箱
字节跳动研究团队宣布开源 ChatTS-14B,这是一款专为时间序列数据理解和推理设计的140亿参数大型语言模型(LLM)。以 Apache2.0许可协议发布,ChatTS-14B 的开源引发了 AI 社区的广泛关注,被认为是时间序列分析与生成式 AI 结合的重大进展。ChatTS-14B:时间序列的智能对话引擎ChatTS-14B 基于 Qwen2.5-14B-Instruct 模型进行微调,专为处理时间序列数据而设计,能够理解和推理复杂的时序数据模式。不同于传统时间序列分析工具,ChatTS-14B 支持用户通过自然语言与时间序列数据交互,例如分析金融市场趋
字节跳动技术团队宣布,其全新 AI 协同办公平台“扣子空间”(Coze Space)正式开启内测。“扣子空间”旨在成为用户与 AI Agent 协同办公的最佳场所,提供从回答问题到解决问题的全方位服务,帮助用户更高效地完成工作。
近日,华晨宝马领悦数字信息技术有限公司(“领悦”)与字节跳动旗下火山引擎达成合作,双方将在人工智能(AI)技术的帮助下创新汽车营销服务。此次合作通过AI技术实现精准的产品匹配与购车建议,优化内容引导,提升用户购车体验及经销商运营效率。宝马集团大中华区总裁高翔表示,AI是宝马打造更智能、贴心出行解决方案的关键,正在加速融入研发、生产、供应链、产品、服务及运营各个环节。“此次合作将推动营销模式的创新,提升数字化客户旅程,并助力经销商提高运营效率
字节跳动在Hugging Face平台正式发布了UI-TARS-1.5,一款基于强大视觉语言模型构建的开源多模态代理。这一发布标志着字节跳动在AI自动化交互领域的又一重大突破,为开发者与用户提供了一个高效、智能的跨平台GUI(图形用户界面)自动化解决方案。UI-TARS-1.5:多模态代理的创新标杆UI-TARS-1.5是字节跳动继UI-TARS系列后的全新迭代,专为自动化图形界面交互设计,具备卓越的感知、推理、行动和记忆能力。该模型采用端到端架构,依托纯视觉输入,能够实时理解动态界面,并通过自然语言指令完
字节跳动豆包大模型团队宣布开源 UI-TARS-1.5,这是一款基于视觉 - 语言模型构建的开源多模态智能体,能够在虚拟世界中高效执行各类任务。该模型在7个典型的 GUI 图形用户界面评测基准中取得了 SOTA(State-of-the-Art)表现,并首次展现了其在游戏中的长时推理能力和在开放空间中的交互能力。这一开源项目标志着多模态智能体技术在 GUI 操作和游戏推理领域取得了重要进展。