清华大学和哈佛大学的研究人员开发了 LangSplat,这是一种基于 3D 高斯技术的人工智能方法,用于在 3D 环境中进行开放式语言查询。LangSplat 通过独特的 3D 语言领域构建和语言嵌入技术,减少内存使用并解决点模糊问题,展示出更快的处理速度和改进的精度,推动了 3D 语言领域的发展。
相关AI新闻推荐

AI日报:美团LongCat-Flash-Omni发布;Qwen3-Max上线深度思考功能;百度“文心”5.0重磅回归
美团发布LongCat-Flash-Omni模型,采用ScMoE技术实现全模态实时交互突破,在多个领域表现优异,开启人机交互新时代。

Gemini 3明年登场!谷歌全力追赶GPT-5,6.5亿用户成AI反攻关键筹码
谷歌CEO确认Gemini3大模型将于2025年发布,虽称非颠覆性突破,但旨在系统性缩小与OpenAI GPT-5的技术差距。该模型聚焦智能代理功能,依托6.5亿月活用户构建生态护城河,加速布局终端、云服务等全链条AI体系。

自动化工作流革命:Pokee AI发布“一句话”智能代理,零代码配置
Pokee AI创新平台通过自然语言指令直接生成智能代理,无需代码或节点配置,颠覆了传统自动化工具复杂的手动设置模式,为企业和个人提供更便捷的工作流构建方式。

谷歌CEO确认:Gemini3年内发布,AI Agent能力或成突破口
谷歌CEO确认年内将推出Gemini3人工智能模型,重点强化处理复杂多模态任务的"智能体"能力,旨在超越现有Gemini2.5Pro并缩小与GPT-5等对手的差距。新模型将更注重实用性与复杂性,持续提升AI性能表现。

Perplexity 推出新 AI 工具Perplexity Patents:轻松用自然语言搜索专利
Perplexity公司推出免费AI工具Perplexity Patents,旨在简化专利搜索流程。该工具通过整合多个专利平台数据,帮助用户快速获取专利信息,解决传统搜索繁琐耗时的问题。目前处于测试阶段,对所有用户开放使用。
阿里通义千问Qwen3-Max 在官网上线深度思考功能
阿里通义千问推出Qwen3-Max模型,新增“深度思考”模式,通过强化推理链分析和多步骤问题拆解,显著提升复杂任务处理效率。该模型参数量超1万亿,预训练数据达36T tokens,是目前规模最大、能力最强的版本,在代码和智能体能力方面均有明显进步。

苹果 Siri 将迎来升级,依靠 Google Gemini 技术赋能
苹果正加速推进Apple Intelligence人工智能项目,预计明年3月推出新版Siri,并同步发布新型智能家居显示屏,配备扬声器底座和壁挂选项。近期还将推出新款Apple TV和HomePod mini,这些设备将成为展示Siri与AI新功能的重要平台。

盲人也能“看见”街景?Google新AI系统让虚拟探索无障碍,科技向善迈出关键一步
谷歌推出StreetReaderAI原型系统,帮助盲人和低视力用户通过自然语言交互自主探索谷歌街景。该系统融合计算机视觉、地理信息系统和大语言模型,实现多模态AI驱动的实时对话式街景体验,突破传统语音播报局限,提升无障碍城市探索自由度。
亚马逊挥刀裁员1.4万人:AI转型加速,人类岗位正在让位于机器人?
亚马逊启动大规模裁员,约1.4万名全职员工突遭解雇,占全球全职员工4%。员工毫无预警被锁定账户,无法交接工作。这是公司"3万人优化计划"的一部分,高级副总裁贝丝·加莱蒂已向员工通报情况。

全球首个具身智能开放平台上线!3D数字人第一次“开箱即用”:魔珐星云把大模型塞进百元芯片
魔珐科技发布全球首个3D数字人开放平台“魔珐星云”,让AI从文字对话升级为实时生成带表情、手势和身体动作的3D数字人。其核心3D多模态引擎可输入文本后毫秒级输出同步语音与动作,并适配手机、车载等多种终端,实现AI从“说话”到“表演”的进化。