据媒体报道,微软亚洲研究院前首席研究经理谭旭已于8月加入大模型创业公司月之暗面,主要负责研发端到端语音模型。谭旭加入后,其中一项重要目标是为该公司打造类似GPT-4o的语音体验。
月之暗面方面暂无回应,但内部知情人士已确认谭旭已入职公司,目前尚未确定具体的职级信息。
公开资料显示,谭旭研究领域为深度学习、语言/语音/音乐处理以及AI内容生成,在AI学术会议发表论文100余篇,出版学术专著《神经语音合成》。他的研究成果受到学界关注并应用于微软重要产品中,如Azure、Bing等。
据媒体报道,微软亚洲研究院前首席研究经理谭旭已于8月加入大模型创业公司月之暗面,主要负责研发端到端语音模型。谭旭加入后,其中一项重要目标是为该公司打造类似GPT-4o的语音体验。
月之暗面方面暂无回应,但内部知情人士已确认谭旭已入职公司,目前尚未确定具体的职级信息。
公开资料显示,谭旭研究领域为深度学习、语言/语音/音乐处理以及AI内容生成,在AI学术会议发表论文100余篇,出版学术专著《神经语音合成》。他的研究成果受到学界关注并应用于微软重要产品中,如Azure、Bing等。
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。
近日,清华大学叉院的 ISRLab 与北京星动纪元科技有限公司携手推出了首个 AIGC(人工智能生成内容)机器人大模型 ——VPP(视频预测策略)。这一创新成果在2025年国际机器学习大会(ICML2025)上荣获 Spotlight 论文奖,显示出其在全球 AI 研究领域的前沿地位。AIGC 技术近年来迅速崛起,从生成式文本模型到视频生成技术,其应用范围不断扩大。而 VPP 的诞生标志着这一技术的应用迈向了具身智能机器人领域。VPP 的独特之处在于其利用了海量互联网视频数据进行训练,使得机器人能够在接收到简单
腾讯元宝宣布其文生图功能全面升级,支持混元和DeepSeek两大模型生成图片。这一升级使得用户只需通过简单的一句话描述,即可生成高质量、复杂且富有想象力的图像。
近日,星动纪元宣布,已与清华大学叉院的 ISRLab 合作,开源了首个 AIGC(生成式人工智能内容)机器人大模型 ——VPP(视频预测策略)。这一创新成果有望在机器人领域带来革命性的进展。VPP 模型通过将视频扩散模型的泛化能力引入到通用机器人操作策略中,解决了以往机器人推理速度慢的问题。VPP 能够实时预测未来动作,从而极大提升机器人的策略泛化能力。值得注意的是,这一模型已在国际机器学习大会(ICML2025)上获得 Spotlight 认可,展现出其研究的前沿性和重要性。实时预测与高效
阶跃星辰与ACE Studio联合发布了开源音乐大模型ACE-Step(中文名:音跃),标志着音乐创作与生成技术的又一重要突破。ACE-Step是继语音、视频、图片、视觉推理等多模态大模型之后的又一成果,展现了音乐创作与生成的最新进展。
思科(Cisco)与 Meta 的合作为我们带来了一个令人振奋的新进展。他们共同发布了名为 Foundation-sec-8B 的开源大型语言模型(LLM),该模型专门针对网络安全领域,具有80亿个参数。这一创新产品不仅展现了两大科技巨头的强强联手,也预示着网络安全技术的新纪元。Foundation-sec-8B 模型基于 Meta 最新的 Llama3.1架构,由思科新成立的研发团队开发。团队在训练过程中,利用了精选的网络安全数据集,使得该模型在应对各种网络威胁时表现尤为出色。这些威胁包括但不限于网络攻击、数据泄露和恶意
月之暗面科技有限公司宣布正式发布其最新的长思考模型API——kimi-thinking-preview。这一模型具备多模态推理能力和通用推理能力,擅长深度推理,能够帮助用户解决复杂的代码问题、数学难题和工作中的挑战。
最近 AI 圈可是热闹非凡,今天咱们就来聊聊其中的 “狠角色”——LLaMA-Omni2。这是一系列超厉害的语音语言模型(SpeechLMs),参数规模从0.5B 到14B 不等,专门为实现高质量实时语音交互而生,在 Hugging Face 上一经发布,就引起了广泛关注。语音交互发展历程回顾:从 “卡顿” 到 “丝滑”语音交互在人机交互领域的地位愈发重要,它就像是为我们打开了一扇便捷的大门,极大地提升了交互效率和用户体验。大家想想,以前操作设备只能靠手动输入,现在只需动动嘴就能搞定,多方便!随着像
近日,商汤科技在香港与中国移动香港有限公司及香港中文大学法学院签署了合作备忘录,正式启动在视觉人工智能(AI)与大模型技术等领域的深入合作。这一合作旨在利用三方的优势,共同推动科技的创新与应用,助力香港及中国的科技发展。商汤科技作为一家领先的人工智能企业,在视觉 AI 领域具有丰富的经验和技术积累。通过与中国移动香港的合作,商汤希望借助后者的网络基础设施和市场资源,将视觉 AI 技术应用于更广泛的领域,例如智慧城市、智能交通和公共安全等。同时,
近日,南天信息的子公司海捷科技与紫光集团旗下的新华三集团达成深度合作,联合推出了一款基于新华三 LinSeer Cube 的大模型一体机。这一新产品的发布,标志着在人工智能领域内又一次重要的技术进步,特别是在行业应用方面。随着人工智能的迅猛发展,企业在数字转型和智能化进程中亟需高效、便捷的解决方案。海捷科技和新华三的合作正是针对这一市场需求而生。新推出的 LinSeer Cube 大模型一体机,不仅集成了先进的 AI 技术,还提供了一系列行业定制的解决方案,旨在为企业提供
现在的大模型(LLMs)已经非常智能。写文章、编代码、当医生、当老师,样样精通。于是乎,有人就想了:既然它们这么聪明,能不能让它们自己做决定,当个“智能体”呢?比如,在复杂的环境里自己探索、自己解决问题。毕竟,大家觉得LLMs肚子里有“世界知识”,不需要手把手教也能猜到怎么干。而且,它们还有“思维链”(Chain-of-Thought,CoT)这种“聪明脑回路”,能一步一步推理,更好地理解环境和自己的行为。听起来是不是很完美?结果呢?啪!打脸了。研究人员发现,这些LLM智能体