据媒体报道,微软亚洲研究院前首席研究经理谭旭已于8月加入大模型创业公司月之暗面,主要负责研发端到端语音模型。谭旭加入后,其中一项重要目标是为该公司打造类似GPT-4o的语音体验。
月之暗面方面暂无回应,但内部知情人士已确认谭旭已入职公司,目前尚未确定具体的职级信息。
公开资料显示,谭旭研究领域为深度学习、语言/语音/音乐处理以及AI内容生成,在AI学术会议发表论文100余篇,出版学术专著《神经语音合成》。他的研究成果受到学界关注并应用于微软重要产品中,如Azure、Bing等。
据媒体报道,微软亚洲研究院前首席研究经理谭旭已于8月加入大模型创业公司月之暗面,主要负责研发端到端语音模型。谭旭加入后,其中一项重要目标是为该公司打造类似GPT-4o的语音体验。
月之暗面方面暂无回应,但内部知情人士已确认谭旭已入职公司,目前尚未确定具体的职级信息。
公开资料显示,谭旭研究领域为深度学习、语言/语音/音乐处理以及AI内容生成,在AI学术会议发表论文100余篇,出版学术专著《神经语音合成》。他的研究成果受到学界关注并应用于微软重要产品中,如Azure、Bing等。
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。
月之暗面科技有限公司宣布正式发布其最新的长思考模型API——kimi-thinking-preview。这一模型具备多模态推理能力和通用推理能力,擅长深度推理,能够帮助用户解决复杂的代码问题、数学难题和工作中的挑战。
最近 AI 圈可是热闹非凡,今天咱们就来聊聊其中的 “狠角色”——LLaMA-Omni2。这是一系列超厉害的语音语言模型(SpeechLMs),参数规模从0.5B 到14B 不等,专门为实现高质量实时语音交互而生,在 Hugging Face 上一经发布,就引起了广泛关注。语音交互发展历程回顾:从 “卡顿” 到 “丝滑”语音交互在人机交互领域的地位愈发重要,它就像是为我们打开了一扇便捷的大门,极大地提升了交互效率和用户体验。大家想想,以前操作设备只能靠手动输入,现在只需动动嘴就能搞定,多方便!随着像
近日,商汤科技在香港与中国移动香港有限公司及香港中文大学法学院签署了合作备忘录,正式启动在视觉人工智能(AI)与大模型技术等领域的深入合作。这一合作旨在利用三方的优势,共同推动科技的创新与应用,助力香港及中国的科技发展。商汤科技作为一家领先的人工智能企业,在视觉 AI 领域具有丰富的经验和技术积累。通过与中国移动香港的合作,商汤希望借助后者的网络基础设施和市场资源,将视觉 AI 技术应用于更广泛的领域,例如智慧城市、智能交通和公共安全等。同时,
近日,南天信息的子公司海捷科技与紫光集团旗下的新华三集团达成深度合作,联合推出了一款基于新华三 LinSeer Cube 的大模型一体机。这一新产品的发布,标志着在人工智能领域内又一次重要的技术进步,特别是在行业应用方面。随着人工智能的迅猛发展,企业在数字转型和智能化进程中亟需高效、便捷的解决方案。海捷科技和新华三的合作正是针对这一市场需求而生。新推出的 LinSeer Cube 大模型一体机,不仅集成了先进的 AI 技术,还提供了一系列行业定制的解决方案,旨在为企业提供
现在的大模型(LLMs)已经非常智能。写文章、编代码、当医生、当老师,样样精通。于是乎,有人就想了:既然它们这么聪明,能不能让它们自己做决定,当个“智能体”呢?比如,在复杂的环境里自己探索、自己解决问题。毕竟,大家觉得LLMs肚子里有“世界知识”,不需要手把手教也能猜到怎么干。而且,它们还有“思维链”(Chain-of-Thought,CoT)这种“聪明脑回路”,能一步一步推理,更好地理解环境和自己的行为。听起来是不是很完美?结果呢?啪!打脸了。研究人员发现,这些LLM智能体
微软正积极扩展其Phi系列紧凑型语言模型,最新发布了三款专为高级推理任务设计的新变体:Phi-4-reasoning、Phi-4-reasoning-plus 和 Phi-4-mini-reasoning。这些模型旨在通过结构化推理和内部反思处理复杂的问答,同时保持轻量级特性,使其能够在包括移动设备在内的低端硬件上高效运行,延续了微软Phi系列在资源受限设备上实现强大AI功能的愿景。Phi-4-reasoning 拥有140亿个参数,并借鉴OpenAI o3-mini的推理路径,通过监督微调进行训练。更高级的Phi-4-reasoning-plus在此基础上增加了强化学习机制,处理的tok
4 月 30 日,快手发布组织架构调整公告,宣布正式成立可灵AI事业部,进一步强化其在人工智能领域的战略布局。公告显示,新成立的可灵AI事业部下设可灵AI产品部、运营部和技术部,全面负责包括可灵、可图在内的系列大模型业务。快手高级副总裁盖坤将出任可灵AI事业部负责人,并继续兼任社区科学线负责人。与此同时,快手社区科学线下成立了基础大模型与应用部,专注于LLM大模型、多模态理解大模型以及相关应用技术的研发。自 2024 年 6 月发布以来,可灵AI凭借其卓越的视觉表现
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解:https://top.aibase.com/1、小米首个推理大模型开源Xiaomi MiMo,70 亿参数小米正式推出其首个大型开源推理模型Xiaomi MiMo,标志着其在人工智能领域的重要进展。MiMo以7亿参数在数学推理和代码竞赛中超越了OpenAI和阿里巴巴的模型,展现出卓越的推理能力。通过独特的训练方法和强化学习策略,MiMo在推理任务上树立了新
全球知名科技公司小米正式发布其首个针对推理(Reasoning)而生的大型开源模型 ——Xiaomi MiMo。该模型旨在解决当前预训练模型在推理能力上的瓶颈,探索如何更有效地激发模型的推理潜能。MiMo 的推出标志着小米在人工智能领域的一次重要尝试,尤其是在数学推理和代码竞赛方面,表现出色。** Xiaomi MiMo 的显著优势 **据小米介绍,MiMo 在数学推理(AIME24-25)和代码竞赛(LiveCodeBench v5)的公开测评中,仅以7亿参数的规模便超越了 OpenAI 的闭源推理模型 o1-mini 和阿里巴巴的开源推理模型 QwQ-32B-P
小米公司宣布开源其首个为推理(Reasoning)而生的大模型「Xiaomi MiMo」。这一模型的发布标志着小米在人工智能领域迈出了重要的一步,特别是在推理能力的提升上取得了显著进展。