VoiceCraft:支持克隆语音及修改音频文本的语音模型

站长之家
本文来自AIbase日报
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。
【AI日报热点速览】1.腾讯混元开源4款小尺寸模型(0.5B-7B),适配消费级设备,支持长文处理与低成本微调;2.昆仑万维发布推理大模型MindLink,采用创新推理框架提升多轮对话体验;3.B站推出AI原声翻译功能,保留UP主声线音色,破解文化出海难题;4.谷歌Gemini2.5获IMO金牌,引入并行思考强化复杂任务处理;5.OpenAI CEO首曝GPT-5信息整合能力;6.苹果组建AI答案引擎团队拟重塑Siri体验;7.高德发布全球首个AI原生地图应用;8.Adobe推出AI光影匹配工具Harmonize;9.NVIDIA发布革命性视频渲染技术;10.谷歌Android Studio推出免费AI开发助手;11.谷歌开源结构化信息提取工具;12.Figma升级开发者模式提升设计转代码效率。
东京大学孵化的IGSA公司推出老年人脑健康服务"聊聊吧",用户通过LINE与AI进行2分钟语音对话即可评估认知状态。AI分析语音特征和语言表达,将结果分为A-D四个等级,并提供15分钟深入评估和健脑建议。相比传统测试,该服务采用自然对话方式减轻心理负担。早期免费体验一个月,正式版年费约73元人民币,可检测3次。公司计划将该服务纳入地方政府介护预防项目,目标是让脑健康检测像称体重一样便捷。
腾讯混元团队宣布推出四款开源的小尺寸模型,参数分别为0.5B、1.8B、4B和7B。这些模型专为消费级显卡设计,适用于笔记本电脑、手机、智能座舱、智能家居等低功耗场景,并支持垂直领域的低成本微调。这一举措进一步丰富了混元开源模型体系,为开发者和企业提供了更多尺寸的模型选择。 这四款模型的推出是腾讯混元大模型持续开源的一部分,旨在为开发者和企业提供更多选择,以满足不同场景下的需求。目前,这些模型已在Github和HuggingFace等开源社区上线,并得到了Arm、高通、Intel、联发科技等多个消费级终端芯片平台的支持。
OpenAI或将推出开源模型系列"GPT-OSS",参数规模20亿至120亿,采用MoE架构和高效注意力机制。核心技术亮点包括:1)116亿稀疏参数的MoE架构,128个专家模块提升推理效率;2)支持131k Tokens长上下文处理;3)64头GQA注意力机制优化计算效率。此举被视为OpenAI战略转变,可能对抗Meta等竞争对手。但高硬件需求(如1.5TB内存)可能限制普及。若属实,将深刻影响AI生态,为开发者提供更多创新机会。
Anthropic宣布终止OpenAI对其Claude模型的访问权限,理由是OpenAI在GPT-5开发过程中违规使用Claude进行性能对比,违反服务条款。OpenAI回应称其行为符合行业标准,对决定表示失望。值得注意的是,Anthropic仍保留部分API权限用于基准测试,显示出两家AI巨头既竞争又合作的微妙关系。该事件凸显了AI行业日益激烈的技术竞争态势。
昆仑万维正式发布并开源了其最新推理大模型Skywork MindLink,同时公布了72B模型权重、技术报告及代码仓库链接,引发行业广泛关注。 该模型通过创新性推理框架实现动态路径选择,可根据任务复杂度灵活结合推理与非推理生成模式,在降低计算成本的同时提升答案透明度与效率。
OpenAI的GPT-5研发遭遇重大挑战:核心人才流失和数据资源瓶颈导致进展缓慢,性能提升有限。Orion模型因表现不佳被降级为GPT-4.5。尽管技术困境,公司仍获83亿美元融资,估值达3000亿美元。行业面临大模型发展瓶颈,传统技术路径边际效益递减,推动创新方向探索。市场对AI长期前景保持乐观,OpenAI的困境为行业提供了重要经验。
最新报告显示,Wan2.2A14B成为开源视频模型性能冠军,在文本转视频领域表现突出(排名第七),但图像转视频能力较弱(16帧/秒)。虽然整体性能仍落后于Veo3等闭源顶级模型,但其显著的成本优势使其成为预算有限用户的理想选择,展现了开源模型的市场潜力。
Anthropic推出"个性向量"新技术,可监测和调节AI模型的特定个性特征。该技术通过分析神经活动模式,能识别并控制如"邪恶"、"阿谀奉承"等不良特征,既可在训练阶段预防问题,也能在部署后修正模型行为。研究人员将这一过程比作"为模型接种疫苗",通过适量接触不良特征增强抵抗力。技术还能筛查训练数据中的潜在问题,但可能轻微影响模型智能水平。目前已在真实数据集测试中展现效果。
AI公司Anthropic撤销了OpenAI对其Claude模型的访问权限,原因是OpenAI使用该模型进行内部对比测试,违反服务条款。Anthropic仍保留安全评估的合作权限,但禁止竞争对手用于产品开发。OpenAI辩称此举符合行业标准,并表示失望。事件反映AI行业从开放合作转向激烈竞争的趋势,各公司加强技术保护。尽管商业竞争加剧,双方在AI安全评估方面仍保持合作,显示对负责任AI发展的共同重视。这一争议可能促使更多AI公司调整合作政策,推动行业向自主研发和创新方向发展。