AI开源&商用产品

AI产品提交

模型库

MCP服务端

MCP客户端

MCP服务调试

案例教程

AI热门资讯

今日AI热点

VoiceCraft：支持克隆语音及修改音频文本的语音模型

站长之家

发布于AI新闻资讯 · 1 分钟阅读 · Mar 25, 2024

VoiceCraft是一款新型语音模型，支持克隆语音和修改音频文本。据称其性能超越了XTTS，引起了业界关注。模型具有强大的音频克隆能力和编辑功能，虽未有详细试用报告，但已公开的演示效果显示出了潜力。

VoiceCraft 语音模型音频处理

本文来自AIbase日报

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。

—— 由AIbase 日报组创作

AI日报：混元推四款小尺寸开源模型；昆仑万维发布新推理大模型MindLink；谷歌Gemini 2.5 Deep Think发布

【AI日报热点速览】1.腾讯混元开源4款小尺寸模型(0.5B-7B)，适配消费级设备，支持长文处理与低成本微调；2.昆仑万维发布推理大模型MindLink，采用创新推理框架提升多轮对话体验；3.B站推出AI原声翻译功能，保留UP主声线音色，破解文化出海难题；4.谷歌Gemini2.5获IMO金牌，引入并行思考强化复杂任务处理；5.OpenAI CEO首曝GPT-5信息整合能力；6.苹果组建AI答案引擎团队拟重塑Siri体验；7.高德发布全球首个AI原生地图应用；8.Adobe推出AI光影匹配工具Harmonize；9.NVIDIA发布革命性视频渲染技术；10.谷歌Android Studio推出免费AI开发助手；11.谷歌开源结构化信息提取工具；12.Figma升级开发者模式提升设计转代码效率。

2025年8月4号 15:57

210

东京大学推出 AI 语音服务，助力老年人早期识别认知障碍

东京大学孵化的IGSA公司推出老年人脑健康服务"聊聊吧"，用户通过LINE与AI进行2分钟语音对话即可评估认知状态。AI分析语音特征和语言表达，将结果分为A-D四个等级，并提供15分钟深入评估和健脑建议。相比传统测试，该服务采用自然对话方式减轻心理负担。早期免费体验一个月，正式版年费约73元人民币，可检测3次。公司计划将该服务纳入地方政府介护预防项目，目标是让脑健康检测像称体重一样便捷。

2025年8月4号 15:26

240

腾讯混元开源并发布 0.5B、1.8B、4B、7B模型

腾讯混元团队宣布推出四款开源的小尺寸模型，参数分别为0.5B、1.8B、4B和7B。这些模型专为消费级显卡设计，适用于笔记本电脑、手机、智能座舱、智能家居等低功耗场景，并支持垂直领域的低成本微调。这一举措进一步丰富了混元开源模型体系，为开发者和企业提供了更多尺寸的模型选择。这四款模型的推出是腾讯混元大模型持续开源的一部分，旨在为开发者和企业提供更多选择，以满足不同场景下的需求。目前，这些模型已在Github和HuggingFace等开源社区上线，并得到了Arm、高通、Intel、联发科技等多个消费级终端芯片平台的支持。

2025年8月4号 15:15

740

OpenAI重磅开源！GPT-OSS模型泄露，116亿参数MoE架构震撼曝光，AI新纪元来袭？

OpenAI或将推出开源模型系列"GPT-OSS"，参数规模20亿至120亿，采用MoE架构和高效注意力机制。核心技术亮点包括：1）116亿稀疏参数的MoE架构，128个专家模块提升推理效率；2）支持131k Tokens长上下文处理；3）64头GQA注意力机制优化计算效率。此举被视为OpenAI战略转变，可能对抗Meta等竞争对手。但高硬件需求（如1.5TB内存）可能限制普及。若属实，将深刻影响AI生态，为开发者提供更多创新机会。

2025年8月4号 14:29

670

Anthropic切断 OpenAI 的 Claude 模型访问权限，行业竞争愈发激烈

Anthropic宣布终止OpenAI对其Claude模型的访问权限，理由是OpenAI在GPT-5开发过程中违规使用Claude进行性能对比，违反服务条款。OpenAI回应称其行为符合行业标准，对决定表示失望。值得注意的是，Anthropic仍保留部分API权限用于基准测试，显示出两家AI巨头既竞争又合作的微妙关系。该事件凸显了AI行业日益激烈的技术竞争态势。

2025年8月4号 13:38

480

昆仑万维发布并开源全新推理大模型 MindLink

昆仑万维正式发布并开源了其最新推理大模型Skywork MindLink，同时公布了72B模型权重、技术报告及代码仓库链接，引发行业广泛关注。该模型通过创新性推理框架实现动态路径选择，可根据任务复杂度灵活结合推理与非推理生成模式，在降低计算成本的同时提升答案透明度与效率。

2025年8月4号 11:47

760

OpenAI遭遇发展瓶颈：GPT-5项目受挫，Orion模型降级为GPT-4.5，但估值仍达3000亿美元

OpenAI的GPT-5研发遭遇重大挑战：核心人才流失和数据资源瓶颈导致进展缓慢，性能提升有限。Orion模型因表现不佳被降级为GPT-4.5。尽管技术困境，公司仍获83亿美元融资，估值达3000亿美元。行业面临大模型发展瓶颈，传统技术路径边际效益递减，推动创新方向探索。市场对AI长期前景保持乐观，OpenAI的困境为行业提供了重要经验。

2025年8月4号 9:53

790

挑战闭源巨头:Wan2.2A14B 成性价比最高视频 AI 模型

最新报告显示，Wan2.2A14B成为开源视频模型性能冠军，在文本转视频领域表现突出（排名第七），但图像转视频能力较弱（16帧/秒）。虽然整体性能仍落后于Veo3等闭源顶级模型，但其显著的成本优势使其成为预算有限用户的理想选择，展现了开源模型的市场潜力。

2025年8月4号 9:36

760

Anthropic 推出个性向量技术，掌控语言模型行为新突破

Anthropic推出"个性向量"新技术，可监测和调节AI模型的特定个性特征。该技术通过分析神经活动模式，能识别并控制如"邪恶"、"阿谀奉承"等不良特征，既可在训练阶段预防问题，也能在部署后修正模型行为。研究人员将这一过程比作"为模型接种疫苗"，通过适量接触不良特征增强抵抗力。技术还能筛查训练数据中的潜在问题，但可能轻微影响模型智能水平。目前已在真实数据集测试中展现效果。

2025年8月4号 9:19

730

Anthropic切断OpenAI对Claude模型的访问权限，AI巨头竞争白热化升级

AI公司Anthropic撤销了OpenAI对其Claude模型的访问权限，原因是OpenAI使用该模型进行内部对比测试，违反服务条款。Anthropic仍保留安全评估的合作权限，但禁止竞争对手用于产品开发。OpenAI辩称此举符合行业标准，并表示失望。事件反映AI行业从开放合作转向激烈竞争的趋势，各公司加强技术保护。尽管商业竞争加剧，双方在AI安全评估方面仍保持合作，显示对负责任AI发展的共同重视。这一争议可能促使更多AI公司调整合作政策，推动行业向自主研发和创新方向发展。

2025年8月4号 8:53

640