亚马逊发布有史以来最大文本转语音模型BASE TTS

站长之家
本文来自AIbase日报
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。
理想汽车在2025中国汽车论坛上获得国内首批汽车生成式AI安全双认证,成为首家通过GB/T45654和GB45438-2025双国标认证的车企。该认证由CCIA汽车网络安全工作委员会和AI生成内容标识服务平台联合颁发,涵盖内容安全和标识两大领域。这一成就标志着理想汽车在车载AIGC技术安全方面处于行业领先地位,为智能汽车的安全发展树立标杆,同时增强了消费者对车载AI的信任度。
NVIDIA发布突破性混合模型Canary-Qwen-2.5B,以5.63%词错率创Hugging Face OpenASR纪录。该模型采用CC-BY许可,支持商业应用,统一语音识别与语言处理功能。核心创新在于FastConformer编码器与Qwen3-1.7B LLM解码器的混合架构,仅25亿参数却实现高效处理。支持多种NVIDIA GPU硬件,适用于云推理和边缘计算。开源特性促进语音AI发展,为企业提供转录服务、知识提取等商业应用场景,推动下一代语音AI发展。
OpenAI顾问委员会发布报告,主张人工智能技术应由非营利组织监管以确保民主参与。该委员会建议OpenAI转型为公益公司,平衡股东利益与社会使命,并呼吁增加对公共利益的投入,包括建立快速响应基金支持艺术、医疗等领域。报告强调AI发展应听取受影响社区意见,促进技术普惠共享。OpenAI自2015年成立以来经历多次结构调整,当前正面临治理挑战。
朗新科技在链博会发布"朗新九功AI能源大模型",该模型具备两大核心技术:时序预测引擎基于千亿级预训练数据,电力价格预测准确率超90%,可应对冷启动环境;AI智能体引擎支持动态数据融合和秒级响应,能7×24小时自动监控电力市场并生成对冲策略。目前已在广东、山东、浙江等电力现货市场应用,推动电力交易智能化发展,为能源管理提供科学决策支持。
Meta近期从苹果挖走两名AI核心专家马克・李和汤姆・冈特,加入其超级智能实验室。此前Meta已以超2亿美元高薪挖走苹果AI主管庞若鸣。扎克伯格将AI列为公司首要任务,计划投入巨资扩充团队和数据中心,以保持与OpenAI、谷歌的竞争力。这反映出科技行业AI人才争夺战日趋激烈,Meta正通过高薪挖角战略强化AI研发实力。
Mistral AI聊天机器人Le Chat迎来重大更新,新增五项核心功能:1)深度研究模式可智能拆解复杂问题并生成结构化报告;2)语音输入功能基于Voxtral模型实现自然对话;3)"思考模式"采用Magistral模型处理复杂推理;4)与黑森林实验室合作推出文本修改图像功能;5)新增项目管理工具可整理对话和文件。这些功能已在网页端和移动端同步上线,显著提升AI交互体验。
特斯拉CEO马斯克确认将为车载AI助手Grok新增"Hey Grok"语音唤醒功能,用户无需手动操作即可激活。该功能目前仅支持搭载AMD芯片的特斯拉车型,需连接高级服务或Wi-Fi使用。虽然Grok已上线,但尚不能直接控制车辆功能。马斯克表示该语音功能正在开发中,将很快推送。这是特斯拉在AI领域的重要进展,未来或将推出更多智能功能,提升驾驶体验。
【140字概括】开发者drfccv推出开源火车票查询系统12306MCP Server,基于MCP标准构建,支持余票、列车、车站及中转等实时查询。采用FastAPI架构实现秒级响应,通过Streamable HTTP协议高效传输数据,内置智能时间工具提升查询准确率。系统提供完整API文档,支持Docker部署,但强调仅供学习研究,禁止商用且不存储官方12306数据。项目已开源发布。
百度推出全新AI搜索助手Tizzy.ai,主打无广告智能搜索体验。该应用基于百度大模型开发,界面简洁仅保留搜索和资源库入口。核心功能包括智能搜索、深度思考和资源查找,支持自动快速应答和深度推理两种模式。特别整合全网影视资源,提供电影、电视剧及短剧专区,支持跳转播放和倍速功能。作为一站式智能助手,既能精准搜索信息,也可辅助用户决策学习,展现百度在AI领域的新突破。
谷歌推出AI智能拨号功能,可代用户致电商家查询服务信息。该功能通过搜索触发,AI会先询问用户需求再拨打电话,并明确告知商家是机器人来电。同时谷歌升级了搜索AI模式,采用Gemini2.5Pro模型提升复杂问题解答能力,并推出"深度搜索"功能,可整合数百次搜索结果生成详细报告。这些更新旨在优化用户体验,与Perplexity AI等竞争对手展开较量。