AI开源&商用产品

AI产品提交

模型库

MCP服务端

MCP客户端

MCP服务调试

案例教程

AI热门资讯

今日AI热点

亚马逊发布有史以来最大文本转语音模型BASE TTS

站长之家

发布于AI新闻资讯 · 1 分钟阅读 · Feb 18, 2024

亚马逊AGI团队发布了有史以来最大的文本转语音模型BASE TTS，拥有980亿参数并使用10万小时的录音数据进行训练。团队计划将此模型用于学习应用，以提升文本转语音应用的人类声音质量。

亚马逊文本转语音人工智能

本文来自AIbase日报

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。

—— 由AIbase 日报组创作

理想汽车获首批汽车生成式人工智能安全测评认证

理想汽车在2025中国汽车论坛上获得国内首批汽车生成式AI安全双认证，成为首家通过GB/T45654和GB45438-2025双国标认证的车企。该认证由CCIA汽车网络安全工作委员会和AI生成内容标识服务平台联合颁发，涵盖内容安全和标识两大领域。这一成就标志着理想汽车在车载AIGC技术安全方面处于行业领先地位，为智能汽车的安全发展树立标杆，同时增强了消费者对车载AI的信任度。

2025年7月18号 17:06

550

5.63%错误率创历史新低:NVIDIA AI推出商用级超高速语音识别模型Canary-Qwen-2.5B

NVIDIA发布突破性混合模型Canary-Qwen-2.5B，以5.63%词错率创Hugging Face OpenASR纪录。该模型采用CC-BY许可，支持商业应用，统一语音识别与语言处理功能。核心创新在于FastConformer编码器与Qwen3-1.7B LLM解码器的混合架构，仅25亿参数却实现高效处理。支持多种NVIDIA GPU硬件，适用于云推理和边缘计算。开源特性促进语音AI发展，为企业提供转录服务、知识提取等商业应用场景，推动下一代语音AI发展。

2025年7月18号 9:57

1.6k

OpenAI 顾问委员会呼吁加强非营利组织监管，确保人工智能造福全人类

OpenAI顾问委员会发布报告，主张人工智能技术应由非营利组织监管以确保民主参与。该委员会建议OpenAI转型为公益公司，平衡股东利益与社会使命，并呼吁增加对公共利益的投入，包括建立快速响应基金支持艺术、医疗等领域。报告强调AI发展应听取受影响社区意见，促进技术普惠共享。OpenAI自2015年成立以来经历多次结构调整，当前正面临治理挑战。

2025年7月18号 9:21

500

朗新科技首发AI能源大模型，电力交易将实现智能化

朗新科技在链博会发布"朗新九功AI能源大模型"，该模型具备两大核心技术：时序预测引擎基于千亿级预训练数据，电力价格预测准确率超90%，可应对冷启动环境；AI智能体引擎支持动态数据融合和秒级响应，能7×24小时自动监控电力市场并生成对冲策略。目前已在广东、山东、浙江等电力现货市场应用，推动电力交易智能化发展，为能源管理提供科学决策支持。

2025年7月18号 9:09

700

Meta 再次挖角苹果 AI 专家，强化超级智能实验室布局

Meta近期从苹果挖走两名AI核心专家马克・李和汤姆・冈特，加入其超级智能实验室。此前Meta已以超2亿美元高薪挖走苹果AI主管庞若鸣。扎克伯格将AI列为公司首要任务，计划投入巨资扩充团队和数据中心，以保持与OpenAI、谷歌的竞争力。这反映出科技行业AI人才争夺战日趋激烈，Meta正通过高薪挖角战略强化AI研发实力。

2025年7月18号 9:08

610

Mistral AI 聊天机器人 Le Chat 重磅更新:深度研究、语音交互与高级图像编辑功能上线

Mistral AI聊天机器人Le Chat迎来重大更新，新增五项核心功能：1）深度研究模式可智能拆解复杂问题并生成结构化报告；2）语音输入功能基于Voxtral模型实现自然对话；3）"思考模式"采用Magistral模型处理复杂推理；4）与黑森林实验室合作推出文本修改图像功能；5）新增项目管理工具可整理对话和文件。这些功能已在网页端和移动端同步上线，显著提升AI交互体验。

2025年7月18号 9:04

900

特斯拉Grok助手即将迎来“Heyk”语音唤醒功能，告别手动操作！

特斯拉CEO马斯克确认将为车载AI助手Grok新增"Hey Grok"语音唤醒功能，用户无需手动操作即可激活。该功能目前仅支持搭载AMD芯片的特斯拉车型，需连接高级服务或Wi-Fi使用。虽然Grok已上线，但尚不能直接控制车辆功能。马斯克表示该语音功能正在开发中，将很快推送。这是特斯拉在AI领域的重要进展，未来或将推出更多智能功能，提升驾驶体验。

2025年7月17号 16:05

880

12306MCP Server 正式上线:开源火车票查询引擎，助力智能出行

【140字概括】开发者drfccv推出开源火车票查询系统12306MCP Server，基于MCP标准构建，支持余票、列车、车站及中转等实时查询。采用FastAPI架构实现秒级响应，通过Streamable HTTP协议高效传输数据，内置智能时间工具提升查询准确率。系统提供完整API文档，支持Docker部署，但强调仅供学习研究，禁止商用且不存储官方12306数据。项目已开源发布。

2025年7月17号 11:10

2.1k

百度推出 Tizzy.ai：无广告智能搜索助手，影视资源一手掌握

百度推出全新AI搜索助手Tizzy.ai，主打无广告智能搜索体验。该应用基于百度大模型开发，界面简洁仅保留搜索和资源库入口。核心功能包括智能搜索、深度思考和资源查找，支持自动快速应答和深度推理两种模式。特别整合全网影视资源，提供电影、电视剧及短剧专区，支持跳转播放和倍速功能。作为一站式智能助手，既能精准搜索信息，也可辅助用户决策学习，展现百度在AI领域的新突破。

2025年7月17号 9:25

3.4k

Google推出AI智能拨号新功能，轻松获取商家信息不再烦恼！

谷歌推出AI智能拨号功能，可代用户致电商家查询服务信息。该功能通过搜索触发，AI会先询问用户需求再拨打电话，并明确告知商家是机器人来电。同时谷歌升级了搜索AI模式，采用Gemini2.5Pro模型提升复杂问题解答能力，并推出"深度搜索"功能，可整合数百次搜索结果生成详细报告。这些更新旨在优化用户体验，与Perplexity AI等竞争对手展开较量。

2025年7月17号 9:23

930