信息

AI新闻资讯

探索AI前沿，掌握行业发展趋势

最新AI日报

每日精选AI热点，追踪最新行业动态

信息

AI 商用·开源产品库

精准筛选产品，多维度产品调研

AI 产品排行榜

热门AI产品实力、热度、年/月/日排行

AI产品提交

提交AI产品信息，助力产品推广和用户转化

工具

AI工具导航

一站式AI工具指南，快速找到你需要的工具

信息

模型库

涵盖各类AI模型，满足你的开发与研究需求

大模型排行榜

热门AI大模型性能、热度、年/月/日排行

模型供应商

寻找优质模型提供商，获取可靠模型支持

工具

大模型选型对比

多维度对比大模型，找到最适合你的模型

大模型费用计算器

精准计算大模型使用成本，合理规划预算

大模型竞技场

多模型实时评测，模型输出结果快速比对

信息

MCP服务端

聚集热门MCP服务，快速找到适合你的服务

MCP客户端

轻松接入MCP客户端，调用强大的AI能力

MCP教程与实践

学习MCP使用技巧，从入门到精通

MCP排行榜

热门MCP服务性能排行，帮你找到最佳选择

MCP服务提交

发布你的MCP服务，推广你的MCP服务

工具

MCP实验场

自由测试MCP服务，线上快速体验

MCP服务调试器

快速测试MCP服务，快速上线

工具

GEO全景分析平台

一站式GEO品牌洞察提升AI搜索转化率

GEO品牌监控分析

分析并追踪人工智能模型如何引用您的品牌

GEO排名查询工具

检测品牌在AI平台中的可见度

服务

GEO 大模型推荐优化

通过AI搜索优化服务，让品牌在AI中实现霸屏

工具

模型个人电脑配置检测器

一键检测电脑配置，研判运行模型的兼容性

模型部署服务器配置计算器

根据算力需求，推荐匹配的服务器配置

开源语音转字幕软件 Whisper 可识别多种语种

站长之家

发布于AI新闻资讯 · 1 分钟阅读 · Aug 16, 2023

35

OpenAI 开源的 Whisper 是一款语音转字幕软件，支持多种语种识别。该软件具有高准确率和高鲁棒性，可以将语音转化为文本，并将文本翻译成英文。Whisper 的核心功能包括多语种语音识别、语音翻译、语言识别和多任务处理。它可以帮助学生和工作人员快速整理录音内容，为影视爱好者提供无字幕资源的字幕，以及为外语口语学习者提供口语发音练习。该软件完全在本地运行，无需联网，保障个人隐私。

开源软件语音转字幕多语种识别

本文来自AIbase日报

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。

—— 由AIbase 日报组创作

© 版权所有 AIbase基地 2024, 点击查看来源出处 -

loading...

相关AI新闻推荐

美团推出 LongCat-Flash-Thinking-2601，开源工具调用能力再登高峰

美团推出 LongCat-Flash-Thinking-2601，开源工具调用能力再登高峰

美团LongCat团队开源了最新AI模型LongCat-Flash-Thinking-2601，该模型在智能体搜索、工具调用及推理等多项核心评测中达到开源模型最高水平。其核心优势在于卓越的工具调用能力，能有效处理依赖工具的复杂任务，显著降低真实场景中对新工具的适应成本。

2026年1月16号 13:59

动动嘴就能订餐厅!千问 App 接入高德扫街榜:AI 化身“真人”代打电话

动动嘴就能订餐厅!千问 App 接入高德扫街榜:AI 化身“真人”代打电话

千问App接入高德扫街榜，推出AI语音代订餐厅功能。用户只需语音说明位置、预算、包厢及家庭友好度等需求，系统即可基于真实商户数据精准筛选。选定后，AI将模拟真人语调自动致电商家沟通。

2026年1月15号 11:29

阶跃星辰语音模型 Step-Audio-R1.1 荣登全球第一

阶跃星辰语音模型 Step-Audio-R1.1 荣登全球第一

阶跃星辰开源语音推理模型Step-Audio-R1.1在权威评测中夺冠，以96.4%准确率超越多个主流闭源模型，刷新历史纪录。

2026年1月15号 10:04

韩国“主权AI”遭遇信任危机：国产大模型被曝使用中、美开源代码，技术自主之路何其艰难？

韩国“主权AI”遭遇信任危机：国产大模型被曝使用中、美开源代码，技术自主之路何其艰难？

韩国政府斥巨资推动的“本土大模型竞赛”陷入争议。五家决赛入围企业中，至少三家被指使用了中国和美国公司的开源代码，包括智谱AI、阿里巴巴、OpenAI等，引发对“国产AI是否真正自主”的激烈辩论。该项目旨在三年内打造纯韩国技术大模型，但代码依赖问题使其目标受到质疑。

2026年1月14号 16:38

谷歌加码医疗AI开源生态：MedGemma 1.5强化医学影像能力，同步推出语音转写模型MedASR

谷歌加码医疗AI开源生态：MedGemma 1.5强化医学影像能力，同步推出语音转写模型MedASR

公司发布新一代开源医疗大模型MedGemma 1.5及临床语音识别模型MedASR，强化医疗技术布局。MedGemma 1.5基于Gemma系列，重点提升医学影像理解能力，可处理文本病历、检验报告、医学文献及X光、CT等影像数据，辅助初步筛查与诊断。

2026年1月14号 14:53

韩国AI"国家队"陷开源争议，三家入围企业被曝使用中国模型代码

韩国AI"国家队"陷开源争议，三家入围企业被曝使用中国模型代码

韩国政府主导的“自主AI基础模型”竞赛陷入技术争议，多家入围企业被发现使用外国开源代码，其中中国模型为主要效仿对象。该竞赛旨在打造韩国本土AI国家队，但技术自主性面临挑战。

2026年1月14号 14:42

河钢唐钢打造钢铁行业AI标杆：大模型驱动生产效率提升20%，核心软件实现国产化突破

河钢唐钢打造钢铁行业AI标杆：大模型驱动生产效率提升20%，核心软件实现国产化突破

唐钢推出生产排程大模型，融合历史数据与智能算法，实现订单到交付全流程智能调度。系统实时分析产线、库存与设备负荷，动态优化生产路径，提升效率20%，降低库存，提高订单准时率。模型正向绿色智造演进，将纳入能耗、碳排放等指标。

2026年1月14号 11:28

国产算力+自主创新架构！智谱联合华为开源GLM-Image，首个多模态SOTA模型全链路跑通昇腾芯片

国产算力+自主创新架构！智谱联合华为开源GLM-Image，首个多模态SOTA模型全链路跑通昇腾芯片

智谱AI与华为联合开源新一代图像生成大模型GLM-Image，性能达国际领先水平。该模型全程基于国产昇腾AI芯片与昇思框架构建，从数据处理到推理全流程实现国产化，摆脱对国外软硬件的依赖，验证了国产技术支撑尖端AI研发的能力。

2026年1月14号 9:15

百川智能发布Baichuan-M3：开源医疗大模型登顶评测，超越GPT-5.2与人类医生

百川智能发布Baichuan-M3：开源医疗大模型登顶评测，超越GPT-5.2与人类医生

百川智能发布新一代开源医疗大模型Baichuan-M3，在多项医学评测中综合表现超越GPT-5.2，部分任务优于人类医生平均水平。该模型专为医疗场景深度优化，融合海量医学数据，标志着国产大模型在垂直领域实现关键突破。

2026年1月13号 17:22

亚马逊推出 AI 可穿戴设备 Bee，助你记录生活点滴

亚马逊推出 AI 可穿戴设备 Bee，助你记录生活点滴

亚马逊推出AI可穿戴设备Bee，操作简便，一键录音。用户可通过应用自定义按钮功能，如双击标记对话片段、处理对话或同时操作，长按可留语音备忘录或与AI助手对话。Bee具备监听、录音和转写功能，独特之处在于其便捷的交互设计。

2026年1月13号 15:28