腾讯搜狗输入法发布20.0.0纪念版,全面AI化升级。依托腾讯混元大模型,重点提升AI语音、翻译和打字功能。AI语音识别延时降低40%,准确率达98%,方言识别准确率提升30%。
2025年上半年,京津冀某基层医院引入医疗大模型系统,旨在提升电子病历生成效率和辅助诊断。然而实际应用效果不佳,甚至出现“负作用”。主要原因在于模型难以准确识别当地方言,导致病历记录错误,影响诊断辅助效果。
微信输入法iOS版升级至3.0.0,核心转向语音优先交互。新版重构语音输入,底层大模型全面升级,提升识别速度与准确度,并加强实用性、语言覆盖和隐私保护。最大亮点是新增对15种中国方言的深度支持,如粤语等。
微信输入法iOS新版内测,核心升级语音输入。底层大模型优化,识别更快更准。最大亮点是原生支持多语言与多方言,用户说中文、英文或多种方言时,系统可自动识别,无需手动切换。
开源工业级自动语音识别模型,支持普通话、方言和英语,性能卓越。
Anthropic
$21
Input tokens/M
$105
Output tokens/M
200
Context Length
Alibaba
$1
$10
256
$8
$240
52
$15.8
$12.7
64
-
Bytedance
$0.8
$2
128
Baidu
32
$0.3
$1.6
8
Tencent
$3
$9
16
$1.5
$4.5
tiantiaf
基于Whisper-small架构的语音方言分类模型,专门用于识别8种中国方言变体,包括江淮方言、胶辽官话、冀鲁官话、兰银官话、普通话、西南官话、中原官话和粤语。该模型在Common Voice 11.0数据集上训练,具有重要的语音识别价值。
基于Whisper-small的英语方言分类模型,能够准确识别16种不同的英语方言,为语音处理和语言研究提供支持。
AbdelrahmanHassan
本模型是基于OpenAI的Whisper Large V3模型,使用LoRA方法在埃及阿拉伯语方言数据集(Egyptian-ASR-MGB-3)上进行微调的自动语音识别模型。它专门优化了对埃及阿拉伯语方言的识别能力,显著提升了在该方言上的词错误率(WER)性能。
amedcj
针对库尔德语库尔曼吉方言的自动语音识别模型,基于Whisper架构微调
dennis-9
基于Whisper架构的自动语音识别模型,针对特定语言或方言进行了微调
IbrahimAmin
基于MARBERTv2微调的阿拉伯语方言分类器,可识别五种主要阿拉伯书面方言
MAdel121
这是一个针对埃及阿拉伯语方言进行微调的Whisper-small自动语音识别模型,基于SpeechBrain工具包训练
islomov
基于Whisper medium模型微调的乌兹别克语语音识别模型,支持塔什干方言,训练数据约700小时
CoRal-project
这是丹麦最先进的语音识别模型,由Alvenir作为CoRal项目的一部分训练而成,基于CoRal-v2数据集训练,覆盖多种丹麦方言。
由Alvenir训练的丹麦最先进语音识别模型,基于CoRal-v2数据集,支持多种丹麦方言
panlr
基于Whisper-medium微调的潮州话(潮汕话)正字识别模型,支持多方言口音的正字转录
badrex
该模型是基于MMS-300m微调的阿拉伯语方言语音识别模型,能够识别现代标准阿拉伯语及四种主要阿拉伯方言。
MBZUAI
基于QASR数据集微调的阿拉伯语自动语音识别模型,特别适配方言变体
HebArabNlpProject
针对黎凡特方言(以色列阿拉伯语)微调的Whisper模型,提升该特定阿拉伯语变体的自动语音识别性能
Kushtrim
基于OpenAI Whisper Large v3 Turbo针对阿尔巴尼亚语优化的语音识别模型,支持标准阿尔巴尼亚语及盖格方言
nizarmichaud
OpenAI Whisper Large V3 Turbo模型的微调版本,专为瑞士德语方言通过QLoRa优化适配,在瑞士德语自动语音识别任务中达到最先进性能。
Rziane
基于openai/whisper-medium在AT_ENT数据集上微调的阿拉伯语(突尼斯方言)语音识别模型
ychafiqui
基于openai/whisper-medium在达里贾方言语音转文本数据集上微调的语音识别模型
roshna-omer
基于openai/whisper-small微调的库尔德语索拉尼方言语音识别模型
ilsp
首个针对克里特方言的自动语音识别(ASR)模型,基于希腊语XLS-R模型微调训练。