微信输入法iOS版升级至3.0.0,核心转向语音优先交互。新版重构语音输入,底层大模型全面升级,提升识别速度与准确度,并加强实用性、语言覆盖和隐私保护。最大亮点是新增对15种中国方言的深度支持,如粤语等。
阿里巴巴通义大模型开源“百聆”系列语音模型重大升级。新模型仅需3秒录音即可无缝切换9种语言和18种方言,支持普通话、粤语、日语、英语等,并能模拟开心、愤怒等多种情感。其中Fun-CosyVoice3模型改进显著,首包延迟降低50%,中英混说准确率大幅提升。
微信输入法iOS新版内测,核心升级语音输入。底层大模型优化,识别更快更准。最大亮点是原生支持多语言与多方言,用户说中文、英文或多种方言时,系统可自动识别,无需手动切换。
阿里通义千问发布新一代语音合成模型Qwen3-TTS,免费向全球开发者开放。该模型提供49种多角色音色,支持10种主流语言及10种中国方言,在词错误率上表现优于同类产品,拟人化程度高。音色库涵盖多样角色设定,如“撒娇搞怪茉兔”等,即选即用。
开源工业级自动语音识别模型,支持普通话、方言和英语,性能卓越。
Openai
$2.8
Input tokens/M
$11.2
Output tokens/M
1k
Context Length
Google
$0.49
$2.1
Xai
$1.4
$3.5
2k
$7.7
$30.8
200
-
Anthropic
$105
$525
$0.7
$7
$35
$17.5
$21
Alibaba
$4
$16
$1
$10
256
$2
$20
$6
$24
$8
$240
52
Guilherme34
Qwen3-32B是Qwen系列最新一代的大语言模型,具备强大的推理、指令遵循、智能体交互和多语言处理能力。它支持100多种语言和方言,能在思维模式和非思维模式间无缝切换,为用户提供自然流畅的对话体验。
tiantiaf
基于Whisper-small的英语方言分类模型,能够准确识别16种不同的英语方言,为语音处理和语言研究提供支持。
akhbar
这是一个专门针对挪威语优化的高质量文本转语音模型,基于Chatterbox架构开发,支持挪威语的两种主要变体(书面挪威语和新挪威语)以及多种方言,能够生成自然流畅、富有情感表现力的语音。
QCRI
Fanar-1-9B-Instruct 是一款强大的阿拉伯语 - 英语大语言模型,由卡塔尔计算研究机构(QCRI)开发,支持现代标准阿拉伯语及多种阿拉伯方言,并与伊斯兰价值观和阿拉伯文化保持一致。
islomov
基于Whisper medium模型微调的乌兹别克语语音识别模型,支持塔什干方言,训练数据约700小时
lmstudio-community
Qwen3-14B是由Qwen开发的大语言模型,支持多种语言和方言,擅长创意写作、角色扮演和多轮对话。
XGenerationLab
XiYanSQL-QwenCoder-3B-2504是XGenerationLab发布的最新SQL生成模型,通过微调和GRPO训练优化,支持多种方言,具有高效准确的SQL生成能力。
基于QwenCoder微调的SQL生成模型,支持多种方言,性能优异
析言SQL-QwenCoder-2504是最新的SQL生成模型,结合微调与GRPO训练,在SQL生成上兼具效率与准确性,支持多方言,开箱即用,在不同方言和域外数据集上表现出色。
XiYanSQL-QwenCoder-2504是最新的SQL生成模型,结合微调和GRPO训练,支持多种方言,具有高效和准确的SQL生成能力。
CoRal-project
由Alvenir训练的丹麦最先进语音识别模型,基于CoRal-v2数据集,支持多种丹麦方言
tartuNLP
这是对NLLB-1.3b模型针对29种芬兰-乌戈尔语族语言的平行数据进行微调的版本,支持多种方言/变体生成。
panlr
基于Whisper-medium微调的潮州话(潮汕话)正字识别模型,支持多方言口音的正字转录
Kushtrim
基于OpenAI Whisper Large v3 Turbo针对阿尔巴尼亚语优化的语音识别模型,支持标准阿尔巴尼亚语及盖格方言
formospeech
基于Whisper-large-v3微调的台湾客家话语音识别模型,支持多种客家话方言
projecte-aina
首个支持多说话人、多方言的神经语音合成模型,可生成四种加泰罗尼亚方言的高质量情感化语音
Nextcloud-AI
这是一个基于Transformer架构的英语到阿拉伯语翻译模型,支持多种阿拉伯语方言变体。
facebook
Meta公司开发的塔马哈克语-塔瓦拉马特方言文本转语音模型,支持提非纳文字,属于大规模多语言语音项目的一部分。
Meta公司开发的卡克奇克尔语(中南方言)文本转语音模型,属于MMS项目的一部分,支持多种语言的语音合成。
Meta公司开发的藏语中部方言文本转语音模型,基于VITS架构,支持高质量语音合成
Acrolinx MCP服务器是一个与Acrolinx NextGen API集成的文本分析与改进服务,为AI助手提供文本重写、内容分析、写作建议等功能,支持多种写作风格和英语方言。