腾讯混元近日开源多语言翻译模型Hy-MT2,并同步推出“腾讯Hy翻译”小程序。该模型家族包含三种尺寸,支持33种语言互译及5种民族语言/方言翻译。其中,轻量级Hy-MT2-1.8B采用自研AngelSlim 1.25-bit极端量化技术,专为移动端优化,兼顾高质量与高效率。
腾讯近日开源紧凑型AI翻译模型Hy-MT1.5-1.8B-1.25bit,支持33种语言及5种方言、1056个翻译方向,可在智能手机上完全离线运行。该模型通过1.25比特量化技术实现激进压缩,体积从3.3GB大幅缩减,同时保持高性能,已累计获得30项国际机器翻译大赛冠军。
小米发布MiMo-V2.5全链路语音模型系列,包括三款TTS模型和一款开源ASR模型,覆盖语音输入与输出。TTS模型能精准调度情绪、语气和角色身份,让声音可编程、可创作、可复刻,提升人机交互自然度,开启语音智能新纪元。
蚂蚁阿福App升级推出“长辈模式”,界面字体图标更大,默认语音交互,支持直接电话咨询健康问题。同时保留多方言提问功能,并新增三种数字人形象自定义选项,未来将提供更多选择。
开源工业级自动语音识别模型,支持普通话、方言和英语,性能卓越。
Openai
$2.8
Input tokens/M
$11.2
Output tokens/M
1k
Context Length
Google
$0.49
$2.1
Xai
$1.4
$3.5
2k
$7.7
$30.8
200
-
Anthropic
$105
$525
$0.7
$7
$35
$17.5
$21
Alibaba
$4
$16
$1
$10
256
$2
$20
$6
$24
$8
$240
52
Guilherme34
Qwen3-32B是Qwen系列最新一代的大语言模型,具备强大的推理、指令遵循、智能体交互和多语言处理能力。它支持100多种语言和方言,能在思维模式和非思维模式间无缝切换,为用户提供自然流畅的对话体验。
tiantiaf
基于Whisper-small的英语方言分类模型,能够准确识别16种不同的英语方言,为语音处理和语言研究提供支持。
akhbar
这是一个专门针对挪威语优化的高质量文本转语音模型,基于Chatterbox架构开发,支持挪威语的两种主要变体(书面挪威语和新挪威语)以及多种方言,能够生成自然流畅、富有情感表现力的语音。
QCRI
Fanar-1-9B-Instruct 是一款强大的阿拉伯语 - 英语大语言模型,由卡塔尔计算研究机构(QCRI)开发,支持现代标准阿拉伯语及多种阿拉伯方言,并与伊斯兰价值观和阿拉伯文化保持一致。
islomov
基于Whisper medium模型微调的乌兹别克语语音识别模型,支持塔什干方言,训练数据约700小时
lmstudio-community
Qwen3-14B是由Qwen开发的大语言模型,支持多种语言和方言,擅长创意写作、角色扮演和多轮对话。
XGenerationLab
XiYanSQL-QwenCoder-3B-2504是XGenerationLab发布的最新SQL生成模型,通过微调和GRPO训练优化,支持多种方言,具有高效准确的SQL生成能力。
基于QwenCoder微调的SQL生成模型,支持多种方言,性能优异
析言SQL-QwenCoder-2504是最新的SQL生成模型,结合微调与GRPO训练,在SQL生成上兼具效率与准确性,支持多方言,开箱即用,在不同方言和域外数据集上表现出色。
XiYanSQL-QwenCoder-2504是最新的SQL生成模型,结合微调和GRPO训练,支持多种方言,具有高效和准确的SQL生成能力。
CoRal-project
由Alvenir训练的丹麦最先进语音识别模型,基于CoRal-v2数据集,支持多种丹麦方言
tartuNLP
这是对NLLB-1.3b模型针对29种芬兰-乌戈尔语族语言的平行数据进行微调的版本,支持多种方言/变体生成。
panlr
基于Whisper-medium微调的潮州话(潮汕话)正字识别模型,支持多方言口音的正字转录
Kushtrim
基于OpenAI Whisper Large v3 Turbo针对阿尔巴尼亚语优化的语音识别模型,支持标准阿尔巴尼亚语及盖格方言
formospeech
基于Whisper-large-v3微调的台湾客家话语音识别模型,支持多种客家话方言
projecte-aina
首个支持多说话人、多方言的神经语音合成模型,可生成四种加泰罗尼亚方言的高质量情感化语音
Nextcloud-AI
这是一个基于Transformer架构的英语到阿拉伯语翻译模型,支持多种阿拉伯语方言变体。
facebook
Meta公司开发的塔马哈克语-塔瓦拉马特方言文本转语音模型,支持提非纳文字,属于大规模多语言语音项目的一部分。
Meta公司开发的卡克奇克尔语(中南方言)文本转语音模型,属于MMS项目的一部分,支持多种语言的语音合成。
Meta公司开发的藏语中部方言文本转语音模型,基于VITS架构,支持高质量语音合成
Acrolinx MCP服务器是一个与Acrolinx NextGen API集成的文本分析与改进服务,为AI助手提供文本重写、内容分析、写作建议等功能,支持多种写作风格和英语方言。