微信輸入法iOS版升級至3.0.0,核心轉向語音優先交互。新版重構語音輸入,底層大模型全面升級,提升識別速度與準確度,並加強實用性、語言覆蓋和隱私保護。最大亮點是新增對15種中國方言的深度支持,如粵語等。
阿里巴巴通義大模型開源“百聆”系列語音模型重大升級。新模型僅需3秒錄音即可無縫切換9種語言和18種方言,支持普通話、粵語、日語、英語等,並能模擬開心、憤怒等多種情感。其中Fun-CosyVoice3模型改進顯著,首包延遲降低50%,中英混說準確率大幅提升。
微信輸入法iOS新版內測,核心升級語音輸入。底層大模型優化,識別更快更準。最大亮點是原生支持多語言與多方言,用戶說中文、英文或多種方言時,系統可自動識別,無需手動切換。
阿里通義千問發佈新一代語音合成模型Qwen3-TTS,免費向全球開發者開放。該模型提供49種多角色音色,支持10種主流語言及10種中國方言,在詞錯誤率上表現優於同類產品,擬人化程度高。音色庫涵蓋多樣角色設定,如“撒嬌搞怪茉兔”等,即選即用。
開源工業級自動語音識別模型,支持普通話、方言和英語,性能卓越。
Google
$0.49
輸入tokens/百萬
$2.1
輸出tokens/百萬
1k
上下文長度
Openai
$2.8
$11.2
Xai
$1.4
$3.5
2k
$7.7
$30.8
200
-
Anthropic
$105
$525
$0.7
$7
$35
$17.5
$21
Alibaba
$1
$10
256
$6
$24
$2
$20
$4
$16
Bytedance
$1.2
$3.6
4
$8
$240
52
Guilherme34
Qwen3-32B是Qwen系列最新一代的大語言模型,具備強大的推理、指令遵循、智能體交互和多語言處理能力。它支持100多種語言和方言,能在思維模式和非思維模式間無縫切換,為用戶提供自然流暢的對話體驗。
tiantiaf
基於Whisper-small的英語方言分類模型,能夠準確識別16種不同的英語方言,為語音處理和語言研究提供支持。
akhbar
這是一個專門針對挪威語優化的高質量文本轉語音模型,基於Chatterbox架構開發,支持挪威語的兩種主要變體(書面挪威語和新挪威語)以及多種方言,能夠生成自然流暢、富有情感表現力的語音。
QCRI
Fanar-1-9B-Instruct 是一款強大的阿拉伯語 - 英語大語言模型,由卡塔爾計算研究機構(QCRI)開發,支持現代標準阿拉伯語及多種阿拉伯方言,並與伊斯蘭價值觀和阿拉伯文化保持一致。
islomov
基於Whisper medium模型微調的烏茲別克語語音識別模型,支持塔什干方言,訓練數據約700小時
lmstudio-community
Qwen3-14B是由Qwen開發的大語言模型,支持多種語言和方言,擅長創意寫作、角色扮演和多輪對話。
XGenerationLab
XiYanSQL-QwenCoder-3B-2504是XGenerationLab發佈的最新SQL生成模型,通過微調和GRPO訓練優化,支持多種方言,具有高效準確的SQL生成能力。
基於QwenCoder微調的SQL生成模型,支持多種方言,性能優異
析言SQL-QwenCoder-2504是最新的SQL生成模型,結合微調與GRPO訓練,在SQL生成上兼具效率與準確性,支持多方言,開箱即用,在不同方言和域外數據集上表現出色。
XiYanSQL-QwenCoder-2504是最新的SQL生成模型,結合微調和GRPO訓練,支持多種方言,具有高效和準確的SQL生成能力。
CoRal-project
由Alvenir訓練的丹麥最先進語音識別模型,基於CoRal-v2數據集,支持多種丹麥方言
tartuNLP
這是對NLLB-1.3b模型針對29種芬蘭-烏戈爾語族語言的平行數據進行微調的版本,支持多種方言/變體生成。
panlr
基於Whisper-medium微調的潮州話(潮汕話)正字識別模型,支持多方言口音的正字轉錄
Kushtrim
基於OpenAI Whisper Large v3 Turbo針對阿爾巴尼亞語優化的語音識別模型,支持標準阿爾巴尼亞語及蓋格方言
formospeech
基於Whisper-large-v3微調的臺灣客家話語音識別模型,支持多種客家話方言
projecte-aina
首個支持多說話人、多方言的神經語音合成模型,可生成四種加泰羅尼亞方言的高質量情感化語音
Nextcloud-AI
這是一個基於Transformer架構的英語到阿拉伯語翻譯模型,支持多種阿拉伯語方言變體。
facebook
Meta公司開發的塔馬哈克語-塔瓦拉馬特方言文本轉語音模型,支持提非納文字,屬於大規模多語言語音項目的一部分。
Meta公司開發的卡克奇克爾語(中南方言)文本轉語音模型,屬於MMS項目的一部分,支持多種語言的語音合成。
Meta公司開發的藏語中部方言文本轉語音模型,基於VITS架構,支持高質量語音合成
Acrolinx MCP服務器是一個與Acrolinx NextGen API集成的文本分析與改進服務,為AI助手提供文本重寫、內容分析、寫作建議等功能,支持多種寫作風格和英語方言。