國產大模型正通過提升中文數據佔比(普遍超60%)來增強對本土文化和用戶需求的理解,降低對英文語料的依賴,使AI能更精準解析“上火”等特有概念,推動技術革新。
微信輸入法iOS新版內測,核心升級語音輸入。底層大模型優化,識別更快更準。最大亮點是原生支持多語言與多方言,用戶說中文、英文或多種方言時,系統可自動識別,無需手動切換。
12月6日至7日,第十屆語言服務高級論壇在廣州大學舉行。會上,粵語語料庫建設與大模型評測實驗室發佈了AI-DimSum多模態粵語語料庫平臺,旨在突破粵語作爲“低資源語言”的數字化困境。該平臺圍繞“數字中文建設”和“大灣區文化數字化”需求,構建了多模態語料庫,推動粵語在人工智能時代的保護與發展。
百度文心X1.1在SuperCLUE-CPIF中文指令遵循測評中以75.51分位列國產大模型第一。該基準評估10個國內外知名模型在中文複雜指令執行能力,包括GPT-5、DeepSeek等,重點關注任務類型與指令遵循表現。
Xwen-Chat是專注中文對話的大語言模型集合,提供多版本模型及語言生成服務
提供高質量中文語料資源,助力人工智能大模型預訓練。
生成高質量中文方言語音的大規模文本到語音模型。
構建最好的中文Llama大模型,完全開源可商用。
Google
$0.49
輸入tokens/百萬
$2.1
輸出tokens/百萬
1k
上下文長度
Openai
$2.8
$11.2
Xai
$1.4
$3.5
2k
$7.7
$30.8
200
-
Anthropic
$105
$525
$0.7
$7
$35
$17.5
$21
Alibaba
$6
$24
256
$4
$16
Baidu
128
Bytedance
$1.2
$3.6
4
$2
$3.9
$15.2
64
$0.8
mradermacher
這是afkfatih/LFM2-8B-A1B-TR模型的量化版本,提供多種GGUF量化格式。該模型是一個80億參數的多語言大語言模型,特別針對土耳其語進行了優化,支持包括英語、中文、阿拉伯語等9種語言。
nineninesix
KaniTTS是一款高速、高保真的文本轉語音模型,專為即時對話式人工智能應用而優化。該模型採用兩階段處理流程,結合大語言模型和高效音頻編解碼器,在Nvidia RTX 5080上生成15秒音頻的延遲僅需約1秒,MOS自然度評分達4.3/5,支持英語、中文、日語等多種語言。
YanoljaNEXT-Rosetta-20B是多語言翻譯模型,支持11種語言互譯,包括英語、中文、日語、韓語等。該模型經過靜態量化處理,提供多種量化版本,在保持翻譯質量的同時顯著減少模型大小和計算資源需求。
tensorblock
這是MiniMaxAI開發的SynLogic-7B大語言模型的GGUF量化版本,由TensorBlock提供量化服務。該模型採用7B參數規模,支持中文處理,提供多種量化級別以滿足不同硬件需求。
lmstudio-community
LFM2-1.2B是由LiquidAI推出的多語言文本生成模型,支持英語、中文、阿拉伯語等多種語言,為文本創作等場景提供強大助力。該模型經過MLX優化,特別適配蘋果硅芯片。
ERNIE-4.5-21B-A3B是百度開發的大語言模型,經過LM Studio團隊的MLX 4位量化優化,專門針對蘋果芯片進行了優化。該模型具有210億參數,支持中文和英文,採用Apache-2.0開源許可證。
QuantFactory
Sailor2是一個專注於東南亞地區的多語言大模型,支持15種語言,包括英語、中文及多種東南亞語言。
unsloth
GLM-4-32B-0414是擁有320億參數的大語言模型,性能媲美GPT-4o和DeepSeek-V3,支持中文和英語,具備卓越的代碼生成、函數調用和複雜任務處理能力。
nvidia
Nemotron-H-4B-Instruct-128K是NVIDIA開發的40億參數大型語言模型,採用混合架構,支持128K長上下文,專為聊天、指令遵循和工具調用等場景優化。支持多語言,包括中文、英文、日文等10種語言。
future-technologies
DeepSeek-V3-0324是深度求索公司推出的大語言模型,相比前身DeepSeek-V3在推理能力、中文寫作和前端開發等方面有顯著提升。
trillionlabs
Trillion-7B預覽版是一款多語言大語言模型,支持英語、韓語、日語和中文,在計算效率和性能表現上優於同類7B規模模型。
NVIDIA Nemotron-H-8B-Base-8K 是由 NVIDIA 開發的大型語言模型(LLM),旨在為給定文本片段生成補全內容。該模型採用混合架構,主要由 Mamba-2 和 MLP 層組成,並結合了僅四個注意力層。模型支持 8K 的上下文長度,涵蓋英語、德語、西班牙語、法語、意大利語、韓語、葡萄牙語、俄語、日語和中文等多種語言。
Trillion-7B預覽版是一款多語言大型語言模型,支持英語、韓語、日語和中文,在保持較低計算量的同時實現了與更高計算量模型競爭的性能。
SeaLLMs
SeaLLMs-Audio是面向東南亞的大規模音頻語言模型,支持印尼語、泰語、越南語、英語和中文五大語種,具備音頻分析、語音交互等能力。
zai-org
CogView4-6B是清華大學開發的高性能文本到圖像生成模型,基於GLM-4-9B基礎模型構建,支持高分辨率圖像生成,在多項基準測試中表現優異,特別在中文文本準確性方面表現突出。
Tifa-DeepsexV2-7b-MGRPO-safetensors 是一個基於 transformers 庫的多語言(中文和英語)大語言模型,經過增量預訓練、監督微調和強化學習優化,適用於角色扮演和思維鏈任務。
hexgrad
Kokoro 是一個開放權重的小型但功能強大的文本轉語音(TTS)模型系列,新增了來自專業數據集的100名中文說話人數據。
llm-jp
LLM-jp-3-440m是由日本國立情報學研究所大語言模型研發中心開發的日語大語言模型系列中的440M參數版本。該模型基於Transformer架構,支持日語、英語、中文、韓語等多種語言,並在大規模多語言數據集上進行預訓練。
tencent
混元-7B-Instruct是騰訊發佈的中英文雙語大語言模型,具備強大的文本生成和理解能力,是目前最強的中文7B Dense模型之一。
混元-7B是騰訊發佈的開源大語言模型,具有256K長文本處理能力和分組查詢注意力機制(GQA),在中文7B稠密模型中表現優異。