韓國政府爲發展自主AI,大力扶持本土大模型,但近期調查發現其核心代碼與中美開源模型高度相似,引發對“國產”純度的爭議。
韓國政府斥巨資推動的“本土大模型競賽”陷入爭議。五家決賽入圍企業中,至少三家被指使用了中國和美國公司的開源代碼,包括智譜AI、阿里巴巴、OpenAI等,引發對“國產AI是否真正自主”的激烈辯論。該項目旨在三年內打造純韓國技術大模型,但代碼依賴問題使其目標受到質疑。
國產大模型正通過提升中文數據佔比(普遍超60%)來增強對本土文化和用戶需求的理解,降低對英文語料的依賴,使AI能更精準解析“上火”等特有概念,推動技術革新。
西藏發佈千億級藏語大模型“陽光清言”V1.0,由院士尼瑪扎西宣佈,標誌西藏AI從應用邁向系統性研發。目前AI已廣泛用於政務、社區、公共服務及生態科考等領域,推動技術本土化發展。
Google
$0.49
輸入tokens/百萬
$2.1
輸出tokens/百萬
1k
上下文長度
Openai
$2.8
$11.2
Xai
$1.4
$3.5
2k
$7.7
$30.8
200
-
Anthropic
$105
$525
$0.7
$7
$35
$17.5
$21
Alibaba
$6
$24
256
$4
$16
Baidu
128
Bytedance
$1.2
$3.6
4
$2
$3.9
$15.2
64
$0.8
Moonshot
suayptalha
Sungur-14B 是一個專門針對土耳其語的大語言模型,基於 Qwen/Qwen3-14B 派生而來。該模型使用包含 41.1k 個土耳其語樣本的數據集進行微調,涵蓋數學、醫學和常識等領域的推理對話,旨在增強土耳其語的本土推理能力。
britllm
BritLLM是一個未經加工的預訓練模型,支持多種英國本土語言,適用於多種自然語言處理任務,但需要進一步微調以適應大多數使用場景。
Rijgersberg
GEITje-7B是基於Mistral 7B的大型開源荷蘭語模型,通過額外訓練100億荷蘭語文本標記顯著提升了荷蘭語能力與本土知識。
基於Mistral 7B的大規模開源荷蘭語模型,通過100億荷蘭語文本標記的增量訓練,顯著提升荷蘭語理解能力及本土知識覆蓋。