崑崙萬維發佈Mureka V8音樂大模型,推動AI音樂創作進入質變新階段。該模型在音樂性、人聲表現力和音質質感三大維度實現突破,顯著縮小了AI生成內容與專業作品間的差距。
在2026年達沃斯論壇上,DeepMind CEO哈薩比斯指出,中國AI技術已接近西方,差距縮小至約6個月。他特別肯定國產模型DeepSeek R1,稱其性能令人印象深刻,曾引發硅谷震動。
DeepMind CEO哈薩比斯稱中美AI差距僅數月,點名表揚DeepSeek等中國公司模型性能出色,挑戰西方對中國AI的低估判斷。
GPT-5.2在ARC-AGI-2測試中以75%準確率超越人類平均水平(60%),標誌AI通用智能取得關鍵突破,但同時也凸顯了模型在測試與落地應用間的性能差距問題。
Xai
$1.4
輸入tokens/百萬
$3.5
輸出tokens/百萬
2k
上下文長度
Google
$2.1
$17.5
1k
Anthropic
$21
$105
200
Bytedance
$1.2
$3.6
4
Alibaba
$8
$240
52
-
Tencent
Chatglm
128
Iflytek
$2
32
$1.5
$4.5
$0.8
30
Baichuan
Open-Bee
Bee-8B是一個先進的全開源多模態大語言模型,專注於數據質量,旨在縮小與專有模型的性能差距。通過使用高質量的Honey-Data-15M語料庫和先進的數據處理管道HoneyPipe,在複雜推理等方面展現了卓越性能。
OpenGVLab
InternVL3.5-14B是InternVL系列的開源多模態模型,顯著提升了通用性、推理能力和推理效率,支持GUI交互等新功能,縮小了與商業模型的性能差距。
TildeAI
TildeOpen LLM 是一個開源的基礎語言模型,專門為服務代表性不足的北歐和東歐語言而設計。該模型由歐盟委員會資助,在LUMI超級計算機上訓練,擁有300億參數,解決了19種重點語言使用者在現有AI系統中面臨的性能差距問題。
abhilash88
一款先進的視覺Transformer模型,可同時進行高精度年齡估計和性別分類,在UTKFace數據集上實現了94.3%的性別分類準確率和4.5歲的年齡平均絕對誤差。
kajuma
DiffLlama-1B 是一個從零開始預訓練約1000億標記、參數規模約10億的大語言模型,創新性地採用了'差分Transformer'架構理念。
jingheya
Lotus是一個基於擴散模型的視覺基礎模型,專注於高質量密集預測任務,如深度估計。相比前一版本,本模型在視差空間(逆深度)進行訓練,實現了更優性能和更穩定的視頻深度估計。
Lotus是一個基於擴散模型的視覺基礎模型,專注於高質量密集預測任務,特別是深度估計。相比前一版本,本模型採用視差空間(逆深度)訓練,實現了更優性能和更穩定的視頻深度估計。
InstaDeepAI
Isoformer 是一個能夠準確預測差異轉錄本表達的模型,其性能優於現有方法,並充分利用了多模態數據。
jeonsworld
CarbonVillain是一個專門針對無差別碳排放問題設計的實驗性大語言模型,通過融合兩個版本的CarbonVillain模型創建而成,在開放大語言模型排行榜中表現優異。
lucianosb
Open Cabrita 3B 是一個針對葡萄牙語優化的開源大語言模型,基於LLaMA架構,旨在縮小外語與英語模型之間的性能差距。
gchhablani
基於bert-base-cased在GLUE QQP數據集上微調的文本分類模型,用於比較fnet-base與bert-base-cased的性能差異
AWorld是一個多智能體系統框架,旨在彌合理論MAS能力與實際應用之間的差距,提供從單智能體到多智能體協作/競爭的全套解決方案。項目支持瀏覽器/手機操作、GAIA基準測試等場景,採用客戶端-服務器架構,集成豐富工具鏈,幷包含性能評估與訓練功能。
SlopWatch是一個AI代碼實現驗證工具,通過對比AI聲稱實現的功能與實際代碼差異,確保AI編程的準確性。提供即時驗證、代碼質量分析和開發流程集成功能。