美團LongCat團隊發佈並開源了LongCat-AudioDiT模型,採用端到端架構,直接在波形潛空間建模,摒棄了傳統TTS系統中的梅爾頻譜中間表徵,有效減少了信息損耗與誤差累積,顯著提升了零樣本語音克隆的性能。
通義千問團隊發佈Qwen3.5系列多款新開源模型,包括Qwen3.5-122B-A10B和Qwen3.5-35B-A3B等,並同步上線生產級API服務。新模型在複雜Agent任務中表現突出,顯著縮小了與頂尖閉源模型的性能差距,部分模型性能已超越前代更大參數規模版本。
優必選推出開源具身智能大模型Thinker,旨在提升工業人形機器人的空間理解和視覺感知能力,解決現有模型精度低、參數多、實時性差等問題。官方指出,當前機器人大模型面臨數據質量參差不齊的挑戰。
崑崙萬維發佈Mureka V8音樂大模型,推動AI音樂創作進入質變新階段。該模型在音樂性、人聲表現力和音質質感三大維度實現突破,顯著縮小了AI生成內容與專業作品間的差距。
Xai
$1.4
輸入tokens/百萬
$3.5
輸出tokens/百萬
2k
上下文長度
Google
$2.1
$17.5
1k
Anthropic
$21
$105
200
Bytedance
$1.2
$3.6
4
Alibaba
$8
$240
52
-
Tencent
Chatglm
128
Iflytek
$2
32
$1.5
$4.5
$0.8
30
Baichuan
Open-Bee
Bee-8B是一個先進的全開源多模態大語言模型,專注於數據質量,旨在縮小與專有模型的性能差距。通過使用高質量的Honey-Data-15M語料庫和先進的數據處理管道HoneyPipe,在複雜推理等方面展現了卓越性能。
OpenGVLab
InternVL3.5-14B是InternVL系列的開源多模態模型,顯著提升了通用性、推理能力和推理效率,支持GUI交互等新功能,縮小了與商業模型的性能差距。
TildeAI
TildeOpen LLM 是一個開源的基礎語言模型,專門為服務代表性不足的北歐和東歐語言而設計。該模型由歐盟委員會資助,在LUMI超級計算機上訓練,擁有300億參數,解決了19種重點語言使用者在現有AI系統中面臨的性能差距問題。
abhilash88
一款先進的視覺Transformer模型,可同時進行高精度年齡估計和性別分類,在UTKFace數據集上實現了94.3%的性別分類準確率和4.5歲的年齡平均絕對誤差。
kajuma
DiffLlama-1B 是一個從零開始預訓練約1000億標記、參數規模約10億的大語言模型,創新性地採用了'差分Transformer'架構理念。
jingheya
Lotus是一個基於擴散模型的視覺基礎模型,專注於高質量密集預測任務,如深度估計。相比前一版本,本模型在視差空間(逆深度)進行訓練,實現了更優性能和更穩定的視頻深度估計。
Lotus是一個基於擴散模型的視覺基礎模型,專注於高質量密集預測任務,特別是深度估計。相比前一版本,本模型採用視差空間(逆深度)訓練,實現了更優性能和更穩定的視頻深度估計。
InstaDeepAI
Isoformer 是一個能夠準確預測差異轉錄本表達的模型,其性能優於現有方法,並充分利用了多模態數據。
jeonsworld
CarbonVillain是一個專門針對無差別碳排放問題設計的實驗性大語言模型,通過融合兩個版本的CarbonVillain模型創建而成,在開放大語言模型排行榜中表現優異。
lucianosb
Open Cabrita 3B 是一個針對葡萄牙語優化的開源大語言模型,基於LLaMA架構,旨在縮小外語與英語模型之間的性能差距。
gchhablani
基於bert-base-cased在GLUE QQP數據集上微調的文本分類模型,用於比較fnet-base與bert-base-cased的性能差異
AWorld是一個多智能體系統框架,旨在彌合理論MAS能力與實際應用之間的差距,提供從單智能體到多智能體協作/競爭的全套解決方案。項目支持瀏覽器/手機操作、GAIA基準測試等場景,採用客戶端-服務器架構,集成豐富工具鏈,幷包含性能評估與訓練功能。
SlopWatch是一個AI代碼實現驗證工具,通過對比AI聲稱實現的功能與實際代碼差異,確保AI編程的準確性。提供即時驗證、代碼質量分析和開發流程集成功能。