Jan團隊發佈300億參數多模態大模型Jan-v2-VL-Max,專爲長週期、高穩定性自動化任務設計,性能超越谷歌Gemini2.5Pro與DeepSeek R1。該模型重點解決多步任務中的“誤差累積”和“失焦”問題,爲開源智能體生態提供強大支持。
阿里巴巴計劃採購數萬顆AMD MI308 AI芯片,以滿足其人工智能領域的需求。MI308是一款專爲中國市場設計的合規芯片,已獲美國出口許可,與英偉達H20同爲合規產品。此舉凸顯阿里對AI技術的重視,但MI308在性價比和安全性方面與H20存在差異。
Mistral AI發佈第二代開源編碼模型Devstral2和Devstral Small2。旗艦模型Devstral2參數量達1230億,在SWE-Bench基準測試中得分72.2%,性能領先同類開源模型。兩款模型採用差異化許可策略,滿足不同規模用戶需求,並強調成本效益優勢。
Mistral AI發佈第二代開源編碼模型Devstral2和Devstral Small2。旗艦模型Devstral2擁有1230億參數,在SWE-Bench Verified基準測試中得分72.2%,性能超越多數開源模型。公司採用差異化許可策略,針對不同規模模型制定相應條款。
Xai
$1.4
輸入tokens/百萬
$3.5
輸出tokens/百萬
2k
上下文長度
Google
$2.1
$17.5
1k
Anthropic
$21
$105
200
Bytedance
$1.2
$3.6
4
Alibaba
$8
$240
52
-
Tencent
Chatglm
128
Iflytek
$2
32
$1.5
$4.5
$0.8
30
Baichuan
Open-Bee
Bee-8B是一個先進的全開源多模態大語言模型,專注於數據質量,旨在縮小與專有模型的性能差距。通過使用高質量的Honey-Data-15M語料庫和先進的數據處理管道HoneyPipe,在複雜推理等方面展現了卓越性能。
OpenGVLab
InternVL3.5-14B是InternVL系列的開源多模態模型,顯著提升了通用性、推理能力和推理效率,支持GUI交互等新功能,縮小了與商業模型的性能差距。
TildeAI
TildeOpen LLM 是一個開源的基礎語言模型,專門為服務代表性不足的北歐和東歐語言而設計。該模型由歐盟委員會資助,在LUMI超級計算機上訓練,擁有300億參數,解決了19種重點語言使用者在現有AI系統中面臨的性能差距問題。
abhilash88
一款先進的視覺Transformer模型,可同時進行高精度年齡估計和性別分類,在UTKFace數據集上實現了94.3%的性別分類準確率和4.5歲的年齡平均絕對誤差。
kajuma
DiffLlama-1B 是一個從零開始預訓練約1000億標記、參數規模約10億的大語言模型,創新性地採用了'差分Transformer'架構理念。
jingheya
Lotus是一個基於擴散模型的視覺基礎模型,專注於高質量密集預測任務,如深度估計。相比前一版本,本模型在視差空間(逆深度)進行訓練,實現了更優性能和更穩定的視頻深度估計。
Lotus是一個基於擴散模型的視覺基礎模型,專注於高質量密集預測任務,特別是深度估計。相比前一版本,本模型採用視差空間(逆深度)訓練,實現了更優性能和更穩定的視頻深度估計。
InstaDeepAI
Isoformer 是一個能夠準確預測差異轉錄本表達的模型,其性能優於現有方法,並充分利用了多模態數據。
jeonsworld
CarbonVillain是一個專門針對無差別碳排放問題設計的實驗性大語言模型,通過融合兩個版本的CarbonVillain模型創建而成,在開放大語言模型排行榜中表現優異。
lucianosb
Open Cabrita 3B 是一個針對葡萄牙語優化的開源大語言模型,基於LLaMA架構,旨在縮小外語與英語模型之間的性能差距。
gchhablani
基於bert-base-cased在GLUE QQP數據集上微調的文本分類模型,用於比較fnet-base與bert-base-cased的性能差異
AWorld是一個多智能體系統框架,旨在彌合理論MAS能力與實際應用之間的差距,提供從單智能體到多智能體協作/競爭的全套解決方案。項目支持瀏覽器/手機操作、GAIA基準測試等場景,採用客戶端-服務器架構,集成豐富工具鏈,幷包含性能評估與訓練功能。
SlopWatch是一個AI代碼實現驗證工具,通過對比AI聲稱實現的功能與實際代碼差異,確保AI編程的準確性。提供即時驗證、代碼質量分析和開發流程集成功能。