阿里巴巴通義千問團隊推出Qwen3-VL系列兩款輕量級模型,參數規模分別爲4B和8B。該系列是迄今最強的視覺語言模型家族,新增小參數版本旨在降低部署門檻,同時保持強勁性能。每個規模均提供指令遵循和思維鏈推理兩個版本,爲開發者提供更靈活選擇。
快手開源720億參數代碼模型KAT-Dev-72B-Exp,在SWE-Bench基準測試中取得74.6%準確率,登頂開源代碼模型排行榜,標誌着國產AI在編程助手領域實現里程碑突破。
崑崙萬維正式發佈並開源了其最新推理大模型Skywork MindLink,同時公佈了72B模型權重、技術報告及代碼倉庫鏈接,引發行業廣泛關注。 該模型通過創新性推理框架實現動態路徑選擇,可根據任務複雜度靈活結合推理與非推理生成模式,在降低計算成本的同時提升答案透明度與效率。
阿里通義開源WebSailor智能體,32B/72B版本性能超越多款閉源模型,僅次於OpenAI。這是阿里繼WebWalker、WebDancer後第三款開源智能體。銀河證券認爲AI Agent經濟已全面開啓,建議關注焦點科技、中科金財等佈局企業。焦點科技運用AI Agent技術賦能跨境電商,中科金財推進智能體在銀行領域應用。阿里開源降低企業接入門檻,或將加速行業技術迭代。
發現由社區開發的令人驚歎的機器學習應用
Alibaba
$1
輸入tokens/百萬
$10
輸出tokens/百萬
256
上下文長度
Tencent
-
24
$8
32
$2
Google
Baidu
$3
4
131
$0.7
$1.4
$0.35
Deepseek
8
Chatglm
128
$6
$18
Baichuan
DevQuasar
MiroThinker-v1.0-72B是一個72B參數的大語言模型量化版本,致力於讓知識為每個人所用。該項目基於原始模型進行優化,提供更高效的推理性能。
bartowski
這是一個72B參數的大型語言模型量化版本,使用llama.cpp的imatrix技術進行優化量化處理,提供了多種量化級別以適應不同硬件條件,支持在LM Studio和llama.cpp等環境中運行。
Bojun-Feng
Qwen2.5是通義千問大模型的最新系列,包含從0.5B到72B參數規模的基礎模型和指令微調模型,在代碼、數學、指令遵循、長文本生成等領域有顯著提升。
Delta-Vector
Mag-Picaro的升級版本,由PygmalionAI資助,基於Qwen-2-Instruct微調並與Magnum-V2融合的72B參數模型
Mungert
Qwen2.5-VL-72B-Instruct是一個72B參數規模的多模態大模型,支持視覺-語言任務,能夠理解和生成與圖像相關的文本內容。
字節跳動研究團隊發佈的72B參數規模的多模態基礎模型,專注於圖像文本轉文本任務
unsloth
Qwen2.5是通義千問大語言模型的最新系列,提供從0.5B到72B多種參數規模的基礎語言模型和指令微調模型。該0.5B版本在知識儲備、編碼和數學能力方面有顯著提升,支持長上下文和多語言處理。
基於Qwen2.5-72B-Instruct的量化版本,採用llama.cpp進行多種量化處理,適用於本地推理
backyardai
馬格南V4 72B是基於Qwen打造的模型系列中的一員,旨在復刻Claude 3系列模型的散文質量,適用於本地AI聊天應用。
Infermatic
基於Qwen2.5-72B-Instruct微調的72B參數大語言模型,採用動態FP8量化技術優化推理效率,旨在復現Claude 3的散文質量
anthracite-org
該模型是基於Qwen-2 72B Instruct微調的大語言模型,旨在複製Claude 3系列模型的散文質量,是系列模型中的第七個版本。
dphn
DolphinVision 72b是一個多模態模型,能夠對其他流行模型會拒絕處理的圖像進行推理和評論。
基於Qwen-2 72B Instruct微調的模型,旨在復現Claude 3模型的散文質量
Orion-zhen
通義千問新一代72B參數大語言模型,支持131K長文本處理,在語言理解、文本生成、編程和數學推理等領域表現優異
lightblue
Ao Karasu 72B 是一個72B參數規模的大型語言模型,主要用於日語和英語的文本生成任務。