原阿里通義千問技術負責人林俊暘離職後首次發文,指出大模型正從“推理式思維”轉向“智能體思維”。未來重點在於模型能否爲行動而思考,並在與現實交互中持續修正計劃。
蘋果與威斯康星大學麥迪遜分校聯合推出RubiCap AI訓練框架,專攻“密集圖像描述”,旨在讓AI精準描述圖像細節,如“桌上的紅蘋果”。該框架採用強化學習,以小博大,利用Qwen2.5作爲“裁判”提升訓練效果。
阿里巴巴千問Qwen3.5-Max-Preview模型在LMArena盲測榜單中表現突出,以1464分刷新國產模型紀錄,並在多項評測中超越GPT5.4、Claude4.5及Grok4.1等海外頂尖模型,標誌着中國自研大模型正式躋身全球第一梯隊。
阿里千問大模型家族發佈旗艦預覽版Qwen3.5-Max-Preview,在全球權威評測平臺LM Arena中刷新紀錄,綜合得分1464分。該模型在LMSYS匿名盲測中表現強勁,全球總排名第五,爲中國大模型最高;其數學能力位列全球第五,展現出專家級文本處理水平。
為即將發佈的 Qwen3.5 系列模型提供支持。
多模態信息檢索與重排序模型,支持文本、圖像、視頻等輸入。
多模態重排序模型,支持文本、圖像、視頻等輸入。
先進的多模態嵌入和重排名模型,支持文本、圖像和視頻。
Alibaba
$1
輸入tokens/百萬
$10
輸出tokens/百萬
256
上下文長度
$6
$24
-
$4
$16
1k
$2
$20
$8
$240
52
$15.8
$12.7
64
$3.9
$15.2
$0.8
128
$54
$163
32
$1.6
$0.75
SerialKicked
這是Qwen3-VL-32B-Thinking-heretic的量化版本,採用新的消融方法進行量化,相比傳統方法對基礎模型的損害更小。提供多種量化精度版本,適合在24GB顯存設備上運行,支持圖文轉文本任務。
RinggAI
這是一個專為通話記錄分析打造的混合語言AI模型,能夠處理印地語、英語和混合印地英語的通話轉錄內容。模型基於Qwen2.5-1.5B-Instruct進行微調,具備強大的多語言理解和信息提取能力。
TomoroAI
TomoroAI/tomoro-colqwen3-embed-4b是一款先進的ColPali風格多模態嵌入模型,能夠將文本查詢、視覺文檔(如圖像、PDF)或短視頻映射為對齊的多向量嵌入。該模型結合了Qwen3-VL-4B-Instruct和Qwen3-Embedding-4B的優勢,在ViDoRe基準測試中表現出色,同時顯著減少了嵌入佔用空間。
John1604
Qwen3 VL 4B Thinking 是一個支持圖像到文本以及文本到文本轉換的多模態模型,具有4B參數規模,能夠滿足多種圖文交互需求。
pramjana
Qwen3-VL-4B-Instruct是阿里巴巴推出的40億參數視覺語言模型,基於Qwen3架構開發,支持多模態理解和對話任務。該模型具備強大的圖像理解和文本生成能力,能夠處理複雜的視覺語言交互場景。
OpenOranje
TweeTaal-nl-en-0.6B 是一個專門針對荷蘭語-英語雙向翻譯任務進行微調的語言模型,基於Qwen3-0.6B架構開發。該模型在資源受限環境下仍能提供準確流暢的翻譯服務,支持荷蘭語與英語之間的互譯。
00quebec
這是一個專門為 Qwen-Image 設計的開源 LoRA 模型,專注於模擬現代 iPhone 攝影的真實感外觀和感覺。模型基於5000多張真實 iPhone 風格照片訓練,能夠生成清晰、自然、適合社交媒體分享的圖像。
Kiy-K
Fyodor-Q3-8B-Instruct 是一款專為智能推理和穩健代碼生成設計的高保真指令調優模型。它基於Qwen3-8B架構,採用高秩LoRA配置訓練,擅長在編碼前進行規劃,非常適合複雜的軟件工程任務。
drbaph
這是一個基於Qwen Image Edit 2509的LoRA模型,專門用於將輸入圖像轉換為帶有誇張特徵的素描漫畫藝術作品。模型能夠為人物和動物主體創作出幽默且富有藝術感的漫畫形象,突出面部特徵和特點。
easygoing0114
Qwen-Image-Edit-2509_clear 是 Qwen-Image-Edit-2509 模型的微調版本,專門針對圖像生成質量進行優化。該模型能夠生成更清晰、更鮮豔的圖像,具有更高的對比度、更豐富的色彩和更精細的細節表現。
MaziyarPanahi
本項目提供了Qwen3-4B-Thinking-2507模型的GGUF格式文件,這是一個具有思維鏈推理能力的4B參數大語言模型,支持多種量化版本,便於在各種硬件上部署運行。
prithivMLmods
VibeThinker-1.5B是微博AI推出的15億參數密集語言模型,基於Qwen2.5-Math-1.5B微調,專門針對數學和算法編碼問題設計。採用'頻譜到信號原理'框架訓練,在多個數學競賽測試中超越規模更大的模型,訓練成本約7800美元,支持最長約40k詞元的輸出。
tlennon-ie
QwenEdit2509是一款專門設計的低秩自適應(LoRA)模型,專注於圖像色彩處理。它能夠將圖像去飽和並降低對比度,創造出類似相機日誌配置文件的扁平、未分級外觀,同時保留高光和陰影中的細節。
Intel
DeepMath是一個40億參數的數學推理模型,基於Qwen3-4B Thinking構建,結合了微調的大語言模型與沙盒化Python執行器。它能夠為計算步驟生成簡潔的Python代碼片段,顯著減少錯誤並縮短輸出長度。
TeichAI
本模型是基於Qwen3-4B架構的知識蒸餾模型,通過約5440萬個由Gemini 2.5 Flash生成的標記進行訓練,旨在整合Gemini-2.5 Flash的行為、推理過程和知識到單一數據集中。
bartowski
這是對Qwen3-4B-Instruct-2507-heretic模型進行的量化處理版本,使用llama.cpp工具和imatrix數據集生成了多種量化類型的模型文件,可在多種環境下運行,為用戶提供了更多選擇。
Guilherme34
Qwen3-32B是Qwen系列最新一代的大語言模型,具備強大的推理、指令遵循、智能體交互和多語言處理能力。它支持100多種語言和方言,能在思維模式和非思維模式間無縫切換,為用戶提供自然流暢的對話體驗。
magiccodingman
這是一個基於Qwen3 VL 8B模型的混合量化版本,採用MXFP4量化技術並在密集模型上使用混合權重。該模型在保持接近Q8精度的同時,實現了更小的文件大小和更高的推理速度,是效率與精度平衡的優秀解決方案。
這是一個基於Qwen3 VL 8B模型的實驗性混合量化版本,採用MXFP4_MOE技術結合高精度權重,在保持接近Q8精度的同時,實現更小的文件體積和更高的推理速度。該模型探索了混合量化方法,在精度損失和性能之間取得了良好平衡。
mradermacher
本項目提供了Qwen-4B-Instruct-2507-Self-correct模型的靜態量化版本,支持文本生成、偏差緩解、自我修正等任務。該模型基於Qwen-4B架構,經過指令微調和自我修正訓練,提供多種量化版本以適應不同硬件需求。
一個利用Groq API調用Qwen模型的鏈式思考MCP服務器,通過外部思考工具提升AI處理複雜任務的能力。
MCP Vision Relay 是一個 MCP 服務器,通過封裝本地安裝的 Gemini 和 Qwen 命令行工具,為 Claude、Codex 等僅支持文本的 MCP 客戶端提供圖像分析能力,使其能夠處理本地路徑、URL 或 base64 編碼的圖片。
一個基於mcp-agent和qwen的網頁摘要代理工具,可在Windows環境下運行,通過uv創建虛擬環境並配置API密鑰來使用。
Qwen Max MCP Server是一個基於Node.js/TypeScript的模型上下文協議服務器實現,專為Qwen Max語言模型設計,支持與Claude Desktop集成,提供穩定的文本生成服務。
基於MCP與QWEN大模型的自然語言MySQL數據庫查詢系統,提供GUI界面支持
Qwen Max的MCP服務器實現,支持Claude Desktop集成和多模型切換
Qwen MCP管理器是一個用於管理其他MCP服務器的工具,支持通過JSON配置快速添加和管理Playwright等MCP服務
Qwen MCP工具是一個基於模型上下文協議的服務器,可將Qwen CLI與AI助手集成,提供大上下文窗口分析、文件處理、沙箱執行和多模型支持等功能
Twitch MCP服務器是一個為Twitch主播提供的AI工具集,通過Model Context Protocol(MCP)連接聊天助手(如Gemini CLI、Qwen Coder、Claude Code等)到Twitch聊天,實現聊天管理、內容審核和觀眾互動功能。
NiagaBot是基於Qwen3-Omni AI的智能WhatsApp商業自動化機器人,支持多模態消息處理、群組管理、批量廣播和數據分析等功能
Qwen3 MCP服務器是一個功能強大的本地LLM代碼代理工具,提供80多種工具支持文件操作、命令執行、Git管理、網頁搜索、記憶規劃等完整編碼能力,支持HTTP瀏覽器聊天和LM Studio MCP集成兩種模式。