阿里發佈多模態大模型Qwen3.7-Plus,在文本能力基礎上增強視覺-語言功能,統一爲智能體基座。該模型融合GUI與CLI交互,實現從原型到軟件工程的端到端自動化,並在Vision Arena榜單中表現強勁。
阿里推出新一代多模態智能體模型Qwen3.7-Plus,標誌着國產大模型向具身智能與高級智能體演進加速。該模型繼承Qwen3.7強大文本處理能力,在多模態領域實現技術飛躍,爲端側與複雜工作流應用提供核心底座迭代。
歡迎來到【AI日報】欄目!這裏是你每天探索人工智能世界的指南,每天我們爲你呈現AI領域的熱點內容,聚焦開發者,助你洞悉技術趨勢、瞭解創新AI產品應用。新鮮AI產品點擊瞭解:https://app.aibase.com/zh1、上下文150萬tokens!支付寶還推出了全球化AI支付解決方案,助力AI商業生態的發展。
阿里巴巴Qwen3.7-Max在最新Code Arena榜單中以1541分位列全球第二,僅次於Claude系列,超越GPT-5.5、Gemini3.5Flash等模型,成爲國產大模型編程領域新標杆,標誌着中國AI在Agentic Coding和長時程任務上的重大突破。
為即將發佈的 Qwen3.5 系列模型提供支持。
多模態信息檢索與重排序模型,支持文本、圖像、視頻等輸入。
多模態重排序模型,支持文本、圖像、視頻等輸入。
先進的多模態嵌入和重排名模型,支持文本、圖像和視頻。
Alibaba
$1
輸入tokens/百萬
$10
輸出tokens/百萬
256
上下文長度
$6
$24
-
$4
$16
1k
$2
$20
$8
$240
52
$15.8
$12.7
64
$3.9
$15.2
$0.8
128
$54
$163
32
$1.6
$0.75
SerialKicked
這是Qwen3-VL-32B-Thinking-heretic的量化版本,採用新的消融方法進行量化,相比傳統方法對基礎模型的損害更小。提供多種量化精度版本,適合在24GB顯存設備上運行,支持圖文轉文本任務。
TomoroAI
TomoroAI/tomoro-colqwen3-embed-4b是一款先進的ColPali風格多模態嵌入模型,能夠將文本查詢、視覺文檔(如圖像、PDF)或短視頻映射為對齊的多向量嵌入。該模型結合了Qwen3-VL-4B-Instruct和Qwen3-Embedding-4B的優勢,在ViDoRe基準測試中表現出色,同時顯著減少了嵌入佔用空間。
John1604
Qwen3 VL 4B Thinking 是一個支持圖像到文本以及文本到文本轉換的多模態模型,具有4B參數規模,能夠滿足多種圖文交互需求。
pramjana
Qwen3-VL-4B-Instruct是阿里巴巴推出的40億參數視覺語言模型,基於Qwen3架構開發,支持多模態理解和對話任務。該模型具備強大的圖像理解和文本生成能力,能夠處理複雜的視覺語言交互場景。
OpenOranje
TweeTaal-nl-en-0.6B 是一個專門針對荷蘭語-英語雙向翻譯任務進行微調的語言模型,基於Qwen3-0.6B架構開發。該模型在資源受限環境下仍能提供準確流暢的翻譯服務,支持荷蘭語與英語之間的互譯。
Kiy-K
Fyodor-Q3-8B-Instruct 是一款專為智能推理和穩健代碼生成設計的高保真指令調優模型。它基於Qwen3-8B架構,採用高秩LoRA配置訓練,擅長在編碼前進行規劃,非常適合複雜的軟件工程任務。
MaziyarPanahi
本項目提供了Qwen3-4B-Thinking-2507模型的GGUF格式文件,這是一個具有思維鏈推理能力的4B參數大語言模型,支持多種量化版本,便於在各種硬件上部署運行。
Intel
DeepMath是一個40億參數的數學推理模型,基於Qwen3-4B Thinking構建,結合了微調的大語言模型與沙盒化Python執行器。它能夠為計算步驟生成簡潔的Python代碼片段,顯著減少錯誤並縮短輸出長度。
TeichAI
本模型是基於Qwen3-4B架構的知識蒸餾模型,通過約5440萬個由Gemini 2.5 Flash生成的標記進行訓練,旨在整合Gemini-2.5 Flash的行為、推理過程和知識到單一數據集中。
bartowski
這是對Qwen3-4B-Instruct-2507-heretic模型進行的量化處理版本,使用llama.cpp工具和imatrix數據集生成了多種量化類型的模型文件,可在多種環境下運行,為用戶提供了更多選擇。
Guilherme34
Qwen3-32B是Qwen系列最新一代的大語言模型,具備強大的推理、指令遵循、智能體交互和多語言處理能力。它支持100多種語言和方言,能在思維模式和非思維模式間無縫切換,為用戶提供自然流暢的對話體驗。
magiccodingman
這是一個基於Qwen3 VL 8B模型的混合量化版本,採用MXFP4量化技術並在密集模型上使用混合權重。該模型在保持接近Q8精度的同時,實現了更小的文件大小和更高的推理速度,是效率與精度平衡的優秀解決方案。
這是一個基於Qwen3 VL 8B模型的實驗性混合量化版本,採用MXFP4_MOE技術結合高精度權重,在保持接近Q8精度的同時,實現更小的文件體積和更高的推理速度。該模型探索了混合量化方法,在精度損失和性能之間取得了良好平衡。
這是一個基於Claude Sonnet 4.5推理數據集訓練的30B參數大語言模型,專門針對高難度推理任務進行優化,在編碼和科學領域表現出色。
這是一個基於Qwen3 30B A3B模型,在Claude Sonnet 4.5高推理難度數據集上訓練的蒸餾模型。該模型專門針對複雜推理任務進行優化,在編碼和科學領域表現出色,具備較強的邏輯推理能力。
這是一個基於Qwen3 4B Instruct模型的混合量化版本,採用MXFP4和混合權重技術,在保持近乎無損精度的同時實現了更小的文件大小和更高的推理速度。
這是一個基於Qwen3 4B模型的混合量化版本,採用MXFP4_MOE混合權重技術,在保持近乎無損精度的同時實現了更小的文件大小和更高的推理速度。該模型通過精心組合MXFP4和高精度嵌入/輸出權重,達到了接近Q8量化的精度水平,同時具備Q4-Q6級別的吞吐量。
DavidAU
基於Qwen 3微調的12B參數大語言模型,具備256k超長上下文處理能力,專門針對長文本生成任務進行優化。該模型結合了VLTO 8B模型基礎、Brainstorm 20x調優和NEO Imatrix數據集量化技術,能夠生成高質量的長文本內容。
本模型基於Qwen3-4B-Thinking-2507,在GPT-5-Codex的1000個示例上進行了微調,專注於文本生成任務,使用Unsloth技術實現了2倍訓練速度提升。
gbcfchc
這是一個基於Qwen/Qwen3-8B-Base微調的版本,使用TRL框架和GKD(On-Policy Distillation)方法進行訓練,專門用於文本生成任務。該模型通過自我生成錯誤進行學習,提升了文本生成的質量和穩定性。
NiagaBot是基於Qwen3-Omni AI的智能WhatsApp商業自動化機器人,支持多模態消息處理、群組管理、批量廣播和數據分析等功能
Qwen3 MCP服務器是一個功能強大的本地LLM代碼代理工具,提供80多種工具支持文件操作、命令執行、Git管理、網頁搜索、記憶規劃等完整編碼能力,支持HTTP瀏覽器聊天和LM Studio MCP集成兩種模式。