SuperCLUE-VLM最新榜單顯示,谷歌Gemini-3-Pro以83.64分大幅領先,在視覺理解與推理方面優勢明顯。國產模型表現突出,商湯SenseNova V6.5Pro和字節豆包分列第二、三位,展現中國AI在多模態領域的快速進步。評測涵蓋三大核心能力維度。
阿里巴巴通義實驗室發佈MAI-UI多模態GUI智能代理家族,整合人機交互、工具使用與雲端協作,在通用及移動GUI導航方面表現領先,超越多個同行模型。該系統基於Qwen3VL構建,提供多種規模模型,支持自然語言指令處理。
阿里雲通義實驗室發佈Qwen Code v0.5.0版本,國產AI編程工具從命令行工具升級爲全鏈路開發生態平臺。新版本強化核心編碼能力,並突破插件集成、工程上下文理解和開發者協作支持,引入多工具協同架構,構建開發者“數字工作臺”。
阿里雲通義實驗室開源圖像編輯模型Qwen-Image-Edit-2511,重點優化前代版本存在的編輯後圖像“輕微漂移”問題,通過技術改進提升編輯一致性與視覺穩定性,爲開發者提供更精準可靠的可控生成工具。
一款將圖像轉化為 LoRA 模型的先進工具。
先進的文本轉語音模型,提供高質量的語音合成服務。
Questas可讓用戶創建自己的冒險體驗
Questie AI是帶即時語音聊天的終極AI遊戲伴侶,提供多樣娛樂體驗。
Alibaba
$1
輸入tokens/百萬
$10
輸出tokens/百萬
256
上下文長度
-
$6
$24
$4
$16
1k
$2
$20
Baidu
128
$8
$240
52
$15.8
$12.7
64
$3.9
$15.2
$0.8
32
$54
$163
SerialKicked
這是Qwen3-VL-32B-Thinking-heretic的量化版本,採用新的消融方法進行量化,相比傳統方法對基礎模型的損害更小。提供多種量化精度版本,適合在24GB顯存設備上運行,支持圖文轉文本任務。
RinggAI
這是一個專為通話記錄分析打造的混合語言AI模型,能夠處理印地語、英語和混合印地英語的通話轉錄內容。模型基於Qwen2.5-1.5B-Instruct進行微調,具備強大的多語言理解和信息提取能力。
TomoroAI
TomoroAI/tomoro-colqwen3-embed-4b是一款先進的ColPali風格多模態嵌入模型,能夠將文本查詢、視覺文檔(如圖像、PDF)或短視頻映射為對齊的多向量嵌入。該模型結合了Qwen3-VL-4B-Instruct和Qwen3-Embedding-4B的優勢,在ViDoRe基準測試中表現出色,同時顯著減少了嵌入佔用空間。
nightmedia
這是一個實驗性的量化大語言模型,採用Deckard(qx)量化方法,嵌入層為3位量化。該模型通過範數保持雙投影消除(NPBA)技術重構,不僅移除了安全限制機制,還增強了模型的認知深度和推理能力。
John1604
Qwen3 VL 4B Thinking 是一個支持圖像到文本以及文本到文本轉換的多模態模型,具有4B參數規模,能夠滿足多種圖文交互需求。
pramjana
Qwen3-VL-4B-Instruct是阿里巴巴推出的40億參數視覺語言模型,基於Qwen3架構開發,支持多模態理解和對話任務。該模型具備強大的圖像理解和文本生成能力,能夠處理複雜的視覺語言交互場景。
OpenOranje
TweeTaal-nl-en-0.6B 是一個專門針對荷蘭語-英語雙向翻譯任務進行微調的語言模型,基於Qwen3-0.6B架構開發。該模型在資源受限環境下仍能提供準確流暢的翻譯服務,支持荷蘭語與英語之間的互譯。
00quebec
這是一個專門為 Qwen-Image 設計的開源 LoRA 模型,專注於模擬現代 iPhone 攝影的真實感外觀和感覺。模型基於5000多張真實 iPhone 風格照片訓練,能夠生成清晰、自然、適合社交媒體分享的圖像。
Kiy-K
Fyodor-Q3-8B-Instruct 是一款專為智能推理和穩健代碼生成設計的高保真指令調優模型。它基於Qwen3-8B架構,採用高秩LoRA配置訓練,擅長在編碼前進行規劃,非常適合複雜的軟件工程任務。
Clemylia
Qsana-coder-base 是一個小型語言模型(SLM),專門為編碼基礎(Python、偽代碼)的概念創意而設計。它不生成可執行的生產代碼,而是為教育和快速原型設計場景生成編碼邏輯片段,主要目標是激發初學者的邏輯思維和概念理解。
drbaph
這是一個基於Qwen Image Edit 2509的LoRA模型,專門用於將輸入圖像轉換為帶有誇張特徵的素描漫畫藝術作品。模型能夠為人物和動物主體創作出幽默且富有藝術感的漫畫形象,突出面部特徵和特點。
bartowski
這是allenai的Olmo-3-32B-Think模型的GGUF量化版本,通過llama.cpp工具進行多種量化處理,旨在提升模型在特定環境下的性能和效率。提供了從Q2到Q8的多種量化選項,滿足不同硬件配置和性能需求。
jayn7
騰訊混元視頻1.5模型的量化GGUF版本,專門用於圖像轉視頻和視頻生成任務。提供480P分辨率的蒸餾模型和標準模型,支持多種量化精度,包括Q4_K_S、Q8_0和FP16等。
ubergarm
這是ai-sage/GigaChat3-10B-A1.8B-bf16模型的GGUF量化版本,提供了多種量化選項,從高精度的Q8_0到極度壓縮的smol-IQ1_KT,滿足不同硬件條件下的部署需求。該模型支持32K上下文長度,採用MLA架構,專為對話場景優化。
easygoing0114
Qwen-Image-Edit-2509_clear 是 Qwen-Image-Edit-2509 模型的微調版本,專門針對圖像生成質量進行優化。該模型能夠生成更清晰、更鮮豔的圖像,具有更高的對比度、更豐富的色彩和更精細的細節表現。
MaziyarPanahi
本項目提供了Qwen3-4B-Thinking-2507模型的GGUF格式文件,這是一個具有思維鏈推理能力的4B參數大語言模型,支持多種量化版本,便於在各種硬件上部署運行。
prithivMLmods
VibeThinker-1.5B是微博AI推出的15億參數密集語言模型,基於Qwen2.5-Math-1.5B微調,專門針對數學和算法編碼問題設計。採用'頻譜到信號原理'框架訓練,在多個數學競賽測試中超越規模更大的模型,訓練成本約7800美元,支持最長約40k詞元的輸出。
tlennon-ie
QwenEdit2509是一款專門設計的低秩自適應(LoRA)模型,專注於圖像色彩處理。它能夠將圖像去飽和並降低對比度,創造出類似相機日誌配置文件的扁平、未分級外觀,同時保留高光和陰影中的細節。
Intel
DeepMath是一個40億參數的數學推理模型,基於Qwen3-4B Thinking構建,結合了微調的大語言模型與沙盒化Python執行器。它能夠為計算步驟生成簡潔的Python代碼片段,顯著減少錯誤並縮短輸出長度。
TeichAI
本模型是基於Qwen3-4B架構的知識蒸餾模型,通過約5440萬個由Gemini 2.5 Flash生成的標記進行訓練,旨在整合Gemini-2.5 Flash的行為、推理過程和知識到單一數據集中。
AWS MCP是一個基於Model Context Protocol的服務,允許通過自然語言查詢和管理AWS資源,類似於Amazon Q的替代方案。
QueryWeaver是一個開源的Text2SQL工具,通過圖驅動的模式理解將自然語言問題轉換為SQL查詢,支持REST API和MCP協議。
Quick-start Auto MCP是一個幫助用戶快速在Claude Desktop和Cursor中註冊Anthropic模型上下文協議(MCP)的工具,提供RAG文檔搜索、Dify工作流、即時網絡搜索等功能,支持一鍵生成JSON配置文件。
該項目提供了一系列基於Quarkus/Java的Model Context Protocol服務器,用於擴展支持MCP的LLM應用功能,包含JDBC數據庫交互、JVM監控、文件系統操作等多種服務。
一個基於Qdrant向量數據庫的文檔語義搜索服務,支持URL和本地文件導入,提供自然語言查詢功能。
Quarkus Model Context Protocol (MCP) Server是一個開源協議服務器,支持通過聲明式和編程式API輕鬆集成LLM應用與外部數據源和工具。
智慧鍛造是一個強大的知識管理系統,通過Qdrant向量數據庫高效存儲和檢索經驗、見解與最佳實踐。
一個基於Google Gemini API的異步對話AI服務,通過Redis隊列處理請求,提供MCP協議兼容的API接口。
VibeCheck Web測試工具是一個AI驅動的網頁測試代理,通過MCP協議集成到AI編程助手(如GitHub Copilot、Cursor等)中,實現自動化測試錄製、執行和發現。它利用Playwright控制瀏覽器,支持自然語言描述生成測試腳本,執行迴歸測試,並自動發現潛在測試步驟,提高開發效率和測試準確性。
一個基於Qdrant向量數據庫和OpenAI嵌入的語義搜索服務
一個通過Legion Query Runner和MCP協議幫助用戶訪問和查詢數據庫的服務器工具
一個基於MCP協議的JavaScript安全執行服務
一個利用Groq API調用Qwen模型的鏈式思考MCP服務器,通過外部思考工具提升AI處理複雜任務的能力。
MCP Vision Relay 是一個 MCP 服務器,通過封裝本地安裝的 Gemini 和 Qwen 命令行工具,為 Claude、Codex 等僅支持文本的 MCP 客戶端提供圖像分析能力,使其能夠處理本地路徑、URL 或 base64 編碼的圖片。
QualisMcp是一個基於Model Context Protocol (MCP)框架的巴西學術期刊評估系統,用於高效檢索和管理2017-2020年期間的事件分類信息。
定性研究知識圖譜管理服務器,提供研究項目、參與者、訪談、編碼和主題的結構化表示與管理工具
一個用於訪問法國國家圖書館Gallica數字資源的MCP服務器,支持搜索和自動生成研究報告
量子模擬器MCP服務器是一個Docker鏡像,提供量子電路模擬功能,支持MCP協議與客戶端集成。
一個基於mcp-agent和qwen的網頁摘要代理工具,可在Windows環境下運行,通過uv創建虛擬環境並配置API密鑰來使用。
BMAD-MCP是一個基於Model Context Protocol的敏捷開發工作流編排器,通過PO→架構師→SM→開發→評審→QA六個階段管理完整開發流程,支持動態引擎選擇和交互式需求澄清,確保交付質量。