SuperCLUE-VLM最新榜单显示,谷歌Gemini-3-Pro以83.64分大幅领先,在视觉理解与推理方面优势明显。国产模型表现突出,商汤SenseNova V6.5Pro和字节豆包分列第二、三位,展现中国AI在多模态领域的快速进步。评测涵盖三大核心能力维度。
阿里巴巴通义实验室发布MAI-UI多模态GUI智能代理家族,整合人机交互、工具使用与云端协作,在通用及移动GUI导航方面表现领先,超越多个同行模型。该系统基于Qwen3VL构建,提供多种规模模型,支持自然语言指令处理。
阿里云通义实验室发布Qwen Code v0.5.0版本,国产AI编程工具从命令行工具升级为全链路开发生态平台。新版本强化核心编码能力,并突破插件集成、工程上下文理解和开发者协作支持,引入多工具协同架构,构建开发者“数字工作台”。
阿里云通义实验室开源图像编辑模型Qwen-Image-Edit-2511,重点优化前代版本存在的编辑后图像“轻微漂移”问题,通过技术改进提升编辑一致性与视觉稳定性,为开发者提供更精准可靠的可控生成工具。
一款将图像转化为 LoRA 模型的先进工具。
先进的文本转语音模型,提供高质量的语音合成服务。
Questas可让用户创建自己的冒险体验
Questie AI是带实时语音聊天的终极AI游戏伴侣,提供多样娱乐体验。
Alibaba
-
输入tokens/百万
输出tokens/百万
上下文长度
$4
$16
1k
$1
$10
256
$2
$20
Baidu
128
$6
$24
$8
$240
52
$3.9
$15.2
64
$15.8
$12.7
$0.8
32
$54
$163
DevQuasar
本项目提供了 Qwen/Qwen3-VL-32B-Thinking 的量化版本(Int4),致力于降低模型部署的硬件门槛,让先进的视觉语言模型知识为每个人所用。
chunchiliu
这是一个已发布在 Hugging Face Hub 上的 🤗 Transformers 模型,其模型卡片由系统自动生成。目前卡片中大部分详细信息(如开发者、模型类型、语言、许可证等)均处于待补充状态。
dx8152
这是一个基于Qwen-Image-Edit-2509的LoRA微调模型,专门用于解决图像二次光照处理问题。它能够移除原始图像的光照效果,并根据参考图像的光照和色调,为目标图像重新生成逼真的照明和阴影,实现图像风格的迁移与融合。
prithivMLmods
CodeV是基于Qwen2.5-VL-7B-Instruct微调得到的70亿参数视觉语言模型,通过监督微调(SFT)和基于工具感知策略优化(TAPO)的强化学习(RL)两阶段训练,旨在实现可靠、可解释的视觉推理。它将视觉工具表示为可执行的Python代码,并通过奖励机制确保工具使用与问题证据一致,解决了高准确率下工具调用不相关的问题。
ActIO-UI-7B-RLVR 是由 Uniphore 发布的 70 亿参数视觉语言模型,专门用于计算机界面自动化任务。它基于 Qwen2.5-VL-7B-Instruct,通过监督微调和可验证奖励的强化学习进行优化,在 GUI 导航、元素定位和交互规划等任务上表现出色,在 WARC-Bench 基准测试中达到了开源 7B 模型的领先水平。
open-thoughts
OpenThinker-Agent-v1-SFT 是基于 Qwen/Qwen3-8B 进行有监督微调(SFT)得到的智能体模型。它是 OpenThinker-Agent-v1 完整训练流程(SFT + RL)的第一阶段模型,专门针对智能体任务(如终端操作和代码修复)进行优化。
OpenThinker-Agent-v1 是一个基于 Qwen3-8B 进行后续训练的开源智能体模型,专为终端操作和软件工程任务而设计。它首先在高质量监督微调数据集上进行训练,然后通过强化学习进一步优化,在 Terminal-Bench 2.0 和 SWE-Bench 等智能体基准测试中表现出色。
DavidAU
Qwen3-4B-Hivemind-Instruct-NEO-MAX-Imatrix-GGUF 是一款基于 Qwen3 架构的 4B 参数指令微调大语言模型,采用 NEO Imatrix 与 MAX 量化技术,具备 256k 的超长上下文处理能力。该模型在多个基准测试中表现出色,是一款性能强劲的通用型模型。
bartowski
这是由Mistral AI开发的大型语言模型Mistral-Large-3-675B-Instruct-2512的GGUF量化版本。原始模型拥有6750亿参数,专为指令遵循任务设计。本项目使用llama.cpp工具,结合imatrix校准数据集,生成了从Q8_0到IQ1_S共20多种不同精度的量化模型文件,旨在平衡模型性能、推理速度与存储/内存占用,使其能在更广泛的硬件上运行。
jayhuang92
Qwen-Image 是基于 Qwen 系列开发的文本到图像生成模型,支持中英双语输入,在多个评估指标上表现优异,特别适用于追求逼真效果的图像生成场景。
SerialKicked
这是Qwen3-VL-32B-Thinking-heretic的量化版本,采用新的消融方法进行量化,相比传统方法对基础模型的损害更小。提供多种量化精度版本,适合在24GB显存设备上运行,支持图文转文本任务。
RinggAI
这是一个专为通话记录分析打造的混合语言AI模型,能够处理印地语、英语和混合印地英语的通话转录内容。模型基于Qwen2.5-1.5B-Instruct进行微调,具备强大的多语言理解和信息提取能力。
TomoroAI
TomoroAI/tomoro-colqwen3-embed-4b是一款先进的ColPali风格多模态嵌入模型,能够将文本查询、视觉文档(如图像、PDF)或短视频映射为对齐的多向量嵌入。该模型结合了Qwen3-VL-4B-Instruct和Qwen3-Embedding-4B的优势,在ViDoRe基准测试中表现出色,同时显著减少了嵌入占用空间。
TeichAI
本模型是基于Qwen3-4B-Thinking-2507基础模型,使用高推理难度的Gemini 3 Pro预览数据集进行蒸馏训练得到的模型。它专注于提升在编码和科学领域的复杂推理能力,通过特定数据集的训练,旨在将大型模型(如Gemini 3 Pro)的推理能力高效地迁移到较小规模的模型中。
ryandono
本模型是 mixedbread-ai/mxbai-edge-colbert-v0-17m 的量化(Int8 / Q8)版本,专为与 transformers.js 配合使用而导出。它包含了48维ColBERT架构所需的自定义投影层,旨在提供高效的向量检索能力。
nightmedia
这是一个实验性的量化大语言模型,采用Deckard(qx)量化方法,嵌入层为3位量化。该模型通过范数保持双投影消除(NPBA)技术重构,不仅移除了安全限制机制,还增强了模型的认知深度和推理能力。
John1604
Qwen3 VL 4B Thinking 是一个支持图像到文本以及文本到文本转换的多模态模型,具有4B参数规模,能够满足多种图文交互需求。
huawei-csl
这是使用华为SINQ(Sinkhorn归一化量化)方法对Qwen3-Next-80B大语言模型进行4位量化后的版本。SINQ是一种新颖、快速且高质量的量化方法,旨在显著压缩模型体积(约减少75%),同时保持与原始模型几乎不变的准确性,使其更易于部署。
pramjana
Qwen3-VL-4B-Instruct是阿里巴巴推出的40亿参数视觉语言模型,基于Qwen3架构开发,支持多模态理解和对话任务。该模型具备强大的图像理解和文本生成能力,能够处理复杂的视觉语言交互场景。
OpenOranje
TweeTaal-nl-en-0.6B 是一个专门针对荷兰语-英语双向翻译任务进行微调的语言模型,基于Qwen3-0.6B架构开发。该模型在资源受限环境下仍能提供准确流畅的翻译服务,支持荷兰语与英语之间的互译。
AWS MCP是一个基于Model Context Protocol的服务,允许通过自然语言查询和管理AWS资源,类似于Amazon Q的替代方案。
Quarkus Model Context Protocol (MCP) Server是一个开源协议服务器,支持通过声明式和编程式API轻松集成LLM应用与外部数据源和工具。
一个基于Qdrant向量数据库的文档语义搜索服务,支持URL和本地文件导入,提供自然语言查询功能。
Quick-start Auto MCP是一个帮助用户快速在Claude Desktop和Cursor中注册Anthropic模型上下文协议(MCP)的工具,提供RAG文档搜索、Dify工作流、实时网络搜索等功能,支持一键生成JSON配置文件。
QueryWeaver是一个开源的Text2SQL工具,通过图驱动的模式理解将自然语言问题转换为SQL查询,支持REST API和MCP协议。
该项目提供了一系列基于Quarkus/Java的Model Context Protocol服务器,用于扩展支持MCP的LLM应用功能,包含JDBC数据库交互、JVM监控、文件系统操作等多种服务。
一个集成Qdrant向量数据库和MCP服务器的系统,用于存储和检索代码片段,支持自然语言搜索和语义检索。
VibeCheck Web测试工具是一个AI驱动的网页测试代理,通过MCP协议集成到AI编程助手(如GitHub Copilot、Cursor等)中,实现自动化测试录制、执行和发现。它利用Playwright控制浏览器,支持自然语言描述生成测试脚本,执行回归测试,并自动发现潜在测试步骤,提高开发效率和测试准确性。
一个基于Qdrant向量数据库的MCP记忆服务器,提供知识图谱和语义搜索功能。
Keycloak MCP Server是一个基于Quarkus框架的服务,用于实现Model-Context Protocol(MCP)标准,并与Keycloak集成,提供身份和访问管理解决方案。
一个用于与工程师知识分享平台Qiita交互的MCP服务器,提供创建、读取和更新Qiita文章的标准工具。
一个支持MCP协议的AI助手数据库查询工具
Qwen MCP工具是一个基于模型上下文协议的服务器,可将Qwen CLI与AI助手集成,提供大上下文窗口分析、文件处理、沙箱执行和多模型支持等功能
一个基于MCP协议的QR码生成服务器
一个CLI工具,用于从Notion、Obsidian等来源检索个人数据,存储在Qdrant中并通过MCP服务器提供查询服务
一个提供QAnon帖子数据集访问的MCP服务器,用于人类学/社会学研究分析
DBMCP是一个基于MCP架构的数据库查询服务
数据库MCP服务器,通过Legion Query Runner和MCP协议提供数据库查询和AI辅助功能
七牛云存储文件上传服务
QueryPie MCP是一个面向管理员的管理控制平台服务器,提供数据可视化、资源监控和异常行为检测等功能。