阿里云在2026峰会上发布新型AI服务平台“千问云”,定位为“为AI Agent而生的全栈智能基础设施”。该平台标志云计算范式从算力中心转向智能体中心,核心亮点在于实现模型服务的全量“Skill化”与“CLI化”,涵盖模型选型、资源调用、认证配置及用量查询等环节,全面重构大模型时代服务链路。
通义实验室发布新一代AI Agent基座大模型Qwen3.7-Max,在多项评测中获国内第一,旨在解决智能体长链路运行中断、崩溃问题。在未知硬件ZW-M890L PPU的极限压力测试中,该模型无文档和先验数据,凭运行时反馈展现长程策略连贯性与泛化力,连续运行35小时、1158次工具调用零中断。
阿里云通义千问大模型推出Qwen3.7-Max-Preview和Qwen3.7-Plus-Preview预览版,已上线大模型竞技场及官方Qwen Chat。两款模型作为新一代旗舰预览版,仅支持“思考模式”,专注高难度逻辑推理与深度计算,预计在阿里云峰会正式发布。
阿里通义千问Qwen3.7系列两款预览模型悄然上线,定位明确:Max-Preview为旗舰级“大脑”,主打综合性能天花板,目前仅开放思考模式;Plus-Preview为均衡型选择。两款模型将在5月20日阿里云峰会正式官宣。
Qwen2.5-Omni 是阿里云通义千问团队开发的端到端多模态模型,支持文本、音频、图像、视频输入。
Wan是阿里巴巴通义实验室开发的先进视觉生成模型,可基于文本、图像等生成视频。
全能AI助手,提供语音识别、字幕翻译、文档速读等功能
代码演示平台,提供智能问答体验
Alibaba
-
Input tokens/M
Output tokens/M
Context Length
$4
$16
1k
$1
$10
256
$2
$20
$6
$24
$8
$240
52
$3.9
$15.2
64
$15.8
$12.7
$0.8
128
$54
$163
redponike
Qwen3-VL-4B-Instruct 是通义千问系列最新的视觉语言模型,在4B参数规模下实现了卓越的视觉感知、文本理解与生成、空间推理和智能体交互能力。它支持长上下文和视频理解,具备强大的OCR和多语言处理能力。
unsloth
Qwen3-VL是通义系列中最强大的视觉语言模型,具备卓越的文本理解与生成能力、深入的视觉感知与推理能力、长上下文支持、强大的空间和视频动态理解能力以及出色的智能体交互能力。
Qwen3-VL-8B-Thinking是通义千问系列中最强大的视觉语言模型,具备卓越的文本理解与生成能力、深入的视觉感知与推理能力、长上下文支持、强大的空间和视频动态理解能力,以及出色的智能体交互能力。
Qwen3-VL是通义系列中最强大的视觉语言模型,具备卓越的文本理解与生成能力、深入的视觉感知与推理能力、长上下文支持、强大的空间和视频动态理解能力,以及出色的智能体交互能力。
Qwen3-VL是通义系列中最强大的视觉语言模型,在文本理解与生成、视觉感知与推理、上下文长度、空间和视频动态理解以及智能体交互能力等方面全面升级。该模型提供密集架构和混合专家架构,支持从边缘设备到云端的灵活部署。
Qwen
Qwen3-VL-30B-A3B-Thinking是通义系列中最强大的视觉语言模型,具备出色的文本理解和生成能力、深入的视觉感知和推理能力、长上下文支持、强大的空间和视频动态理解能力,以及智能体交互能力。
Qwen3-VL是通义系列最强大的视觉语言模型,采用混合专家模型架构(MoE),提供GGUF格式权重,支持在CPU、GPU等设备上进行高效推理。模型在文本理解、视觉感知、空间理解、视频处理等方面全面升级。
Qwen3-VL-30B-A3B-Instruct是通义系列中最强大的视觉语言模型,采用混合专家模型架构,具备出色的文本理解与生成能力、深入的视觉感知与推理能力,支持256K长上下文和视频理解,可在多种设备上进行推理。
Qwen3-VL-8B-Thinking是通义千问系列中最强大的视觉语言模型,具备增强推理能力的8B参数版本。该模型在文本理解、视觉感知、空间理解、长上下文处理等方面全面升级,支持多模态推理和智能体交互。
Qwen3-VL是通义系列中最强大的视觉语言模型,具备出色的文本理解和生成能力、深入的视觉感知和推理能力、长上下文支持、强大的空间和视频动态理解能力,以及智能体交互能力。本仓库提供GGUF格式权重,支持在CPU、GPU等设备上高效推理。
Qwen3-VL-32B-Instruct是通义系列中最强大的视觉语言模型,具备出色的文本理解与生成能力、深入的视觉感知与推理能力、长上下文支持、强大的空间和视频动态理解能力,以及智能体交互能力。
Qwen3-VL-8B-Instruct是通义系列中最强大的视觉语言模型,具备卓越的文本理解和生成能力、深入的视觉感知和推理能力、长上下文支持以及强大的空间和视频动态理解能力。
Qwen3-VL-4B-Instruct是通义系列最强大的视觉语言模型之一,在文本理解、视觉感知、空间理解、视频处理等方面全面升级,支持在多种硬件设备上运行,具备卓越的多模态推理能力。
Qwen3-VL-2B-Instruct-GGUF是通义千问系列的多模态视觉语言模型的GGUF量化版本,具备20亿参数,支持图像理解和文本生成的无缝融合,可在CPU、GPU等设备上高效运行。
Qwen3-VL是通义大模型系列中最强大的视觉语言模型,具备卓越的文本理解与生成能力、深入的视觉感知与推理能力、长上下文支持、强大的空间和视频动态理解能力以及出色的智能体交互能力。该模型采用混合专家(MoE)架构,是增强推理的思维版。
Qwen3-VL是通义系列中最强大的视觉语言模型,在文本理解与生成、视觉感知与推理、上下文长度、空间和视频动态理解以及智能体交互能力等方面都进行了全面升级。该模型提供密集架构和混合专家架构,支持从边缘设备到云端的灵活部署。
bullerwins
Qwen3-VL是通义系列迄今为止最强大的视觉语言模型,实现了全面升级,包括卓越的文本理解与生成能力、更深入的视觉感知与推理能力、更长的上下文长度、增强的空间和视频动态理解能力,以及更强的智能体交互能力。
Qwen3-VL是通义系列最强大的视觉语言模型,具备卓越的文本理解与生成能力、深入的视觉感知与推理能力、长上下文支持、强大的空间和视频动态理解能力,以及出色的智能体交互能力。
MCP服务器是一个多功能后端服务平台,支持文件管理、数据库操作、API集成和向量搜索,提供Docker部署方案和通义千问集成示例。
基于TypeScript的MCP服务器,集成阿里云通义万相的文生图和文生视频API,支持异步任务处理和MCP协议规范
基于TypeScript的MCP服务器,集成通义万相的文生图和文生视频API,支持异步任务处理和MCP协议规范。