云原生应用管理平台Rainbond发布v6.9.0版本,通过架构重构和功能升级,支持AI大模型私有化部署,提供从模型选型、一键部署到OpenAI兼容调用的全流程管理。该版本为企业构建内部AI能力提供便捷的“交钥匙”方案,开发者启用内置AI插件后,可立即使用模型仓库、实例管理和API等功能。
腾讯云在AI产业应用大会上发布教育智能体LearnBuddy,这是Buddy家族首款行业应用。该产品基于WorkBuddy同源技术,深度融合智能体平台与教育场景,打造“师—生—机”三元协同的AI自主学习平台,推动教育智能体从工具向知识资产演进。同时,腾讯还推出企业效率智能体套件并升级Agent云底座,加速AI在教育领域的产业化落地。
生成式人工智能正从聊天工具向“超级数字员工”进化。6月8日,云知声发布新一代通用大模型U2,专为个人、开发者及企业设计。它突破传统单轮对话局限,聚焦高智能密度与高Token价值,提升实际交付能力。
在2026腾讯云AI产业应用大会上,腾讯云发布了代码安全产品CodeBuddy Security,融合AI深度审计引擎与静态分析工具Xcheck,应对AI时代漏洞激增及传统代码审计瓶颈。尽管AI在漏洞挖掘领域取得突破,如某大模型公司发现隐藏27年的漏洞,但利用AI挖漏洞仍面临多重挑战。
AI驱动的文档组织工具,自动重命名和整理云存储文件
灵活的AI面试助手,可本地或云端运行,提供实时会议笔记与AI协助。
Ella是创作者的一体化AI视频平台,提供AI工具、编辑器和云存储。
一键部署Openclaw AI Agent,内置免费阿里云API额度,无需编码
Anthropic
$7
输入tokens/百万
$35
输出tokens/百万
200
上下文长度
Alibaba
-
Baidu
128
$2
256
32
$1.6
$4
$15
1k
Huawei
$1.8
$5.4
16
$2.4
$12
8
$0.5
$10
$0.8
$0.2
unsloth
Qwen3-VL是通义系列中最强大的视觉语言模型,在文本理解与生成、视觉感知与推理、上下文长度、空间和视频动态理解以及智能体交互能力等方面全面升级。该模型提供密集架构和混合专家架构,支持从边缘设备到云端的灵活部署。
Qwen3-VL是阿里巴巴推出的新一代视觉语言模型,在文本理解、视觉感知、空间理解、长上下文处理和智能体交互等方面全面升级,支持从边缘设备到云端的灵活部署。
Qwen3-VL是通义系列中最强大的视觉语言模型,在文本理解与生成、视觉感知与推理、上下文长度、空间和视频动态理解以及智能体交互能力等方面都进行了全面升级。该模型提供密集架构和混合专家架构,支持从边缘设备到云端的灵活部署。
Qwen3-VL-32B-Thinking是Qwen系列中最强大的视觉语言模型,具备卓越的文本理解与生成能力、深入的视觉感知与推理能力、长上下文支持、强大的空间和视频动态理解能力,以及出色的智能体交互能力。该版本采用增强推理的思维架构,支持从边缘到云的密集架构和混合专家模型架构。
NexaAI
Qwen3-VL-8B-Thinking是阿里云Qwen团队开发的80亿参数多模态大语言模型,专为深度多模态推理设计,支持视觉理解、长上下文处理和结构化思维链生成,在复杂推理任务中表现出色。
Qwen3-VL-4B-Instruct是阿里云Qwen团队推出的40亿参数指令调优多模态大语言模型,专为高通NPU优化,融合强大的视觉语言理解能力与对话微调功能,适用于聊天推理、文档分析和视觉对话等实际应用场景。
Qwen
Qwen3-VL是通义大模型系列中最强大的视觉语言模型,在文本理解与生成、视觉感知与推理、上下文长度、空间和视频动态理解以及智能体交互能力等方面均有显著提升。该模型提供密集架构和混合专家模型架构,支持从边缘到云的不同规模部署。
lmstudio-community
Qwen3-Next-80B-A3B-Instruct是阿里云通义千问团队开发的大规模语言模型,经过MLX框架4位量化优化,专门针对苹果芯片设备进行了性能优化,提供高效的推理能力。
nvidia
NVIDIA Qwen3-32B FP4模型是阿里云Qwen3-32B模型的量化版本,使用优化的Transformer架构,通过将权重和激活量化为FP4数据类型实现高效推理。该模型支持商业和非商业用途,适用于各种AI应用场景。
NVIDIA Qwen3-14B FP4 模型是阿里云 Qwen3-14B 模型的量化版本,采用优化的 Transformer 架构,是一个自回归语言模型。该模型使用 TensorRT Model Optimizer 进行量化,将权重和激活量化为 FP4 数据类型,可在 NVIDIA GPU 加速系统上实现高效推理。
yslan
STream3R是一种基于因果Transformer的可扩展序列3D重建模型,将点云图预测重新定义为仅解码器的Transformer问题。它引入流式处理框架,利用因果注意力高效处理图像序列,能够很好地泛化到各种具有挑战性的场景,包括传统方法经常失效的动态场景。
Qwen3-4B-Instruct-2507是阿里云推出的40亿参数大语言模型,基于Unsloth Dynamic 2.0量化技术,在通用能力、长尾知识覆盖、用户偏好对齐和长上下文理解等方面都有显著提升。
gabriellarson
Foundation-Sec-8B-Instruct是一款专为网络安全应用设计的80亿参数指令调优语言模型。基于Llama-3.1-8B架构,具备出色的指令跟随能力和网络安全专业知识,支持本地部署,可帮助组织构建AI安全工具,减少对云服务的依赖。
cpatonn
Qwen3-30B-A3B-Instruct-2507是阿里云推出的305亿参数混合专家模型,采用非思考模式,在指令遵循、逻辑推理、文本理解、数学科学、编码和工具使用等方面表现优异,支持262K长上下文和多语言处理。
arcee-ai
AFM-4.5B是由Arcee.ai开发的45亿参数指令调优模型,专为企业级应用设计,支持多语言处理,在云端到边缘的各种部署环境中展现卓越性能。
Qwen3-235B-A22B-Thinking-2507-FP8是阿里云推出的一款强大文本生成模型,在推理能力、通用能力和长上下文理解能力等方面有显著提升。该模型拥有2350亿参数,激活220亿参数,支持256K长上下文,专门针对高度复杂的推理任务进行了优化。
Danucore
Qwen3-Coder-480B-A35B-Instruct是阿里云推出的强大代码生成模型,具备480B总参数和35B激活参数,在多个基础编码任务上表现出色,支持长上下文处理和智能编码功能。
NVIDIA Qwen3-30B-A3B FP4模型是阿里云Qwen3-30B-A3B模型的量化版本,采用优化的Transformer架构,是自回归语言模型。该模型使用TensorRT Model Optimizer进行FP4量化,将每个参数的比特数从16位减少到4位,使磁盘大小和GPU内存需求减少约3.3倍,同时保持较高的性能表现。
NVIDIA Qwen3-235B-A22B FP4 模型是阿里云 Qwen3-235B-A22B 模型的量化版本,基于优化的 Transformer 架构,是一个自回归语言模型。该模型使用 TensorRT Model Optimizer 进行量化,将权重和激活值量化为 FP4 数据类型,显著减少了存储和计算需求。
NVIDIA Qwen3-235B-A22B FP4模型是阿里云Qwen3-235B-A22B模型的量化版本,采用优化的Transformer架构,是一种自回归语言模型。该模型通过FP4量化技术将参数从16位减少到4位,使磁盘大小和GPU内存需求减少约3.3倍,同时保持较高的准确性和性能。
OpenSumi 是一个帮助快速构建 AI 原生 IDE 产品的框架,支持云端和桌面端开发环境,提供丰富的示例项目和模板。
Testkube是一个面向云原生应用的测试编排与执行框架,提供统一平台来定义、运行和分析测试,支持现有测试工具和Kubernetes基础设施。
MCP Atlassian是一个为Atlassian产品(Confluence和Jira)设计的模型上下文协议服务器,支持云端和本地部署,提供AI助手集成功能。
这是一个持续更新的MCP服务器精选列表,涵盖了浏览器控制、艺术与文化、云平台、命令行、通信、客户数据平台、数据库、开发者工具、数据科学工具、文件系统、金融与金融科技、游戏、知识与记忆、位置服务、营销、监控、搜索和实用工具等多个类别。每个项目都附带了GitHub链接和星标数量,方便用户快速了解和使用。
Vestige是一个基于认知科学的AI记忆引擎,通过实现预测误差门控、FSRS-6间隔重复、记忆梦境等29个神经科学模块,为AI提供长期记忆能力。包含3D可视化仪表板和21个MCP工具,完全本地运行,无需云端。
Awesome MCP Servers 是一个全面的Model Context Protocol (MCP)服务器集合,涵盖了7158个MCP服务器,分为33个类别,包括AI集成、艺术媒体、浏览器自动化、云服务、数据库、开发者工具、文件系统、金融、游戏、硬件、医疗、基础设施、知识管理、位置地图、市场营销、监控、多媒体处理、操作系统、项目管理、科学研究、安全、社交媒体、旅行交通、实用工具和版本控制等。
该项目展示了一个基于SSE的MCP服务器和客户端实现模式,允许代理(客户端)随时连接和使用服务器提供的工具,适用于云原生场景。
Google Workspace MCP服务器是一个功能全面的多客户端协议服务器,通过自然语言控制Google日历、云端硬盘、Gmail、文档等全套办公套件,支持一键安装到Claude桌面端,提供高级OAuth认证和服务缓存。
HOPX MCP服务器是一个基于模型上下文协议的服务,允许AI助手在隔离的云容器中执行Python、JavaScript、Bash和Go代码,支持数据分析和文件操作。
AI基础设施代理是一个智能系统,允许用户通过自然语言命令管理AWS云资源。它利用AI模型将用户需求转化为可执行的AWS操作,并提供Web仪表板、状态管理和安全防护功能。
DevOps AI Toolkit是一个基于AI的平台工程和DevOps自动化工具,通过智能Kubernetes操作和对话式工作流,为团队提供资源部署推荐、问题修复、项目治理和共享提示库等功能,使复杂的云原生操作可通过自然语言交互实现。
n8n是一个面向技术团队的工作流自动化平台,结合了代码灵活性和无代码速度,提供400+集成、原生AI功能和公平代码许可,支持自托管或云端部署。
Vaali MCP服务器是一个展示高级AI代理能力的开源项目,通过交互式参数收集和工作流自动化,实现了官方MCP询问和智能参数引导两种模式,支持云端部署和本地集成。
一个支持MySQL、PostgreSQL和SQLite的MCP服务器,具有细粒度权限控制、多数据库支持和云就绪的SSL/TLS功能,采用适配器模式实现可扩展架构
Context Lens 是一个本地化语义搜索工具,可将任何内容转换为可搜索的知识库,让AI助手理解含义而非仅匹配关键词。它使用内置的LanceDB向量数据库,支持本地文件、GitHub仓库和URL内容,无需API密钥或云服务,完全在本地处理数据。
一个MCP服务器项目,允许用户将Python脚本部署到Modal平台,提供便捷的云端脚本运行服务。
一个基于MCP协议的阿里云OSS文件上传服务器,支持多账号管理和与其他MCP工具集成。
阿里云MCP服务提供与阿里云服务交互的工具,包括查询日志服务、管理ECS实例和部署无服务器功能。
Awesome MCP Servers 是一个精选的 Model Context Protocol (MCP) 服务器列表,涵盖了浏览器自动化、艺术与文化、云平台、命令行工具、通信、客户数据平台、数据库、开发者工具、文件系统、金融与金融科技、游戏、知识与记忆、位置服务、营销、监控、搜索、安全、旅行与交通、版本控制以及其他工具和集成等多个领域。
Hyperbolic GPU MCP服务器是一个基于Node.js的工具,允许用户通过API管理和租用Hyperbolic云平台上的GPU资源,包括查看可用GPU、租用实例、SSH连接及运行GPU工作负载等功能。