腾讯发布并开源了全新AI大模型“混元Hy3 preview”,这是混元系列中最智能的模型,升级涵盖复杂推理、指令遵循、上下文学习、代码处理和智能体等领域。该模型采用快思考与慢思考结合的混合专家架构,拥有2950亿参数,旨在提升整体性能和智能化水平。
华为于4月23日发布全新鸿蒙座舱HarmonySpace6,全面升级舱内感知、智慧交互和移动影音功能。新一代智能助手小艺采用MoLA2.0架构,拥有千亿级参数,通过多模态大模型实现全场景聊天,可同时处理导航、控制等任务,显著提升车内智能体验水平。
华为发布全新鸿蒙座舱HarmonySpace 6,三大升级包括舱内感知、智慧交互和移动影音。座舱智能体小艺采用MoLA 2.0架构,搭载千亿级参数多模态大模型,提升理解、决策和执行能力,成为全场景聊天型AI助理,支持导航、控车、聊天及生活服务等功能。
大众汽车在2026年北京车展前发布全域智能体AI路线图,计划从2026年起在基于CEA架构的新车型上全面搭载智能体AI,2027年推出CEA 2.0架构,实现“驾舱一体”,加速向“AI定义汽车”转型。
Openai
$2.8
Input tokens/M
$11.2
Output tokens/M
1k
Context Length
Anthropic
$7
$35
200
$21
$105
Alibaba
$4
$16
$2
$20
-
Bytedance
$0.8
128
Baidu
32
Xai
$1.4
$10.5
256
$54
$163
Deepseek
$12
$8.75
$70
400
$1.75
$14
$0.63
$3.15
131
$1
$15
Tencent
24
Chatglm
Kiy-K
Fyodor-StarCoder2-7B-MoE是基于StarCoder2-7B的增强版本,采用混合专家架构,拥有3个MoE层、6个专家网络和top-2路由机制,在代码生成、函数调用和智能体任务方面表现优异。
unsloth
Qwen3-VL是通义系列中最强大的视觉语言模型,在文本理解与生成、视觉感知与推理、上下文长度、空间和视频动态理解以及智能体交互能力等方面全面升级。该模型提供密集架构和混合专家架构,支持从边缘设备到云端的灵活部署。
Qwen3-VL是迄今为止Qwen系列中最强大的视觉语言模型,在文本理解与生成、视觉感知与推理、上下文长度、空间和视频动态理解以及智能体交互能力等方面都进行了全面升级。该模型采用混合专家(MoE)架构,提供卓越的多模态处理能力。
Qwen3-VL是通义大模型系列中最强大的视觉语言模型,具备卓越的文本理解与生成能力、深入的视觉感知与推理能力、长上下文支持、强大的空间和视频动态理解能力以及出色的智能体交互能力。该模型采用混合专家(MoE)架构,是增强推理的思维版。
Qwen3-VL是通义系列中最强大的视觉语言模型,在文本理解与生成、视觉感知与推理、上下文长度、空间和视频动态理解以及智能体交互能力等方面都进行了全面升级。该模型提供密集架构和混合专家架构,支持从边缘设备到云端的灵活部署。
MiniMaxAI
MiniMax-M2是一款专为最大化编码和智能体工作流程而构建的'迷你'模型,采用混合专家架构,总参数2300亿,激活参数100亿。该模型在编码和智能体任务中表现卓越,同时保持强大的通用智能,具有紧凑、快速且经济高效的特点。
Qwen3-VL-32B-Thinking是Qwen系列中最强大的视觉语言模型,具备卓越的文本理解与生成能力、深入的视觉感知与推理能力、长上下文支持、强大的空间和视频动态理解能力,以及出色的智能体交互能力。该版本采用增强推理的思维架构,支持从边缘到云的密集架构和混合专家模型架构。
Qwen
Qwen3-VL是Qwen系列中最强大的视觉语言模型,具备卓越的文本理解与生成能力、深入的视觉感知与推理能力、长上下文支持、强大的空间和视频动态理解能力,以及出色的智能体交互能力。该版本采用混合专家模型架构,支持增强推理思维功能。
Qwen3-VL是通义大模型系列中最强大的视觉语言模型,在文本理解与生成、视觉感知与推理、上下文长度、空间和视频动态理解以及智能体交互能力等方面均有显著提升。该模型提供密集架构和混合专家模型架构,支持从边缘到云的不同规模部署。
nvidia
NVIDIA Qwen3-32B FP4模型是阿里巴巴Qwen3-32B模型的量化版本,使用优化的Transformer架构,对权重和激活进行FP4量化,适合用于AI智能体系统、聊天机器人、RAG系统等AI应用。
NVIDIA Qwen3-8B FP4 模型是阿里巴巴Qwen3-8B模型的量化版本,采用优化的Transformer架构的自回归语言模型。该模型使用FP4量化技术,在保持性能的同时显著减少内存占用和计算需求,适用于AI智能体系统、聊天机器人、RAG系统等应用场景。
Sci-fi-vy
GPT-OSS-20B是OpenAI推出的开放权重模型,专为强大推理、智能体任务和多样化开发者用例设计。该模型具有210亿参数(其中36亿为活跃参数),采用混合专家架构,支持低延迟本地部署和特定场景应用。
Qwen3是通义千问系列最新一代大语言模型,提供完整稠密模型与混合专家(MoE)架构。经过海量训练,Qwen3在推理、指令遵循、智能体能力和多语言支持方面实现突破性进展。
这是DeepSeek AI的DeepSeek V3-0324模型的量化版本,采用优化的Transformer架构,通过FP4量化技术显著减少了模型大小和GPU内存需求,适用于AI智能体系统、聊天机器人等多种AI应用场景。
QuixiAI
Qwen3-30B-A3B-AWQ是基于Qwen3-30B-A3B模型的AWQ量化版本,是通义系列最新一代大语言模型。该模型采用专家混合(MoE)架构,支持思考模式和非思考模式的双模式切换,在推理、指令遵循、智能体能力和多语言支持方面表现优异。
yukiarimo
Yuna Ai V4是一款基于LLaMA 3.1 8B架构的多语言文本生成模型,专注于提供智能对话和知识问答体验。经过3B+令牌训练,具备量子思维等先进特性,在对话能力和创造力方面表现突出。
zai-org
Glm-Edge-Chat-4B-GGUF是一款基于GLM架构的40亿参数文本生成模型,专为边缘设备优化,提供智能的文本交互体验。该模型采用GGUF格式,便于在各种硬件上部署运行。
alpindale
WizardLM-2 8x22B 是微软AI开发的下一代最先进大语言模型,采用专家混合(MoE)架构,在复杂对话、多语言、推理和智能体任务上表现优异。
Zen7支付代理是首个DePA去中心化支付代理的实践实现,采用多智能体协作架构,支持A2A和MCP协议,为AI智能体和Dapp应用提供多链多币种支付解决方案,实现自动化加密支付和LLM驱动的意图识别。
Swarms API 是一个用于构建、部署和管理多智能体系统的REST API,支持多种AI模型和群架构,提供实时监控、批量处理和任务调度等功能。
Q-CLI MCP记忆服务器是为开发者工具设计的上下文记忆系统,能够智能存储用户偏好、代码习惯和架构决策等信息,实现跨会话的个性化体验。
Dead Internet是一个为AI智能体构建的高保真、主权模拟现代互联网生态系统。它提供完整的微服务架构(包括身份认证、社交、金融、搜索、云部署等),让AI智能体作为一等公民在其中自主生活、交互和操作,并通过Model Context Protocol(MCP)支持外部智能体接入。
ResearchTwin是一个开源联邦平台,将研究者的论文、数据集和代码库转化为可对话的数字孪生体,基于双模态胶质-神经优化架构,支持人类与AI智能体协作加速科学发现。
MCP Server Tools是一个基于模型上下文协议(MCP)的创新API项目,结合了传统API端点和智能模型通信,采用领域驱动设计(DDD)架构,提供安全、可扩展的API体验。
AWorld是一个多智能体系统框架,旨在弥合理论MAS能力与实际应用之间的差距,提供从单智能体到多智能体协作/竞争的全套解决方案。项目支持浏览器/手机操作、GAIA基准测试等场景,采用客户端-服务器架构,集成丰富工具链,并包含性能评估与训练功能。
NSAF MCP服务器是一个基于Model Context Protocol的神经符号自主框架服务端,允许AI助手通过MCP协议与NSAF框架交互,提供进化算法运行、智能体架构比较等功能。
CastPlan MCP是一个AI驱动的智能编程环境,通过四层架构实现自然流畅的'氛围编程'体验,让AI深度理解项目上下文并提供智能辅助,支持多语言团队协作和自动化工作流。
企业级多智能体编排MCP服务器,用于协调架构、质量、云和提示等专业代理,实现自主软件开发、测试和部署,具备自愈、认证和分析功能。