阿里云在2026年5月20日峰会上宣布全面升级至“智能体时代”技术体系,重构芯片、云平台、模型到推理的完整链路,从服务人类转向支撑智能体全天候运行的“AI工厂”。核心底座包括平头哥真武M890芯片及超节点服务器,实现训推一体化,为海量智能体提供高效、持续的计算支持。
阿里云在2026峰会上发布新型AI服务平台“千问云”,定位为“为AI Agent而生的全栈智能基础设施”。该平台标志云计算范式从算力中心转向智能体中心,核心亮点在于实现模型服务的全量“Skill化”与“CLI化”,涵盖模型选型、资源调用、认证配置及用量查询等环节,全面重构大模型时代服务链路。
在2026阿里云峰会上,阿里巴巴发布基于平头哥“真武M890”AI芯片的128卡超节点服务器,搭载自研ICN Switch1.0互联芯片,实现百纳秒级超低通信时延。该服务器通过超节点架构将128张芯片融合为超级计算机,旨在应对智能体时代的极致算力挑战,未来重点服务海量AI Agent。
谷歌与黑石集团计划合资成立人工智能云计算公司,黑石出资50亿美元并持多数股权,谷歌提供TPU芯片、软件栈及云服务等核心技术。双方联手旨在抢占下一代算力基建制高点,标志着科技与资本巨头正加速重塑全球AI基础设施竞争格局。
Adapt是专为企业打造的AI计算机,连接多工具,服务全团队。
AI驱动的财务指导软件,含个性化退休数字和智能计算器,无需银行链接。
将浏览器转变为代理原生计算机,借助超150种AI模型的Claude Code委托工作。
开源自托管的个人 AI 助手,控制你的计算机。
Xai
$1.4
Input tokens/M
$3.5
Output tokens/M
2k
Context Length
Openai
$7.7
$30.8
200
Anthropic
$105
$525
Google
$0.7
$2.8
1k
$7
$35
$2.1
$17.5
$21
Alibaba
-
Baidu
128
$6
$24
256
Bytedance
$1.2
$3.6
4
$2
$3.9
$15.2
64
Salesforce
CoDA是Salesforce AI Research研发的基于扩散模型的代码生成语言模型,具备双向上下文理解能力,专为强大的代码生成和补全任务而设计。该模型仅17亿参数,在保持低计算要求的同时实现了卓越的代码生成性能。
nvidia
NVIDIA Qwen3-8B FP4 模型是阿里巴巴Qwen3-8B模型的量化版本,采用优化的Transformer架构的自回归语言模型。该模型使用FP4量化技术,在保持性能的同时显著减少内存占用和计算需求,适用于AI智能体系统、聊天机器人、RAG系统等应用场景。
DevQuasar
本项目提供腾讯混元-MT-7B大语言模型的量化版本,通过模型压缩技术降低计算和存储需求,致力于让知识为每个人所用,使高性能AI模型更加普及和易用。
TildeAI
TildeOpen LLM 是一个开源的基础语言模型,专门为服务代表性不足的北欧和东欧语言而设计。该模型由欧盟委员会资助,在LUMI超级计算机上训练,拥有300亿参数,解决了19种重点语言使用者在现有AI系统中面临的性能差距问题。
cpatonn
GLM-4.5V-AWQ-4bit是基于智谱AI下一代旗舰文本基础模型构建的量化版本多模态模型,通过AWQ-4bit量化技术优化,在保持优异性能的同时显著降低计算资源需求。该模型在42个公开视觉语言基准测试中达到同规模模型的SOTA性能,具备强大的视觉推理能力。
mlx-community
GLM-4.5-Air-8bit是基于智谱AI的GLM-4.5-Air模型转换而来的8位量化版本,专门为MLX框架优化。该模型保持了原版强大的自然语言处理能力,同时通过量化技术减少了内存占用和计算需求,适合在Apple Silicon设备上高效运行。
unsloth
LFM2-350M是由Liquid AI开发的第二代混合模型,专为边缘AI和设备端部署设计。该模型在质量、速度和内存效率方面树立了新标准,具有3.5亿参数,支持多种语言,适用于边缘计算场景。
sergeyzh
该模型用于计算俄语和英语句子的嵌入向量,通过蒸馏ai-forever/FRIDA的嵌入向量获得。模型属于uncased类型,不区分文本中的大小写字母。
cortexso
Deepscaler是一款基于DeepScaleR-1.5B-Preview开发的高级AI模型,专注于提升机器学习任务的效率与可扩展性。该模型提供高质量的预测分析和数据处理能力,适用于自然语言处理、计算机视觉等复杂场景,在金融、医疗和娱乐等行业有广泛应用。
shawhin
该模型是基于DistilRoBERTa的句子转换器,专门针对AI职位描述进行微调,用于计算句子相似度
timm
AIM-v2是一个高效的图像编码器,基于timm库实现,适用于多种计算机视觉任务。
AIM-v2是一个高效的图像编码器模型,兼容timm框架,适用于计算机视觉任务。
tensorblock
GPT4All Falcon是基于Falcon架构的大语言模型,由Nomic AI开发。该模型经过量化处理,提供多种精度版本,适用于不同的计算资源和质量需求场景。
TheBloke
Deepseek Coder 6.7B Instruct 是一个专注于编程任务的AI助手模型,由DeepSeek公司开发。它专门用于回答与计算机科学相关的问题,拒绝回答非技术性问题。
adept
Adept Persimmon-8B是一个拥有80亿参数的大语言模型,专门设计用于构建AI智能体,能够协助用户在计算机上完成各类任务。该模型从头开始训练,具有16K的上下文长度,是LLaMA2的4倍,GPT-3和MPT等模型的8倍。
Sail是一个旨在统一流处理、批处理和计算密集型(AI)工作负载的项目,提供了Spark SQL和Spark DataFrame API的替代方案,支持单机和分布式环境。
Klavis AI是一个开源项目,提供在Slack、Discord和网页上使用的多功能计算平台(MCP),支持非技术用户轻松配置AI工作流,开发者可扩展构建。
基于mcp-server的项目,支持AI大模型高效调用spinq的量子计算硬件资源,提供Windows和macOS的一键安装脚本,自动检测Python环境并安装依赖。
一个基于量子场计算模型的Claude多实例协同推理服务器,通过场一致性优化实现增强型AI推理能力。
MoziChem-MCP是一个基于Model Context Protocol(MCP)的化学工程与化学应用服务器集合,提供热力学模型、状态方程计算、相平衡计算等专业工具,支持AI助手进行复杂的化学工程计算。
OpenCV MCP Server是一个基于Python的计算机视觉服务,通过Model Context Protocol (MCP)提供OpenCV的图像和视频处理能力。它为AI助手和语言模型提供从基础图像处理到高级对象检测的全套计算机视觉工具,包括图像处理、边缘检测、人脸识别、视频分析和实时对象跟踪等功能。
Android-MCP是一个轻量级开源项目,作为AI代理与Android设备之间的桥梁,通过MCP服务器实现真实任务操作如应用导航、UI交互和自动化测试,无需依赖传统计算机视觉或预设脚本。
pyResToolbox MCP服务器是一个生产就绪的AI工具,将石油工程计算库pyResToolbox的47个工具通过Model Context Protocol集成到Claude等AI助手中,支持PVT分析、井性能计算、油藏模拟等专业计算。
一个基于MCP协议的数学计算服务器,提供加减乘除、幂运算和对数等基础数学工具,支持通过Stdio传输与Pydantic AI代理集成
一个完全在本地运行的隐私优先文档搜索服务器,通过MCP协议为AI编程工具提供语义搜索功能,无需API密钥或云端服务,所有数据处理均在用户计算机上完成。
一个为AI代理提供SEC EDGAR数据访问和交互的模块化计算平台服务器。
工业物联网与边缘计算的MCP服务器,通过HTTP端点提供11种工具,实现AI驱动的工业自动化、预测性维护和智能工厂操作,支持MQTT、Modbus等多种协议。
YOLO MCP服务是一个强大的计算机视觉服务,通过模型上下文协议(MCP)与Claude AI集成,提供物体检测、分割、分类和实时摄像头分析功能。
Illumio MCP服务器是一个提供与Illumio策略计算引擎(PCE)交互接口的服务,支持通过对话式AI管理负载、标签和流量分析。
Bridge MCP是一个基于模型上下文协议(MCP)的Windows PC控制服务器,允许任何AI通过本地代理程序完全控制计算机,包括应用程序控制、鼠标键盘操作、屏幕捕获、系统命令执行、浏览器自动化和剪贴板管理等功能。
MCP Calc Tools是一个提供高级数学和金融计算工具的服务器,为AI代码助手集成标准化计算接口。
这是一个通过MCP协议控制Commodore 64 Ultimate硬件的服务器,允许AI助手(如Claude)通过网络与复古计算机进行交互,实现编程、运行游戏、播放音乐、管理磁盘等操作。
本项目是基于MCP协议的Python服务器,提供水土保持技术规范查询及计算功能,包括曼宁系数、土压力系数、排水沟流速、边坡稳定等工程计算,以及台湾地区经纬度与UTM/TWD97坐标转换。适用于AI应用整合。
一个基于Python的数学代理系统,集成AI、Word和Gmail功能,提供数学计算、可视化及邮件报告服务。
MCP Hub是一个用于创建和管理模型上下文协议(MCP)服务器与客户端的框架,集成了UV工具以简化包管理和配置。项目包含AI相关的计算机视觉脚本和数据集处理工具,支持快速部署和开发。