英伟达将发布专为推理计算设计的新处理器,整合Groq技术,应对AI智能体爆发带来的芯片需求从模型训练转向高效任务响应的市场变化。
宝马集团与瑞士海克斯康机器人合作,在德国莱比锡工厂部署AEON人形机器人,首次在欧洲生产体系中引入具身智能技术。该机器人具备类人化躯体与轮端移动能力,可灵活更换工具,将重点承担高压电池装配与零部件制造任务,旨在整合至汽车批量生产流程。项目已于2025年启动。
百度2025年第四季度财报显示,其AI业务收入占比达43%,成为核心业务。这打破了AI高成本的传统看法,标志着百度的“技术信仰”已从实验室走向商业价值。百度在芯片、云服务、模型和智能体等AI领域进行了全面布局。
苹果发布Xcode 26.3正式版,标志着其开发者工具正式进入“智能体编码”时代。新版本引入Anthropic与OpenAI的顶级AI技术,使开发者能直接调用全球顶尖AI能力,超越以往仅提供代码补全的辅助功能。
Ushur是一家AI自动化公司,利用人工智能技术提升客户体验,简化工作流程,并通过个性化互动和集成增强服务。
使用先进的人工智能技术,体验声音克隆和文字转语音应用。
基于支付宝的生活场景,通过领先的大模型技术,为企业快速构建专业级智能体。
数字化虚拟人与 AI 技术结合,打造全新智能交互体验。
Openai
$2.8
输入tokens/百万
$11.2
输出tokens/百万
1k
上下文长度
$7.7
$30.8
200
Anthropic
$7
$35
$21
$105
Alibaba
$4
$16
Baidu
-
32
Xai
$1.4
$10.5
256
$54
$163
Deepseek
$12
128
$8.75
$70
400
$1.75
$14
$1
$15
Chatglm
$8
$2
cyankiwi
MiniMax-M2 AWQ - INT4是基于MiniMax-M2模型进行量化后的版本,采用INT4量化技术,在保证性能的前提下显著减少内存使用并提高推理效率。该模型在编码和智能体任务方面表现出色,具有卓越的综合性能。
Qwen
Qwen3-VL-32B-Thinking-FP8是Qwen系列中最强大的视觉语言模型的FP8量化版本,采用块大小为128的细粒度fp8量化技术,性能指标与原始BF16模型几乎相同。该模型具备出色的文本理解与生成能力、深入的视觉感知与推理能力、长上下文支持以及强大的智能体交互能力。
nvidia
NVIDIA Qwen3-8B FP4 模型是阿里巴巴Qwen3-8B模型的量化版本,采用优化的Transformer架构的自回归语言模型。该模型使用FP4量化技术,在保持性能的同时显著减少内存占用和计算需求,适用于AI智能体系统、聊天机器人、RAG系统等应用场景。
这是DeepSeek AI的DeepSeek V3-0324模型的量化版本,采用优化的Transformer架构,通过FP4量化技术显著减少了模型大小和GPU内存需求,适用于AI智能体系统、聊天机器人等多种AI应用场景。
Qwen3-8B-AWQ是通义千问系列最新一代8.2B参数的大语言模型,采用AWQ 4-bit量化技术优化推理效率。支持思维与非思维模式切换,具备卓越的推理、指令遵循和智能体能力。
Qwen3-32B-AWQ是通义千问系列最新一代32.8B参数的大语言模型,采用AWQ 4-bit量化技术,支持思维与非思维模式切换,具备卓越的推理、指令遵循和智能体能力。
xwm
基于Llama-3.1-8B-Instruct微调的强化学习模型,采用元计划优化技术提升智能体规划能力
Essential MCP是一个革命性的人工智能与人类交互协议,通过上下文管理系统、工具集合和测试框架,实现更强大、更智能的协作体验。项目包含SSH服务器、Python API工具中心、统一上下文系统等核心组件,采用现代技术栈构建,并受到猫王创新精神的启发。
该项目是一个基于Yahoo Finance API的股票价格服务器,专为MCP(多智能体控制协议)设计,提供实时股票数据获取、观察列表管理、技术分析等功能。
MITRE ATT&CK MCP服务器是一个AI原生威胁情报工具,通过Model Context Protocol提供对MITRE ATT&CK框架的全面访问,包含200+技术、140+威胁组织、700+软件条目的查询能力,支持ATT&CK Navigator可视化层生成,专为安全团队和AI智能体设计。
A2A-MCP官方网站展示多智能体协作协议的技术愿景、核心优势和应用场景,采用现代化前端技术栈构建。
MCP说话人分离与识别系统是一个集成了GPU加速的说话人分离、语音识别、情感检测和Web界面的完整解决方案。它结合了pyannote.audio的说话人分离与faster-whisper转录技术,支持持久化说话人识别(一次注册,永久识别)、双检测器情感分析(结合通用AI与个性化声纹)、实时流处理、REST API和MCP服务器,专为AI智能体集成和爱好项目设计。