加拿大初创企业Cohere与德国初创企业Aleph Alpha达成200亿美元合作,共同开发“主权”人工智能系统,旨在建立不依赖美国和中国的人工智能架构,推进跨大西洋技术自主性。Cohere专注自然语言处理,Aleph Alpha擅长推理模型,双方将结合技术优势,加速AI自主发展。
Meta发布新一代自研AI芯片MTIA3,旨在减少对外部算力依赖。该芯片专为推荐系统和推理任务定制,在内部测试中,其推理效能已超越英伟达H100。
阿里云推出DataAgent虚拟AI数据分析师,基于Spring AI Alibaba生态构建,旨在解决业务人员与核心数据间的“SQL鸿沟”。该系统将确定性工程流程与大模型推理能力结合,实现数据查询的自动化与智能化,提升复杂统计分析和根因定位效率。
杨立昆创立的AMI公司获10.3亿美元融资,投前估值达35亿美元。该公司致力于将具备推理、规划和世界建模能力的AI系统商业化,试图挑战当前以“预测下一个单词”为核心的大语言模型范式。
3FS是一个高性能分布式文件系统,专为AI训练和推理工作负载设计。
DeepSeek-V3/R1 推理系统是一个高性能的分布式推理架构,专为大规模 AI 模型优化设计。
Openai
$2.8
Input tokens/M
$11.2
Output tokens/M
1k
Context Length
Xai
$1.4
$3.5
2k
-
Anthropic
$7
$35
200
Google
$2.1
$17.5
$21
$105
$0.7
Alibaba
$4
$16
Baidu
128
$6
$24
256
$2
Moonshot
Bytedance
nvidia
NVIDIA Qwen3-14B FP4模型是阿里巴巴Qwen3-14B模型的量化版本,采用FP4数据类型进行优化,通过TensorRT-LLM进行高效推理。该模型专为NVIDIA GPU加速系统设计,适用于AI Agent系统、聊天机器人、RAG系统等多种AI应用场景,支持全球范围内的商业和非商业使用。
NVIDIA-Nemotron-Nano-9B-v2是NVIDIA从头训练的大语言模型,专为推理和非推理任务设计。采用Mamba2-Transformer混合架构,支持多语言处理,具备可控推理能力,允许用户指定思考预算,在商业应用和AI代理系统中表现出色。
danielkty22
TARS-SFT-7B是一个基于监督微调的安全推理模型,作为强化学习训练的基础模型,专门设计用于增强AI系统的安全性。该模型从Qwen2.5-7B-Instruct开始训练,通过推理过程作为自适应防御机制来提升模型的安全性能。
dmis-lab
猫鼬-8B是基于Meta的Llama-3-8B-Instruct模型开发的医疗AI系统,通过合成数据集进行指令微调,具备高级医学推理能力,专门用于解决复杂医学问题。
or4cl3ai
Aiden T5 是一款具有互联网访问能力和信念-愿望-意图(BDI)系统的突破性 transformers 模型,结合了 transformer 语言模型的强大能力与通过互联网及自身认知进行学习和推理的能力。
NotHumanAllowed是一个多智能体认知数据集生成引擎,通过38个专业AI代理进行多轮审议,产生可审计的推理轨迹和结构化知识记录,用于训练下一代AI系统。
MCP Thought Server是一个为AI代理提供高级思维工具的服务,通过模型上下文协议(MCP)增强推理、规划和迭代优化能力。它包含结构化思维、迭代草稿和集成思维等工具,支持SQLite持久化和高级置信度评分系统,可配置环境变量以适应不同需求。
Archon是一个自主构建和优化AI代理的智能系统,通过迭代开发展示现代AI的关键原则,包括代理推理、领域知识整合和可扩展架构。当前版本V4提供了全面的Streamlit界面,支持Docker部署,并与MCP服务集成以实现AI IDE的无缝对接。
Allora MCP服务器是一个基于Model Context Protocol(MCP)的实现,提供从Allora网络获取机器学习推理数据的功能,使AI系统能够无缝访问Allora预测市场数据。
Adaptive MCP Server是一个先进的AI推理系统,通过多策略推理、实时研究和综合验证,为复杂问题提供智能解决方案。
Sensei MCP是一个多角色工程导师系统,集成了64个专业AI角色,通过协作指导提供工程标准和建议。它能在Claude推理前注入相关工程规范,支持多种文件类型和上下文感知,并具备会话记忆和团队协作功能。
IntelliGlow是一个基于MCP协议的智能照明系统,通过AI助手控制真实智能灯泡,支持语音命令、AI推理和直接硬件控制,实现自然语言交互和智能灯光管理。