IDC报告预测,到2030年具身智能机器人将占机器人市场超30%份额。这类机器人融合AI、感知与计算技术,具备自主学习和决策能力,应用领域将快速扩展。
亚马逊云科技在re:Invent2025大会上推出Nova Forge和Nova Act两项生成式AI服务。Nova Forge旨在解决企业将专有知识融入AI模型的难题,避免传统方法如微调闭源模型、持续训练导致能力退化或从零训练的高成本问题。
Zig软件基金会因不满GitHub长期未修复致命bug,宣布迁移至Codeberg。导火索是2022年GitHub引入的safe_sleep脚本存在缺陷,若进程未在1秒内被调度,将导致无限挂起。此举引发开源社区对GitHub工程能力的质疑。
在2025年AWS re:Invent大会上,亚马逊云科技发布了新一代AI训练芯片Trainium3。该芯片采用3纳米制程,性能较上一代提升4倍,内存容量也增加4倍,能效提高40%,显著增强了高负载AI训练和推理能力。
Google DeepMind旗舰多模态AI,1M上下文,具备博士级推理与高级编码能力
Google基于Gemini 3 Pro的AI图像编辑器,推理强,生成编辑能力出色
免费开源,无需迁移,为现有Chrome浏览器添加AI超能力
测试你的vibe编码技能,评估AI使用能力,用于招聘AI人才
google
$2.16
Input tokens/M
$18
Output tokens/M
1M
Context Length
anthropic
$108
$540
200k
chatglm
$0.43
$1.01
131.1k
moonshotai
$4.1
$16.56
128k
xai
$21.6
mistral
-
upstage
64k
2M
reka-ai
$0.72
$2.88
alibaba
32k
智谱ai
$4.5
$22.5
aws
RinggAI
这是一个专为通话记录分析打造的混合语言AI模型,能够处理印地语、英语和混合印地英语的通话转录内容。模型基于Qwen2.5-1.5B-Instruct进行微调,具备强大的多语言理解和信息提取能力。
XiaomiMiMo
米模具身模型(MiMo-Embodied)是一款强大的跨具身视觉语言模型,在自动驾驶和具身AI任务中均展现出了卓越的性能。它是首个将这两个关键领域相结合的开源视觉语言模型,显著提升了在动态物理环境中的理解和推理能力。
allenai
Olmo-3-7B-Think-DPO是Allen Institute for AI开发的7B参数语言模型,具有长链式思考能力,在数学和编码等推理任务中表现出色。该模型经过监督微调、直接偏好优化和基于可验证奖励的强化学习等多阶段训练,专为研究和教育用途设计。
Olmo 3 7B RL-Zero Math是Allen AI开发的专为数学推理任务优化的70亿参数语言模型,采用RL-Zero强化学习方法在数学数据集上进行训练,能有效提升数学推理能力。
Olmo 3 7B RL-Zero Mix是Allen AI开发的7B参数规模的语言模型,属于Olmo 3系列。该模型在Dolma 3数据集上进行预训练,在Dolci数据集上进行后训练,并通过强化学习优化数学、编码和推理能力。
Olmo-3-32B-Think-DPO是Allen AI开发的32B参数语言模型,采用直接偏好优化(DPO)训练,具备长链式思维推理能力,在数学、编码等复杂推理任务上表现优异。
Kimi K2 Thinking 是月之暗面(Moonshot AI)开发的最新一代开源思维模型,具有强大的深度推理能力和工具调用功能。该模型采用混合专家架构,支持原生INT4量化,拥有256k上下文窗口,在多个基准测试中表现出色。
unsloth
Qwen3-VL-2B-Instruct是Qwen系列中最强大的视觉语言模型,具备卓越的文本理解与生成能力、深入的视觉感知与推理能力、长上下文支持以及强大的空间和视频动态理解能力。该模型采用2B参数规模,支持指令交互,适用于多模态AI应用。
pnnbao-ump
VieNeu-TTS是首个可在个人设备上运行的越南语文本转语音模型,具备即时语音克隆能力。基于NeuTTS Air微调,能够生成自然逼真的越南语语音,在CPU上具备实时性能。
LiquidAI
LFM2-VL-3B是Liquid AI开发的多模态视觉语言模型,基于LFM2骨干架构构建,具备强大的视觉理解和推理能力,特别在细粒度感知任务上表现出色。该模型能够高效处理文本和图像输入,支持高达512×512分辨率的原生图像处理。
Olmo-3-7B-Think-SFT是Allen Institute for AI开发的7B参数语言模型,具有长链式思考能力,在数学和编码等推理任务中表现优异。该模型基于Dolma 3数据集预训练,并在Dolci数据集上进行了后续训练。
hyperchainsad
这是一个基于Wan2.2-T2V-A14B基础模型训练的文本到视频LoRA模型,使用AI Toolkit工具包进行训练,专门用于增强文本到视频的转换能力。
mrgant
lans_v1 - lora是基于Qwen/Qwen-Image模型使用AI Toolkit by Ostris训练的文本到图像转换模型,采用LoRA技术进行优化,具备良好的图像生成能力。
cyburn
qwen_edit_photo_restore_v1-lora是一个基于Qwen-Image-Edit模型训练的LoRA适配器,专门用于图像编辑和修复任务。该模型使用AI Toolkit by Ostris进行训练,支持多种主流AI平台,提供高质量的图像处理能力。
Granite-4.0-Micro是IBM开发的具有30亿参数的长上下文指令模型,基于Granite-4.0-Micro-Base微调而来。该模型使用了开源指令数据集和内部合成数据集,具备增强的指令遵循和工具调用能力,支持多语言任务,可作为各领域AI助手的基础模型。
GLM-4.6是智谱AI推出的新一代文本生成模型,相比GLM-4.5在多个方面有显著改进,包括更长的上下文窗口、更优的编码性能和更强的推理能力。该模型在多个公开基准测试中表现出色,与国内外领先模型相比具有竞争优势。
GLM-4.6是智谱AI开发的新一代大语言模型,相比GLM-4.5在上下文处理、编码能力和推理性能方面有显著提升。该模型支持200K上下文长度,在多个公开基准测试中表现出色,特别在代码生成、推理和代理任务方面具有竞争优势。
zai-org
GLM-4.6是智谱AI推出的新一代文本生成模型,相比GLM-4.5在上下文处理、编码性能、推理能力等方面实现显著提升,支持200K上下文长度,具备更强的智能体能力和精致的写作能力。
GLM-4.6-FP8是智谱AI推出的新一代文本生成模型,相比GLM-4.5在多个关键方面有显著改进。该模型具有更长的上下文窗口、卓越的编码性能、高级推理能力和更强大的智能体功能,能够处理更复杂的任务。
amd
Llama-3.1-8B-onnx-ryzenai-npu是由AMD基于Meta的Llama-3.1-8B模型开发的优化版本,专门针对AMD Ryzen AI NPU进行优化部署。该模型通过Quark量化、OGA模型构建器和NPU专用后处理技术,在保持高质量文本生成能力的同时,显著提升了在AMD硬件上的推理效率。
Eino是一个专为Golang设计的LLM应用开发框架,旨在通过简洁、可扩展、可靠且高效的组件抽象和编排能力,简化AI应用开发流程。它提供丰富的组件库、强大的图形编排功能、完整的流处理支持以及高度可扩展的切面机制,覆盖从开发到部署的全周期工具链。
一个用于集成微软Bing搜索API的MCP服务器,支持网页、新闻和图片搜索功能,为AI助手提供网络搜索能力。
Crawl4AI RAG MCP Server是一个集成网络爬虫和RAG功能的AI代理服务,支持智能URL检测、递归爬取、并行处理和向量搜索,旨在为AI编码助手提供强大的知识获取和检索能力。
K8M是一款AI驱动的轻量级Kubernetes控制台工具,集成大模型能力,支持多集群管理和MCP服务。
一个基于Playwright的Node.js工具,能够绕过搜索引擎反爬机制执行Google搜索并提取结果,可作为命令行工具或MCP服务器为AI助手提供实时搜索能力。
DB MCP Server是一个支持多数据库的服务器,实现了模型上下文协议(MCP),为AI助手提供结构化访问数据库的能力。它支持MySQL和PostgreSQL,可同时连接多个数据库,自动生成专用工具,并遵循清晰架构设计。
DB MCP Server是一个实现模型上下文协议(MCP)的多数据库服务器,为AI助手提供结构化访问多种数据库的能力。
一个基于MCP协议的Word文档操作服务器,为AI助手提供创建、编辑和管理Microsoft Word文档的能力。
Peekaboo MCP是一个macOS工具,能够快速截取屏幕截图并通过AI分析内容,为AI助手提供视觉能力。
一个基于向量搜索的文档检索MCP服务,为AI助手提供相关文档上下文增强回答能力
HiMarket是一个开箱即用的企业级AI开放平台解决方案,提供管理后台、开发者门户和AI网关三大核心组件,支持将模型服务、MCP Server等AI能力打包成标准化API产品并发布。
Obsidian的MCP工具插件,为AI应用提供安全访问知识库的能力
一个MCP服务器,通过向量嵌入和语义相似性为任何AI模型提供智能搜索Claude Agent Skills的能力,实现渐进式技能发现和跨平台技能共享
Ultimate MCP Server是一个基于模型上下文协议(MCP)的AI代理操作系统,提供数十种强大工具能力,包括智能任务委派、文档处理、浏览器自动化、Excel操作等,通过标准化MCP工具实现AI代理的认知增强和复杂任务编排。
一个基于量子场计算模型的Claude多实例协同推理服务器,通过场一致性优化实现增强型AI推理能力。
一个专业的串口通信MCP服务器,为AI助手提供全面的串口通信能力,支持嵌入式系统、物联网设备和硬件调试,具有跨平台支持和多种数据格式处理功能。
飞书MCP服务器为AI编码工具提供飞书文档访问能力,支持文档创建、内容操作与编辑,提升开发效率。
OpenCV MCP Server是一个基于Python的计算机视觉服务,通过Model Context Protocol (MCP)提供OpenCV的图像和视频处理能力。它为AI助手和语言模型提供从基础图像处理到高级对象检测的全套计算机视觉工具,包括图像处理、边缘检测、人脸识别、视频分析和实时对象跟踪等功能。
Patchright Lite MCP Server是一个轻量级的浏览器自动化服务,基于Patchright Node.js SDK构建,通过Model Context Protocol为AI模型提供隐身的网页浏览和交互能力。
Minecraft MCP集成项目为AI助手提供了与Minecraft服务器交互的能力,通过机器人实现游戏世界的观察与操作。