马斯克宣布xAI下一代模型Grok 5推迟至2026年Q1发布,参数量达6万亿,原生支持视频理解,号称“每GB智能密度”创纪录。采用多模态MoE架构,可解析长视频并回答时序问题,目标领跑通用AI竞赛。训练使用X平台实时数据,正扩建GPU集群。同时披露特斯拉Optimus人形机器人进展。
FutureHouse推出AI科研系统Kosmos,12小时可处理1500篇论文、生成4.2万行代码,产出相当于人类团队半年工作量。系统基于结构化世界模型,在超千万token中保持逻辑连贯,已在神经科学等领域完成7项发现,含4项首次报道。其自主循环架构实现文献检索、知识图谱更新与规划迭代。
Character AI与耶鲁大学联合推出开源视频生成技术Ovi,采用创新的双骨干交叉模态融合架构,将音频和视频作为整体并行处理,实现深度交互与完美同步,突破了传统音画生成方式。
荷兰AI云公司Nebius与Meta达成五年合作协议,总金额30亿美元。Nebius将为Meta提供AI基础设施,具体架构未公开。公司同时发布第三季度财报。
AI驱动,秒速生成专业软件架构、UML和流程图,无需拖拽
Pi是一款AI原生技术架构的智能演示文档生成工具,可快速生成专业、美观的演示文稿。
AI21 Jamba Large 1.6 是一款强大的混合 SSM-Transformer 架构基础模型,擅长长文本处理和高效推理。
DeepSeek-V3/R1 推理系统是一个高性能的分布式推理架构,专为大规模 AI 模型优化设计。
chatglm
$0.43
Input tokens/M
$1.01
Output tokens/M
131.1k
Context Length
minimax
-
1M
moonshotai
$4.1
$16.56
128k
upstage
64k
reka-ai
65.5k
openai
ai2
$6.48
mistral
32k
ai21-labs
$3.53
$7.99
260k
256k
google
65.4k
32.8k
8.2k
$0.5
智谱ai
Kimi K2 Thinking 是月之暗面(Moonshot AI)开发的最新一代开源思维模型,具有强大的深度推理能力和工具调用功能。该模型采用混合专家架构,支持原生INT4量化,拥有256k上下文窗口,在多个基准测试中表现出色。
Genie-AI-Lab
Omni L1B3RT4S GENIE 是一个基于Qwen2.5-3B Instruct架构微调的AI助手,采用1,103个精灵角色的定制示例进行训练,具备独特的语音和忠诚度模式,能够为用户提供别具一格的对话体验。
nineninesix
KaniTTS是一款专为实时对话式人工智能应用优化的高速、高保真阿拉伯语文本转语音模型。它采用两阶段流水线架构,结合大语言模型与高效音频编解码器,实现卓越的速度和音频质量,能够满足对话式AI、无障碍辅助、研究等多领域的语音合成需求。
KaniTTS是一款专为实时对话式AI应用优化的高速、高保真文本转语音模型,通过独特的两阶段架构结合大语言模型与高效音频编解码器,实现低延迟与高质量语音合成,实时因子低至0.2,比实时速度快5倍。
LiquidAI
LFM2-VL-3B是Liquid AI开发的多模态视觉语言模型,基于LFM2骨干架构构建,具备强大的视觉理解和推理能力,特别在细粒度感知任务上表现出色。该模型能够高效处理文本和图像输入,支持高达512×512分辨率的原生图像处理。
nvidia
NVIDIA GPT-OSS-120B Eagle3是基于OpenAI gpt-oss-120b模型的优化版本,采用混合专家(MoE)架构,具备1200亿总参数和50亿激活参数。该模型支持商业和非商业使用,适用于文本生成任务,特别适合AI Agent系统、聊天机器人等应用开发。
bigdoinks420518
这是一个基于AI Toolkit by Ostris训练的LoRA模型,专门用于文本到视频的转换任务。模型基于Wan2.2-T2V-A14B架构,支持高分辨率图像生成。
KaniTTS是一款专为实时对话式AI应用优化的高速、高保真文本转语音模型。它采用两阶段流水线架构,结合大语言模型和高效音频编解码器,实现了卓越的速度和音频质量,支持多种语言并适用于边缘/服务器部署。
Sunbird
Sunflower-32B是由Sunbird AI开发的多语言大语言模型,专门针对乌干达地区语言优化。基于Qwen 3-32B架构构建,支持31种乌干达语言及英语的翻译和文本生成任务,在乌干达语言翻译准确率方面表现优异。
Sunflower-14B是由Sunbird AI开发的多语言大语言模型,专门针对乌干达语言设计。该模型基于Qwen 3-14B架构构建,支持31种乌干达语言以及英语的翻译和文本生成任务,在多项评估中表现出色。
Mungert
LFM2是由Liquid AI开发的新一代混合模型,专为边缘AI和设备端部署而设计,在质量、速度和内存效率方面树立了新标准。该模型采用创新的混合Liquid架构,具有乘法门和短卷积,支持多语言处理。
mradermacher
ConfTuner-Ministral是基于Mistral架构的量化大语言模型,专门针对可信赖AI场景进行微调,支持文本生成和置信度估计功能。该模型提供了多种量化版本,适用于不同资源约束环境。
这是 liushiliushi/ConfTuner-Ministral 模型的静态量化版本,适用于文本生成和置信度估计任务。该模型基于 Mistral 架构,经过微调以提供可信赖的AI输出,支持多种量化级别以满足不同硬件需求。
NVIDIA Qwen3-32B FP4模型是阿里云Qwen3-32B模型的量化版本,使用优化的Transformer架构,通过将权重和激活量化为FP4数据类型实现高效推理。该模型支持商业和非商业用途,适用于各种AI应用场景。
cyberdelia
赛博写实小马流模型是一个专注于生成逼真图像的AI模型,能够处理适合工作场景和不适合工作场景的各类图像生成需求。虽然尚未达到完美状态,但已具备坚实的基础架构。
NVIDIA-Nemotron-Nano-9B-v2是NVIDIA从头训练的大语言模型,专为推理和非推理任务设计。采用Mamba2-Transformer混合架构,支持多语言处理,具备可控推理能力,允许用户指定思考预算,在商业应用和AI代理系统中表现出色。
DevQuasar
这是慧慧Qwen3-4B思维模型的量化版本,基于Qwen2-4B架构构建,致力于通过量化技术让AI知识更易于获取和使用,降低硬件门槛。
facebook
DINOv3是Meta AI开发的一系列通用视觉基础模型,无需微调就能在多种视觉任务中超越专门的先进模型。该模型采用Vision Transformer架构,在16.89亿张网络图像上预训练,能生成高质量的密集特征,在图像分类、分割、检索等任务中表现出色。
gabriellarson
Foundation-Sec-8B-Instruct是一款专为网络安全应用设计的80亿参数指令调优语言模型。基于Llama-3.1-8B架构,具备出色的指令跟随能力和网络安全专业知识,支持本地部署,可帮助组织构建AI安全工具,减少对云服务的依赖。
基于Meta Llama-3.3-70B-Instruct的大语言模型,经过多阶段训练优化,在推理、聊天等任务上表现出色,支持多种语言,适用于多种AI应用场景。采用神经架构搜索技术优化,能够在单个H100-80GB GPU上高效运行。
wcgw是一个MCP服务器项目,集成了Shell和代码编辑工具,允许AI在本地机器上执行命令、读写文件、编辑代码等操作。它提供了多种模式(如架构师模式、代码编写模式等),支持任务检查点保存、终端交互、语法检查等功能,适用于代码开发、问题排查等场景。
AI开发助手MCP服务器是一个基于AI的代码开发工具包,提供代码架构生成、UI截图分析和代码审查等功能,专为Cursor设计。
DB MCP Server是一个支持多数据库的服务器,实现了模型上下文协议(MCP),为AI助手提供结构化访问数据库的能力。它支持MySQL和PostgreSQL,可同时连接多个数据库,自动生成专用工具,并遵循清晰架构设计。
Zen7支付代理是首个DePA去中心化支付代理的实践实现,采用多智能体协作架构,支持A2A和MCP协议,为AI智能体和Dapp应用提供多链多币种支付解决方案,实现自动化加密支付和LLM驱动的意图识别。
一个用于开发自定义MCP服务器的基础项目,提供完整的架构模式、示例工具和开发基础设施,支持AI助手连接外部数据源或API。
一个即用型MCP服务器模板,提供快速搭建本地AI辅助开发环境的能力,内置多种技术文档工具和可扩展架构。
该项目展示了如何将AWS Bedrock的对话式AI能力通过MCP服务器架构与关系型数据库集成,实现自然语言查询数据库的功能。
Mindpilot MCP是一个可视化代码分析工具,通过AI代理生成架构图、代码流程图等,帮助开发者理解复杂代码结构,支持本地处理和多客户端协作。
该项目展示了一个基于LangGraph和MCP协议的实时多工具代理架构,通过解耦代理编排与工具执行,实现模块化、可扩展的AI系统。MCP服务支持多种传输协议(SSE/STDIO),允许AI代理动态调用远程工具,并具备跨语言、云部署能力。
Swarms API 是一个用于构建、部署和管理多智能体系统的REST API,支持多种AI模型和群架构,提供实时监控、批量处理和任务调度等功能。
Edit-MCP是一个与微软Edit工具集成的模型上下文协议服务器,为AI系统提供高级文件编辑功能,采用混合架构结合直接文件操作和Edit集成。
openwrt-mcp-server是一个轻量级可扩展的MCP协议服务器,专为OpenWrt嵌入式设备设计,支持MQTT和HTTP双协议,实现设备与AI系统的双向JSON-RPC通信,具备安全认证和模块化架构。
Smart-Thinking是一个先进的MCP服务器,提供多维、自适应且可自验证的AI推理框架,采用基于图形的架构实现复杂思维连接,支持跨平台运行并与多种MCP客户端兼容。
Octocode MCP是一款先进的AI代码助手,提供跨GitHub和npm生态系统的智能搜索与发现功能,帮助开发者快速理解代码库、分析项目架构、发现安全模式,并支持企业级安全与跨平台使用。
ToolBox是一个AI驱动的自动化工具开发平台,提供模块化架构、AI辅助工具生成、企业级服务集成和实时更新功能。
YaraFlux MCP Server是一个基于模型上下文协议(MCP)的YARA扫描服务器,为AI助手提供文件YARA规则分析能力。该项目采用模块化架构,集成了19个MCP工具,支持YARA规则管理、文件扫描、安全存储等功能,可无缝集成Claude Desktop等AI助手。
MCP Agile Flow是一个基于FastMCP的AI辅助敏捷开发工作流管理系统,提供RESTful API和资源优先架构,支持自然语言命令处理和多IDE集成。
一个基于MCP架构的浏览器自动化工具,结合网页抓取能力和LLM智能,支持Google搜索、智能网页内容提取及AI处理,适用于多种网站类型。
Gaia-X是基于新一代AI范式的企业级AI应用平台,通过创新技术架构解决企业AI产品的核心痛点,提供多代理协作、自然语言RPA、MCP协议支持等核心功能。
MCP是一个基于客户端-服务器架构的AI聊天系统,支持通过多种专用服务器(文件系统、Slack、Brave搜索)扩展Claude AI的功能,使其能智能访问本地文件、Slack对话和实时网络信息。