谷歌DeepMind推出AI框架“AlphaProof Nexus”,通过四级智能体架构协同,在数学研究领域取得重大突破,成功解开两道悬而未决56年的埃尔德什难题。系统从基础模型与Lean编译器循环交互入手,逐步提升推理复杂度,展现了AI在形式化验证与数学推理中的强大潜力。
面壁智能联合清华大学及OpenBMB开源社区,发布并开源了中国首个基于华为昇腾平台训练的三值(1.58-bit)大模型BitCPM-CANN。该模型在低比特训练领域取得突破,实现从量化算子到训练算法的全链路原生开发,推出0.5B至8B四个尺寸版本,展示了国产算力平台的强大实力。
腾讯云宣布,其智能体开发平台中的Hy3 preview和DeepSeek-V4-Pro模型将于2026年5月27日10:00结束限时免费公测。这两个模型在公测期间广受关注,提供强大智能化解决方案,助力开发者和企业提升效率与业务能力。腾讯云表示,经过长时间调试测试,模型现已具备更高稳定性和智能水平。
谷歌推出面向安卓平台的Gemini Intelligence功能套件,并非品牌重塑,而是一套高级AI能力。它能在后台自主执行多步骤任务,跨应用和网站自动检索处理信息。为支持强大本地AI模型,设备需至少配备12GB运行内存,这限制了新特性的适用设备范围。
AI驱动的无代码Discord机器人制作工具,可快速创建强大机器人。
Veo 4是强大AI视频生成器,5月19日推出,现可免费预订早鸟访问。
Viewmax Studio是强大的AI图像转视频生成器,能快速制作高质量视频
无需编码,借助AI将想法转化为强大的网站和应用程序
Tencent
-
Input tokens/M
Output tokens/M
24
Context Length
Baidu
32
Xai
$21
$105
128
Baichuan
Chatglm
Minimax
8
EssentialAI
Rnj-1-instruct 是由 Essential AI 从头开始训练的 80 亿参数开放权重密集模型,针对代码、STEM 领域、智能体能力和工具调用进行了优化。它在多种编程语言中表现出色,同时在数学和科学领域也展现出强大实力,能力与最先进的开放权重模型相当。
NewBie-AI
NewBie image Exp0.1 是一个基于 Next-DiT 架构开发的高效图像生成基础模型,专门用于生成高质量的动漫风格图像。它融合了先进的文本编码器和视觉组件,支持自然语言和结构化标签输入,是多角色动漫图像生成的强大工具。
RinggAI
这是一个专为通话记录分析打造的混合语言AI模型,能够处理印地语、英语和混合印地英语的通话转录内容。模型基于Qwen2.5-1.5B-Instruct进行微调,具备强大的多语言理解和信息提取能力。
Gjm1234
Wan2.2是基础视频模型的重大升级版本,专注于将有效MoE架构、高效训练策略和多模态融合等创新技术融入视频扩散模型,为视频生成领域带来更强大、更高效的解决方案。
MCG-NJU
SteadyDancer是一个基于图像到视频范式的强大动画框架,专门用于生成高保真且时间连贯的人体动画。该框架通过稳健的首帧保留机制,有效解决了传统方法中的身份漂移问题,在视觉质量和可控性上表现出色,同时显著减少了训练资源需求。
pramjana
Qwen3-VL-4B-Instruct是阿里巴巴推出的40亿参数视觉语言模型,基于Qwen3架构开发,支持多模态理解和对话任务。该模型具备强大的图像理解和文本生成能力,能够处理复杂的视觉语言交互场景。
aisingapore
Qwen-SEA-LION-v4-4B-VL 是一个基于 Qwen3-VL-4B-Instruct 架构构建的 40 亿参数视觉语言模型。它专门针对东南亚地区进行了指令微调,具备多语言和多元文化能力,支持英语及七种东南亚语言,并保留了强大的视觉-语言理解能力。
Nanbeige
楠米色4-3B-思维-2511是楠米色系列的最新增强版本,通过先进的蒸馏技术和强化学习优化,在紧凑的3B参数规模下实现了强大的推理能力。该模型在Arena-Hard-V2和BFCL-V4等基准测试中,在参数小于32B的模型中取得了最先进(SOTA)成果。
OpenMMReasoner
OpenMMReasoner是一个完全透明的两阶段多模态推理方案,涵盖有监督微调(SFT)和强化学习(RL)。该方案通过精心构建高质量数据集,在多个多模态推理基准测试中超越了强大的基线模型,为未来大规模多模态推理研究奠定了坚实的实证基础。
XiaomiMiMo
米模具身模型(MiMo-Embodied)是一款强大的跨具身视觉语言模型,在自动驾驶和具身AI任务中均展现出了卓越的性能。它是首个将这两个关键领域相结合的开源视觉语言模型,显著提升了在动态物理环境中的理解和推理能力。
sbintuitions
Sarashina2.2-Vision-3B是由SB Intuitions训练的日本大型视觉语言模型,基于Sarashina2.2-3B-Instruct和SigLIP图像编码器构建,具备强大的图像到文本转换能力,支持日语和英语的多模态处理。
Guilherme34
Qwen3-32B是Qwen系列最新一代的大语言模型,具备强大的推理、指令遵循、智能体交互和多语言处理能力。它支持100多种语言和方言,能在思维模式和非思维模式间无缝切换,为用户提供自然流畅的对话体验。
sensenova
SenseNova-SI是基于多模态基础模型构建的空间智能增强模型系列,通过精心策划的800万样本数据训练,在多个空间智能基准测试中取得了优异表现,同时保持了强大的通用多模态理解能力。
MedSwin
本项目是使用mergekit对预训练语言模型进行合并的成果,结合了多个医学领域的预训练模型,为医学问答任务提供了更强大的支持,可有效提升医学问题回答的准确性和效率。
cyankiwi
ERNIE-4.5-VL-28B-A3B-Thinking AWQ - INT8是基于百度ERNIE-4.5架构的多模态大语言模型,通过AWQ量化技术实现8位精度,在保持高性能的同时大幅降低内存需求。该模型在视觉推理、STEM问题解决、图像分析等方面表现出色,具备强大的多模态理解和推理能力。
SenseNova-SI是基于成熟多模态基础模型构建的空间智能增强模型系列,通过精心策划的800万数据样本训练,在多个空间智能基准测试中展现出卓越性能,同时保持强大的通用多模态理解能力。
HIT-TMG
Uni-MoE 2.0-Image 是基于 Uni-MoE 2.0-Omni 派生而来的视觉生成模型,在视觉生成数据上进行了专门微调,具备强大的图像生成和编辑能力。
DavidAU
这是一个增强版的多模态视觉语言模型,基于Qwen3-VL-8B-Thinking模型,通过Brainstorm 20x技术扩展至12B参数,采用NEO Imatrix增强的GGUF量化。模型具备强大的图像理解、文本生成和多模态推理能力,在视觉感知、文本质量和创意场景方面都有显著提升。
moonshotai
Kimi K2 Thinking 是月之暗面(Moonshot AI)开发的最新一代开源思维模型,具有强大的深度推理能力和工具调用功能。该模型采用混合专家架构,支持原生INT4量化,拥有256k上下文窗口,在多个基准测试中表现出色。
redponike
Qwen3-VL-4B-Instruct 是通义千问系列最新的视觉语言模型,在4B参数规模下实现了卓越的视觉感知、文本理解与生成、空间推理和智能体交互能力。它支持长上下文和视频理解,具备强大的OCR和多语言处理能力。
BrowserTools MCP是一个强大的浏览器监控与交互工具,通过Chrome扩展和本地服务器实现AI对浏览器的智能分析与操作。
Eino是一个专为Golang设计的LLM应用开发框架,旨在通过简洁、可扩展、可靠且高效的组件抽象和编排能力,简化AI应用开发流程。它提供丰富的组件库、强大的图形编排功能、完整的流处理支持以及高度可扩展的切面机制,覆盖从开发到部署的全周期工具链。
Serena是一个强大的开源编码代理工具包,能够将LLM转化为可直接在代码库上工作的全功能代理。它提供类似IDE的语义代码检索和编辑工具,支持多种编程语言,并可通过MCP协议或Agno框架与多种LLM集成。
MiniMax Model Context Protocol (MCP) 是一个官方服务器,支持与强大的文本转语音、视频/图像生成API交互,适用于多种客户端工具如Claude Desktop、Cursor等。
Blender MCP VXAI 是一个强大的集成工具,允许用户通过自然语言控制 Blender,实现 3D 建模、动画和场景的创建与修改。它简化了复杂操作,并支持实时导出到项目中。
Crawl4AI RAG MCP Server是一个集成网络爬虫和RAG功能的AI代理服务,支持智能URL检测、递归爬取、并行处理和向量搜索,旨在为AI编码助手提供强大的知识获取和检索能力。
GhidrAssistMCP是一个强大的Ghidra扩展,通过实现模型上下文协议(MCP)服务器,使AI助手和其他工具能够通过标准化API与Ghidra的反向工程功能交互。
Kubernetes MCP服务器是一个强大的Kubernetes模型上下文协议实现,支持Kubernetes和OpenShift集群操作,无需依赖外部工具即可执行各种资源管理任务。
Nexus MCP是一个强大的个人助手服务器,集成了Google日历、Obsidian笔记、Trello看板和网页解析功能,通过FastMCP构建提供统一数字生活管理接口。
一个功能强大的PostgreSQL MCP服务器,提供完整的读写访问权限,支持事务管理和安全控制,比官方只读版本更强大。
MCP逻辑求解器是一个结合大型语言模型与形式化定理证明能力的强大推理系统,支持自然语言和一阶逻辑输入,通过Prover9/Mace4进行自动验证,并提供结构化推理和解释。
BrowserTools MCP是一个强大的浏览器监控与交互工具,通过Chrome扩展和本地Node服务器实现AI应用对浏览器数据的捕获与分析,支持与多种MCP客户端兼容。
Ultimate MCP Server是一个基于模型上下文协议(MCP)的AI代理操作系统,提供数十种强大工具能力,包括智能任务委派、文档处理、浏览器自动化、Excel操作等,通过标准化MCP工具实现AI代理的认知增强和复杂任务编排。
Fetch Browser是一个强大的无头浏览器MCP服务器,专为AI代理设计,无需API密钥即可获取网页内容和执行Google搜索。支持多种内容格式转换和智能错误处理。
Pentest MCP是一个专为专业渗透测试设计的强大工具集,包含Nmap、Go/Dirbuster、Nikto和John the Ripper等工具,简化测试环境搭建,适合安全专业人员使用。
openai-tool2mcp是一个开源桥梁工具,将OpenAI内置的高质量工具(如网页搜索、代码解释器等)封装为MCP协议服务器,使Claude等兼容MCP的模型也能使用这些强大功能。
一个实现顺序思维协议的强大MCP服务器,提供结构化的问题解决方法,将复杂问题分解为可管理步骤,支持迭代优化和多种推理路径。
MCP Probe Kit 是一个强大的开发工具集,提供23个实用工具,覆盖代码质量检测、开发效率提升和项目管理全流程,专为Cursor AI设计,帮助开发者提高开发效率和质量
基于MCP协议和SymPy库的数学计算服务,提供强大的符号计算能力
Deepseek R1的MCP服务器实现,支持Node.js环境,提供强大的语言模型推理服务。