腾讯发布混元2.0大模型,含推理增强版和指令遵循版,总参数406B,支持256K上下文窗口,在数学、代码等复杂推理任务上表现突出。模型采用MoE架构,已上线腾讯云API并在部分应用灰度测试。
美团LongCat团队开源了LongCat-Image图像生成模型,该模型拥有6B参数,在文生图和图像编辑领域表现优异,旨在平衡性能与使用门槛,填补开源与闭源模型之间的技术空白。
高德地图推出“AI停车雷达”,实时感知目的地周边道路车位占用情况,帮助用户高效规划停车,减少绕行等待。该功能融合空间智能感知、AI视觉分析与实时交通数据,实现分钟级车位动态推演与可视化,并在导航中提供智能停车建议。
高德地图推出“AI停车雷达”,利用空间智能感知与AI视觉分析,实时推演城市道路车位占用情况,实现分钟级动态可视化。用户在导航时可于车道级界面查看沿途车位空闲状态,有效缓解停车焦虑。目前该功能已在北京上线,覆盖数万个道路停车位,标志着导航应用从路线引导向停车服务延伸。
创意工作空间,支持多模型、多媒介,一站式助力创作输出。
集成研究空间,集发现、组织、合成于一体,高效科研工作平台
为深度创作者提供的 AI 原生工作空间,简化内容创作流程。
利用AI设计工具改造您的空间。
TomoroAI
TomoroAI/tomoro-colqwen3-embed-4b是一款先进的ColPali风格多模态嵌入模型,能够将文本查询、视觉文档(如图像、PDF)或短视频映射为对齐的多向量嵌入。该模型结合了Qwen3-VL-4B-Instruct和Qwen3-Embedding-4B的优势,在ViDoRe基准测试中表现出色,同时显著减少了嵌入占用空间。
nvidia
NVIDIA Nemotron Parse v1.1 TC 是一款先进的文档语义理解模型,能够从图像中提取具有空间定位的文本和表格元素,生成结构化注释,包括格式化文本、边界框和语义类别。相比前一版本,速度提升20%,并保留无序元素的页面顺序。
NVIDIA Nemotron Parse v1.1 是一款先进的文档解析模型,专门用于理解文档语义并提取具有空间定位的文本和表格元素。它能够将非结构化文档转换为机器可读的结构化表示,克服了传统OCR在处理复杂文档布局时的局限性。
sensenova
SenseNova-SI是基于多模态基础模型构建的空间智能增强模型系列,通过精心策划的800万样本数据训练,在多个空间智能基准测试中取得了优异表现,同时保持了强大的通用多模态理解能力。
sd2-community
Stable Diffusion v2 是一个基于扩散模型的文本到图像生成模型,能够根据文本提示生成和修改图像。该模型在LAION-5B数据集子集上训练,结合了自编码器和扩散模型,在潜在空间中进行训练,支持多种分辨率和任务。
spartan8806
这是一个基于sentence-transformers/all-mpnet-base-v2微调而来的句子转换器模型,能够将文本映射到768维的密集向量空间,支持语义相似度计算、语义搜索、文本分类等多种自然语言处理任务。
abr-ai
这是一个由Applied Brain Research(ABR)开发的基于状态空间模型(SSM)的英文自动语音识别模型,拥有约1900万参数,能够高效准确地将英文语音转录为文本。该模型在多个基准数据集上表现出色,平均单词错误率仅为10.61%,支持实时语音识别并可在低成本硬件上运行。
SenseNova-SI是基于成熟多模态基础模型构建的空间智能增强模型系列,通过精心策划的800万数据样本训练,在多个空间智能基准测试中展现出卓越性能,同时保持强大的通用多模态理解能力。
SenseNova-SI是基于多模态基础模型构建的空间智能模型系列,专门针对空间理解能力进行优化。通过大规模空间智能数据训练,在度量估计、空间关系理解、视点变化处理等方面表现优异。
unsloth
Qwen3-VL是通义系列中最强大的视觉语言模型,具备卓越的文本理解与生成能力、深入的视觉感知与推理能力、长上下文支持、强大的空间和视频动态理解能力以及出色的智能体交互能力。
Qwen3-VL-32B-Thinking是Qwen系列中最强大的视觉语言模型,具备卓越的文本理解与生成能力、深入的视觉感知与推理能力、长上下文处理、空间和视频动态理解能力,以及出色的智能体交互能力。
Qwen3-VL-8B-Thinking是通义千问系列中最强大的视觉语言模型,具备卓越的文本理解与生成能力、深入的视觉感知与推理能力、长上下文支持、强大的空间和视频动态理解能力,以及出色的智能体交互能力。
Qwen3-VL是通义系列中最强大的视觉语言模型,具备卓越的文本理解与生成能力、深入的视觉感知与推理能力、长上下文支持、强大的空间和视频动态理解能力,以及出色的智能体交互能力。
Qwen3-VL是通义系列中最强大的视觉语言模型,在文本理解与生成、视觉感知与推理、上下文长度、空间和视频动态理解以及智能体交互能力等方面全面升级。该模型提供密集架构和混合专家架构,支持从边缘设备到云端的灵活部署。
Qwen3-VL是Qwen系列中最强大的视觉语言模型,具备卓越的文本理解与生成能力、深入的视觉感知与推理能力、长上下文支持、强大的空间和视频动态理解能力,以及出色的智能体交互能力。
Qwen3-VL是Qwen系列中最强大的视觉语言模型,实现了全方位的综合升级,包括卓越的文本理解与生成能力、更深入的视觉感知与推理能力、更长的上下文长度、增强的空间和视频动态理解能力,以及更强的智能体交互能力。
Qwen3-VL是阿里巴巴推出的新一代视觉语言模型,在文本理解、视觉感知、空间理解、长上下文处理和智能体交互等方面全面升级,支持从边缘设备到云端的灵活部署。
Qwen3-VL是Qwen系列中最强大的视觉语言模型,具备卓越的文本理解与生成能力、深入的视觉感知与推理能力、长上下文支持、强大的空间和视频动态理解能力,以及出色的智能体交互能力。该版本为2B参数的思考增强版,专门优化了推理能力。
Qwen
Qwen3-VL-30B-A3B-Thinking是通义系列中最强大的视觉语言模型,具备出色的文本理解和生成能力、深入的视觉感知和推理能力、长上下文支持、强大的空间和视频动态理解能力,以及智能体交互能力。
Qwen3-VL是通义系列最强大的视觉语言模型,采用混合专家模型架构(MoE),提供GGUF格式权重,支持在CPU、GPU等设备上进行高效推理。模型在文本理解、视觉感知、空间理解、视频处理等方面全面升级。
一个安全的Docker容器代码沙箱环境,为AI应用提供隔离的执行空间,支持多种编程环境和文件操作。
ClickUp MCP Server是一个用于将ClickUp任务与AI应用集成的模型上下文协议服务器,支持通过标准化协议管理任务、空间、列表和文件夹。
一个基于Docker容器的安全代码沙箱环境,为AI应用提供隔离的执行空间。
ClickUp MCP服务器是一个用于将ClickUp任务与AI应用集成的模型上下文协议服务器,支持通过标准化协议管理任务、空间、列表、文件夹等,并提供时间跟踪、标签管理等功能。
一个基于Solana区块链的企业HR代币空投工具,支持角色分配和邮件通知
k8s_pilot是一个轻量级的Kubernetes多集群集中管理控制平面,支持多集群上下文切换、资源CRUD操作和命名空间管理,通过MCP协议与Claude AI集成。
Anytype MCP服务器是一个基于Anytype API的模型上下文协议服务,允许AI助手和其他MCP客户端与Anytype数据进行交互,包括查询、创建、删除空间和对象等功能。
一个连接飞书文档的MCP服务,支持获取文档空间和列表,与AI客户端无缝集成。
AQICN MCP服务器是一个提供全球空气质量数据的服务,支持通过城市名称或地理坐标查询实时空气质量信息。
一个提供与ClickUp工作空间无缝集成的MCP服务器,允许大型语言模型通过多种工具管理任务、文档和自定义字段。
Confluence Cloud的MCP服务,提供标准化接口管理空间、页面和内容。
该项目实现了模型上下文协议(MCP)作为个人智能框架(PIF)的实践方案,通过结构化工具和渐进式交互模式,为人类与AI之间构建有意义的理解发展空间。
基于MCP协议的引力波信号检测与优化系统,专注于GW150914事件分析,通过AI智能探索参数空间实现高效信号检测
一个MCP服务器,为AI编程助手提供上下文优化工具,通过精准提取信息而非处理大量终端输出和文件来节省上下文空间,提升助手效率。
Earthdata MCP Server是一个基于Model Context Protocol的服务器实现,专为与NASA Earthdata交互而设计,提供高效的地理空间数据集发现和检索工具。
一个基于OpenStreetMap的MCP服务器,为LLM提供地理空间数据服务
Dart MCP Server是一个基于Dart的模型上下文协议(MCP)服务器实现,提供任务管理、文档处理和空间组织功能,支持与AI助手集成。
ClickUp MCP服务器实现,为AI助手提供与ClickUp工作空间交互的能力
Notion MCP Server是一个为Notion API设计的中间件服务,使Claude能够与Notion工作空间进行交互。
Notion MCP服务器是一个中间件服务,使Claude能够与Notion工作空间进行交互,提供对Notion区块、页面和数据库的增删改查等操作功能。