美国文艺界约800名创意人士联名抗议AI公司未经授权使用原创内容训练模型,谴责其为“规模空前的盗窃”,行动名为“偷窃不是创新”。
吉利推出豪华MPV银河V900,定位AI全场景家庭旗舰,售价26.98万至32.98万元。该车拥有3.97米车内空间、1220公里续航、6.5秒破百性能及无图NOA智能驾驶,以AI技术重塑家庭出行体验。
宇树科技人形机器人外观专利获批,设计聚焦整体造型,旨在实现全场景应用,覆盖工业、商业、家庭及空间探索等领域。
腾讯开源金融大模型评测工具finLLM-Eval,首次引入无GroundTruth的金融数据准确性评测方法,填补市场空白,旨在推动AI技术在金融领域的安全应用。
利用AI瞬间改造房间,替换家具、更换材质、清理空间或虚拟布置房产。
轻量级布局到图像生成框架,实现精准空间控制。
Dex将浏览器变为AI工作空间,了解任务与上下文,推动工作进展
专业AI音频处理工具,可检测水印、去除杂音、增强空间音频等。
openbmb
VoxCPM是一款创新的免分词器端到端文本转语音(TTS)系统,通过在连续空间中对语音进行建模,克服了离散分词的局限性。它具备上下文感知语音生成和逼真零样本语音克隆两大核心能力,能够根据文本内容自动调整韵律和风格,并仅需一个简短的参考音频即可克隆说话者的音色、口音和情感。
TomoroAI
TomoroAI/tomoro-colqwen3-embed-4b是一款先进的ColPali风格多模态嵌入模型,能够将文本查询、视觉文档(如图像、PDF)或短视频映射为对齐的多向量嵌入。该模型结合了Qwen3-VL-4B-Instruct和Qwen3-Embedding-4B的优势,在ViDoRe基准测试中表现出色,同时显著减少了嵌入占用空间。
nvidia
NVIDIA Nemotron Parse v1.1 TC 是一款先进的文档语义理解模型,能够从图像中提取具有空间定位的文本和表格元素,生成结构化注释,包括格式化文本、边界框和语义类别。相比前一版本,速度提升20%,并保留无序元素的页面顺序。
NVIDIA Nemotron Parse v1.1 是一款先进的文档解析模型,专门用于理解文档语义并提取具有空间定位的文本和表格元素。它能够将非结构化文档转换为机器可读的结构化表示,克服了传统OCR在处理复杂文档布局时的局限性。
sensenova
SenseNova-SI是基于多模态基础模型构建的空间智能增强模型系列,通过精心策划的800万样本数据训练,在多个空间智能基准测试中取得了优异表现,同时保持了强大的通用多模态理解能力。
sd2-community
Stable Diffusion v2 是一个基于扩散模型的文本到图像生成模型,能够根据文本提示生成和修改图像。该模型在LAION-5B数据集子集上训练,结合了自编码器和扩散模型,在潜在空间中进行训练,支持多种分辨率和任务。
spartan8806
这是一个基于sentence-transformers/all-mpnet-base-v2微调而来的句子转换器模型,能够将文本映射到768维的密集向量空间,支持语义相似度计算、语义搜索、文本分类等多种自然语言处理任务。
abr-ai
这是一个由Applied Brain Research(ABR)开发的基于状态空间模型(SSM)的英文自动语音识别模型,拥有约1900万参数,能够高效准确地将英文语音转录为文本。该模型在多个基准数据集上表现出色,平均单词错误率仅为10.61%,支持实时语音识别并可在低成本硬件上运行。
SenseNova-SI是基于成熟多模态基础模型构建的空间智能增强模型系列,通过精心策划的800万数据样本训练,在多个空间智能基准测试中展现出卓越性能,同时保持强大的通用多模态理解能力。
SenseNova-SI是基于多模态基础模型构建的空间智能模型系列,专门针对空间理解能力进行优化。通过大规模空间智能数据训练,在度量估计、空间关系理解、视点变化处理等方面表现优异。
redponike
Qwen3-VL-4B-Instruct 是通义千问系列最新的视觉语言模型,在4B参数规模下实现了卓越的视觉感知、文本理解与生成、空间推理和智能体交互能力。它支持长上下文和视频理解,具备强大的OCR和多语言处理能力。
unsloth
Qwen3-VL是通义系列中最强大的视觉语言模型,具备卓越的文本理解与生成能力、深入的视觉感知与推理能力、长上下文支持、强大的空间和视频动态理解能力以及出色的智能体交互能力。
Qwen3-VL-32B-Thinking是Qwen系列中最强大的视觉语言模型,具备卓越的文本理解与生成能力、深入的视觉感知与推理能力、长上下文处理、空间和视频动态理解能力,以及出色的智能体交互能力。
Qwen3-VL-8B-Thinking是通义千问系列中最强大的视觉语言模型,具备卓越的文本理解与生成能力、深入的视觉感知与推理能力、长上下文支持、强大的空间和视频动态理解能力,以及出色的智能体交互能力。
Qwen3-VL是通义系列中最强大的视觉语言模型,具备卓越的文本理解与生成能力、深入的视觉感知与推理能力、长上下文支持、强大的空间和视频动态理解能力,以及出色的智能体交互能力。
Qwen3-VL是通义系列中最强大的视觉语言模型,在文本理解与生成、视觉感知与推理、上下文长度、空间和视频动态理解以及智能体交互能力等方面全面升级。该模型提供密集架构和混合专家架构,支持从边缘设备到云端的灵活部署。
Qwen3-VL是Qwen系列中最强大的视觉语言模型,具备卓越的文本理解与生成能力、深入的视觉感知与推理能力、长上下文支持、强大的空间和视频动态理解能力,以及出色的智能体交互能力。
Qwen3-VL是Qwen系列中最强大的视觉语言模型,实现了全方位的综合升级,包括卓越的文本理解与生成能力、更深入的视觉感知与推理能力、更长的上下文长度、增强的空间和视频动态理解能力,以及更强的智能体交互能力。
Qwen3-VL是阿里巴巴推出的新一代视觉语言模型,在文本理解、视觉感知、空间理解、长上下文处理和智能体交互等方面全面升级,支持从边缘设备到云端的灵活部署。
Qwen3-VL是Qwen系列中最强大的视觉语言模型,具备卓越的文本理解与生成能力、深入的视觉感知与推理能力、长上下文支持、强大的空间和视频动态理解能力,以及出色的智能体交互能力。该版本为2B参数的思考增强版,专门优化了推理能力。
Mapbox MCP服务器是一个Node.js实现的模型上下文协议服务器,为AI应用提供Mapbox地理空间API的访问能力,包括地理编码、兴趣点搜索、路线规划、等时线分析和静态地图生成等功能。
一个安全的Docker容器代码沙箱环境,为AI应用提供隔离的执行空间,支持多种编程环境和文件操作。
ClickUp MCP Server是一个用于将ClickUp任务与AI应用集成的模型上下文协议服务器,支持通过标准化协议管理任务、空间、列表和文件夹。
一个基于Docker容器的安全代码沙箱环境,为AI应用提供隔离的执行空间。
ClickUp MCP服务器是一个用于将ClickUp任务与AI应用集成的模型上下文协议服务器,支持通过标准化协议管理任务、空间、列表、文件夹等,并提供时间跟踪、标签管理等功能。
Confluence Cloud的MCP服务,提供标准化接口管理空间、页面和内容。
一个基于Solana区块链的企业HR代币空投工具,支持角色分配和邮件通知
一个提供与ClickUp工作空间无缝集成的MCP服务器,允许大型语言模型通过多种工具管理任务、文档和自定义字段。
一个连接飞书文档的MCP服务,支持获取文档空间和列表,与AI客户端无缝集成。
该项目实现了模型上下文协议(MCP)作为个人智能框架(PIF)的实践方案,通过结构化工具和渐进式交互模式,为人类与AI之间构建有意义的理解发展空间。
AQICN MCP服务器是一个提供全球空气质量数据的服务,支持通过城市名称或地理坐标查询实时空气质量信息。
k8s_pilot是一个轻量级的Kubernetes多集群集中管理控制平面,支持多集群上下文切换、资源CRUD操作和命名空间管理,通过MCP协议与Claude AI集成。
Anytype MCP服务器是一个基于Anytype API的模型上下文协议服务,允许AI助手和其他MCP客户端与Anytype数据进行交互,包括查询、创建、删除空间和对象等功能。
基于MCP协议的引力波信号检测与优化系统,专注于GW150914事件分析,通过AI智能探索参数空间实现高效信号检测
ClickUp MCP服务器实现,为AI助手提供与ClickUp工作空间交互的能力
一个MCP服务器,为AI编程助手提供上下文优化工具,通过精准提取信息而非处理大量终端输出和文件来节省上下文空间,提升助手效率。
一个基于OpenStreetMap的MCP服务器,为LLM提供地理空间数据服务
Earthdata MCP Server是一个基于Model Context Protocol的服务器实现,专为与NASA Earthdata交互而设计,提供高效的地理空间数据集发现和检索工具。
Dart MCP Server是一个基于Dart的模型上下文协议(MCP)服务器实现,提供任务管理、文档处理和空间组织功能,支持与AI助手集成。
Notion MCP服务器是一个中间件服务,使Claude能够与Notion工作空间进行交互,提供对Notion区块、页面和数据库的增删改查等操作功能。