阿里发布多模态大模型Qwen3.7-Plus,在文本能力基础上增强视觉-语言功能,统一为智能体基座。该模型融合GUI与CLI交互,实现从原型到软件工程的端到端自动化,并在Vision Arena榜单中表现强劲。
开源OpenAI Responses API网关GodeX发布v1.1.0版本,核心升级包括:默认模型切换至MiniMax-M3,深度适配多模态理解与思考控制,实现智谱原生联网搜索结果的还原桥接。该工具旨在为开发者提供统一的本地网关解决方案,简化Codex、CLI工具等复杂协议集成,加速弥合大模型生态的协议割裂。
阿里云百炼于2026年5月29日宣布全面CLI化,并开源其CLI项目。此举推动AI Agent接入与开发实现全栈一体化变革。CLI将主流模型、工作流、知识库、记忆管理、联网搜索及多模态文件处理等核心能力封装为轻量命令行入口,开发者安装鉴权后即可高效使用。
微软Windows 11系统即将引入两项AI新功能:任务栏智能助手“Ask Copilot”和整合Excel表格提取的Click to Do工具。初期将面向企业Frontier试用客户开放,具体发布时间和可用范围尚未公布。
一键复现TikTok和YouTube热门AI视频特效的视频生成平台。
OpenAI 官方推出的命令行工具,支持通过终端直接调用 REST API 各项功能。
AI UGC视频生成器,3分钟内生成视频广告,300+创作者,20+语言
浏览器扩展,将AI融入文本框,可写作、搜索、总结和听写,免费使用。
Xai
$1.4
输入tokens/百万
$10.5
输出tokens/百万
256
上下文长度
Tencent
$6
$18
sd2-community
Stable Diffusion v2-1-unclip是基于Stable Diffusion 2.1微调的扩散模型,能够接受文本提示和CLIP图像嵌入,用于创建图像变体或与文本到图像的CLIP先验结合使用。
AbstractPhil
MM-VAE Lyra是一个专门用于文本嵌入转换的多模态变分自编码器,采用几何融合技术。它结合了CLIP-L和T5-base模型,能够有效处理文本嵌入的编码和解码任务,为多模态数据处理提供创新解决方案。
bn22
这是一个发布在Hugging Face模型中心的Transformer模型,模型卡片由系统自动生成,具体模型信息需要进一步补充
mlfoundations
Gelato-30B-A3B 是一款用于GUI计算机使用任务的最先进基础模型,在Click-100k数据集上训练,在多个基准测试中超越了之前的专业计算机基础模型和更大的视觉语言模型。
birder-project
这是一个基于Bolya等人的PE-Core模型的ViT-L14图像编码器,已转换为Birder格式用于图像特征提取。该模型保留了原始权重和架构,但移除了CLIP投影层以输出原始图像嵌入,是一个通用的视觉骨干网络,适用于图像分类和检测任务。
anhquanlam
这是一个自动生成的🤗 Transformers模型卡片,缺少具体模型信息。
redlessone
DermLIP是基于Derm1M数据集训练的皮肤病学视觉语言模型,采用CLIP风格的对比学习方法,专门针对皮肤病学图像和文本进行优化,支持零样本分类、少样本学习等多种应用场景。
DermLIP是一款专门针对皮肤病学领域的视觉语言模型,基于最大的皮肤病学图像文本语料库Derm1M训练而成。该模型采用CLIP风格的架构,能够执行皮肤病相关的多种任务,包括零样本分类、少样本学习、跨模态检索和概念注释等。
ibm-esa-geospatial
Llama3-MS-CLIP是CLIP家族中首个能够理解多光谱图像的视觉语言模型,基于SSL4EO-S12-v1.1数据集的一百万个图像-文本对以及生成的描述进行训练,在大多数基准测试中表现优于其他基于RGB的模型。
amildravid4292
基于OpenCLIP-ViT-L-14模型,引入测试时寄存器技术,提升模型可解释性和下游任务性能
基于OpenCLIP-ViT-B-16架构的视觉语言模型,通过引入测试时寄存器优化内部表示,解决特征图伪影问题
nicolauduran45
基于cross-encoder/ms-marco-MiniLM-L6-v2微调的交叉编码器模型,专为气候科学领域的文本重排序和语义搜索优化
这是一个基于交叉编码器的气候科学文本重排序模型,专门用于气候科学领域的语义搜索和文本相关性排序。
mradermacher
Clinician-Note-2.0a 是一个专注于医学领域的文本生成模型,特别设计用于临床记录和摘要任务。
lukahh
基于CLIP-ViT-B/32微调的视觉语言模型,适用于图像-文本匹配任务
Clinician-Note-2.0a是一个专注于医学领域的文本生成模型,特别适用于AI辅助临床记录和摘要生成。
ClinicianFOCUS
Clinician Note 是一款免费的AI记录员,可将医患互动转录文本转换为临床记录。
UCSC-VLAA
OpenVision是一个完全开源、高性价比的先进视觉编码器家族,专为多模态学习设计,性能匹配甚至超越OpenAI CLIP。
EduFalcao
基于CLIP架构微调的视觉语言模型,专门用于植物病害的零样本分类
SpursgoZmy
Table LLaVA 7B是一个开源的多模态聊天机器人,专门设计用于理解表格图像,能够执行表格问答、表格单元格描述和结构理解等多种表格相关任务。该模型基于LLaVA-v1.5架构,使用CLIP-ViT-L-336px作为视觉编码器,Vicuna-v1.5-7B作为基础大语言模型。
Zen MCP是一个多模型AI协作开发服务器,为Claude和Gemini CLI等AI编码助手提供增强的工作流工具和跨模型上下文管理。它支持多种AI模型的无缝协作,实现代码审查、调试、重构等开发任务,并能保持对话上下文在不同工作流间的延续。
Desktop Commander MCP是一个让Claude桌面应用能够执行终端命令、管理文件系统的AI助手工具,支持代码搜索、编辑、进程管理和远程文件读取等功能。
IDA Pro MCP是一个用于逆向工程的服务器插件,通过MCP协议与客户端工具交互,提供函数分析、注释修改、变量重命名等功能,支持多种MCP客户端如Cline、Roo Code等。
FastMCP是一个基于TypeScript的框架,用于构建支持客户端会话的MCP服务器。它提供了工具、资源和提示的简单定义,支持认证、会话管理、图像和音频内容返回、日志记录、错误处理、SSE通信等功能,并包含CLI工具用于测试和调试。
PaperBanana是一个自动化生成学术图表和统计图的智能框架,支持从文本描述生成高质量的论文插图,采用多智能体管道和迭代优化,提供CLI、Python API和MCP服务器等多种使用方式。
GitKraken CLI是一个命令行工具,提供多仓库工作流管理、AI生成提交信息和拉取请求,并包含一个本地MCP服务器,用于集成Git、GitHub和Jira等工具。
Anna's Archive的MCP服务器和CLI工具,用于搜索和下载该平台的文档,支持通过API密钥访问。
一个提供超过20万图标搜索和检索的MCP服务器和CLI工具,支持150多个图标库,帮助AI助手和开发者快速获取和使用图标。
napi 是一个由 NanoAPI 开发的工具,旨在自动分析软件架构复杂性,支持从代码库中提取功能模块,提供 CLI 和 UI 两种操作方式,并兼容主流 CI/CD 平台,帮助开发者优化架构设计。
Smithery CLI是一个用于管理Model Context Protocol (MCP)服务器的命令行工具,支持多种AI客户端,提供安装、卸载、查看和运行MCP服务器的功能。
ClickHouse MCP服务是一个为ClickHouse数据库提供查询和管理功能的服务器工具。
flyto-core是一个可调试的自动化引擎,提供完整的执行追踪、任意步骤重放和状态快照功能,支持412个模块涵盖浏览器自动化、数据处理、API集成等78个类别,通过CLI、MCP服务器和HTTP API等多种方式使用。
LiteMCP是一个TypeScript框架,用于优雅地构建MCP(模型上下文协议)服务器。它提供了工具、资源和提示的定义,支持全TypeScript开发,内置日志记录、错误处理和CLI调试工具,以及SSE传输支持。
ClickUp MCP Server是一个用于将ClickUp任务与AI应用集成的模型上下文协议服务器,支持通过标准化协议管理任务、空间、列表和文件夹。
Windows CLI MCP Server是一个安全的命令行交互服务器,支持PowerShell、CMD和Git Bash,并提供SSH远程连接功能。
dbt MCP服务器是一个提供与dbt交互工具的服务,支持dbt CLI、语义层、发现API等功能,可通过配置与多种客户端集成使用。
Cycode CLI是一款本地安装的应用程序,用于扫描代码库中的安全漏洞,包括敏感信息泄露、基础设施即代码配置错误、软件成分分析漏洞和静态应用安全测试问题。该工具支持多种扫描类型,如仓库扫描、路径扫描和提交历史扫描,并提供忽略规则功能以排除特定结果。
MCP测试客户端是一个中间件,既作为Claude的服务端,又作为被测服务器的客户端,用于开发阶段测试MCP服务器。它支持部署服务器、调用工具、运行测试、查看日志等功能,并提供CLI交互界面。
ClickUp MCP服务器是一个用于将ClickUp任务与AI应用集成的模型上下文协议服务器,支持通过标准化协议管理任务、空间、列表、文件夹等,并提供时间跟踪、标签管理等功能。
Clippy是macOS终端剪贴板工具,支持文件引用复制、GUI粘贴、最近下载管理、管道数据处理和MCP服务器AI集成,提升工作效率。