谷歌推出开源扩展Conductor,解决AI编程上下文丢失问题。它作为Gemini CLI的延伸,将代码生成转化为结构化工作流,持久化保存产品知识、技术约束与计划,避免传统会话模式下的信息丢失。
DeepSeek发布全新视觉编码器DeepSeek OCR2,在文档处理和图像识别领域取得突破。该模型模拟人类视觉的灵活扫描模式,颠覆传统视觉模型处理逻辑。通过引入全新架构,弃用传统CLIP组件,采用轻量级语言模型,实现了根据内容灵活聚焦的特性。
JetBrains公布CLion2026.1路线图,预计3月发布。该版本聚焦性能优化与架构升级,将显著改善Windows用户的安装与更新体验,通过优化打包和移除冗余组件提升Win11平台表现。
人工智能公司 Clipto.AI 完成 Pre-A++ 轮融资,估值超2.5亿美元。本轮由 EnvisionX Capital 和 Palm Drive Capital 领投,红杉中国、高瓴创投等老股东跟投,资金将重点投入端侧多模态 AI 模型与系统的研发。
AI实时虚拟布置房产照片,秒出MLS合规结果,无订阅费
一站式管理Claude Code、Codex CLI和Gemini CLI,优化AI开发工作流
Devstral 2开源编码模型及Mistral Vibe CLI,高效解决软件工程任务
与Clio集成,整合案件和消息,是律师与客户的沟通转诊工具
Xai
$1.4
输入tokens/百万
$10.5
输出tokens/百万
256
上下文长度
Tencent
$6
$18
sd2-community
Stable Diffusion v2-1-unclip是基于Stable Diffusion 2.1微调的扩散模型,能够接受文本提示和CLIP图像嵌入,用于创建图像变体或与文本到图像的CLIP先验结合使用。
AbstractPhil
MM-VAE Lyra是一个专门用于文本嵌入转换的多模态变分自编码器,采用几何融合技术。它结合了CLIP-L和T5-base模型,能够有效处理文本嵌入的编码和解码任务,为多模态数据处理提供创新解决方案。
bn22
这是一个发布在Hugging Face模型中心的Transformer模型,模型卡片由系统自动生成,具体模型信息需要进一步补充
mlfoundations
Gelato-30B-A3B 是一款用于GUI计算机使用任务的最先进基础模型,在Click-100k数据集上训练,在多个基准测试中超越了之前的专业计算机基础模型和更大的视觉语言模型。
birder-project
这是一个基于Bolya等人的PE-Core模型的ViT-L14图像编码器,已转换为Birder格式用于图像特征提取。该模型保留了原始权重和架构,但移除了CLIP投影层以输出原始图像嵌入,是一个通用的视觉骨干网络,适用于图像分类和检测任务。
anhquanlam
这是一个自动生成的🤗 Transformers模型卡片,缺少具体模型信息。
redlessone
DermLIP是基于Derm1M数据集训练的皮肤病学视觉语言模型,采用CLIP风格的对比学习方法,专门针对皮肤病学图像和文本进行优化,支持零样本分类、少样本学习等多种应用场景。
DermLIP是一款专门针对皮肤病学领域的视觉语言模型,基于最大的皮肤病学图像文本语料库Derm1M训练而成。该模型采用CLIP风格的架构,能够执行皮肤病相关的多种任务,包括零样本分类、少样本学习、跨模态检索和概念注释等。
ibm-esa-geospatial
Llama3-MS-CLIP是CLIP家族中首个能够理解多光谱图像的视觉语言模型,基于SSL4EO-S12-v1.1数据集的一百万个图像-文本对以及生成的描述进行训练,在大多数基准测试中表现优于其他基于RGB的模型。
amildravid4292
基于OpenCLIP-ViT-L-14模型,引入测试时寄存器技术,提升模型可解释性和下游任务性能
基于OpenCLIP-ViT-B-16架构的视觉语言模型,通过引入测试时寄存器优化内部表示,解决特征图伪影问题
nicolauduran45
基于cross-encoder/ms-marco-MiniLM-L6-v2微调的交叉编码器模型,专为气候科学领域的文本重排序和语义搜索优化
这是一个基于交叉编码器的气候科学文本重排序模型,专门用于气候科学领域的语义搜索和文本相关性排序。
mradermacher
Clinician-Note-2.0a 是一个专注于医学领域的文本生成模型,特别设计用于临床记录和摘要任务。
lukahh
基于CLIP-ViT-B/32微调的视觉语言模型,适用于图像-文本匹配任务
Clinician-Note-2.0a是一个专注于医学领域的文本生成模型,特别适用于AI辅助临床记录和摘要生成。
ClinicianFOCUS
Clinician Note 是一款免费的AI记录员,可将医患互动转录文本转换为临床记录。
UCSC-VLAA
OpenVision是一个完全开源、高性价比的先进视觉编码器家族,专为多模态学习设计,性能匹配甚至超越OpenAI CLIP。
EduFalcao
基于CLIP架构微调的视觉语言模型,专门用于植物病害的零样本分类
SpursgoZmy
Table LLaVA 7B是一个开源的多模态聊天机器人,专门设计用于理解表格图像,能够执行表格问答、表格单元格描述和结构理解等多种表格相关任务。该模型基于LLaVA-v1.5架构,使用CLIP-ViT-L-336px作为视觉编码器,Vicuna-v1.5-7B作为基础大语言模型。
Zen MCP是一个多模型AI协作开发服务器,为Claude和Gemini CLI等AI编码助手提供增强的工作流工具和跨模型上下文管理。它支持多种AI模型的无缝协作,实现代码审查、调试、重构等开发任务,并能保持对话上下文在不同工作流间的延续。
Desktop Commander MCP是一个让Claude桌面应用能够执行终端命令、管理文件系统的AI助手工具,支持代码搜索、编辑、进程管理和远程文件读取等功能。
IDA Pro MCP是一个用于逆向工程的服务器插件,通过MCP协议与客户端工具交互,提供函数分析、注释修改、变量重命名等功能,支持多种MCP客户端如Cline、Roo Code等。
FastMCP是一个基于TypeScript的框架,用于构建支持客户端会话的MCP服务器。它提供了工具、资源和提示的简单定义,支持认证、会话管理、图像和音频内容返回、日志记录、错误处理、SSE通信等功能,并包含CLI工具用于测试和调试。
GitKraken CLI是一个命令行工具,提供多仓库工作流管理、AI生成提交信息和拉取请求,并包含一个本地MCP服务器,用于集成Git、GitHub和Jira等工具。
Anna's Archive的MCP服务器和CLI工具,用于搜索和下载该平台的文档,支持通过API密钥访问。
napi 是一个由 NanoAPI 开发的工具,旨在自动分析软件架构复杂性,支持从代码库中提取功能模块,提供 CLI 和 UI 两种操作方式,并兼容主流 CI/CD 平台,帮助开发者优化架构设计。
Smithery CLI是一个用于管理Model Context Protocol (MCP)服务器的命令行工具,支持多种AI客户端,提供安装、卸载、查看和运行MCP服务器的功能。
ClickHouse MCP服务是一个为ClickHouse数据库提供查询和管理功能的服务器工具。
LiteMCP是一个TypeScript框架,用于优雅地构建MCP(模型上下文协议)服务器。它提供了工具、资源和提示的定义,支持全TypeScript开发,内置日志记录、错误处理和CLI调试工具,以及SSE传输支持。
ClickUp MCP Server是一个用于将ClickUp任务与AI应用集成的模型上下文协议服务器,支持通过标准化协议管理任务、空间、列表和文件夹。
Windows CLI MCP Server是一个安全的命令行交互服务器,支持PowerShell、CMD和Git Bash,并提供SSH远程连接功能。
dbt MCP服务器是一个提供与dbt交互工具的服务,支持dbt CLI、语义层、发现API等功能,可通过配置与多种客户端集成使用。
Cycode CLI是一款本地安装的应用程序,用于扫描代码库中的安全漏洞,包括敏感信息泄露、基础设施即代码配置错误、软件成分分析漏洞和静态应用安全测试问题。该工具支持多种扫描类型,如仓库扫描、路径扫描和提交历史扫描,并提供忽略规则功能以排除特定结果。
MCP测试客户端是一个中间件,既作为Claude的服务端,又作为被测服务器的客户端,用于开发阶段测试MCP服务器。它支持部署服务器、调用工具、运行测试、查看日志等功能,并提供CLI交互界面。
Clippy是macOS终端剪贴板工具,支持文件引用复制、GUI粘贴、最近下载管理、管道数据处理和MCP服务器AI集成,提升工作效率。
ClickUp MCP服务器是一个用于将ClickUp任务与AI应用集成的模型上下文协议服务器,支持通过标准化协议管理任务、空间、列表、文件夹等,并提供时间跟踪、标签管理等功能。
AWS MCP Server是一个轻量级服务,通过Model Context Protocol(MCP)协议使AI助手能够执行AWS CLI命令,提供AWS CLI文档查询和命令执行功能。
一个将OpenAPI规范转换为MCP兼容服务器的CLI工具,支持多种传输协议和认证方式,便于AI代理与REST API交互。
Open Data MCP是一个开源项目,旨在通过MCP协议将公开数据集快速接入LLM应用。项目提供CLI工具实现2分钟接入(当前支持Claude),并建立社区协作框架让开发者能轻松贡献和发布公开数据集。核心目标是构建连接所有LLM应用与数百万公开数据集的基础设施。