探索AI前沿,掌握行业发展趋势
每日精选AI热点,追踪最新行业动态
精准筛选产品,多维度产品调研
热门AI产品实力、热度、年/月/日排行
提交AI产品信息,助力产品推广和用户转化
一站式AI工具指南,快速找到你需要的工具
涵盖各类AI模型,满足你的开发与研究需求
热门AI大模型性能、热度、年/月/日排行
寻找优质模型提供商,获取可靠模型支持
多维度对比大模型,找到最适合你的模型
精准计算大模型使用成本,合理规划预算
多模型实时评测,模型输出结果快速比对
聚集热门MCP服务,快速找到适合你的服务
轻松接入MCP客户端,调用强大的AI能力
学习MCP使用技巧,从入门到精通
热门MCP服务性能排行,帮你找到最佳选择
发布你的MCP服务,推广你的MCP服务
自由测试MCP服务,线上快速体验
快速测试MCP服务,快速上线
一站式GEO品牌洞察 提升AI搜索转化率
分析并追踪人工智能模型如何引用您的品牌
检测品牌在AI平台中的可见度
快速评估推广文章在AI 平台的引用情况
拥有属于自己的GEO系统,助您成为专业GEO优化服务商
通过AI搜索优化服务,让品牌在AI中实现霸屏
一键检测电脑配置,研判运行模型的兼容性
根据算力需求,推荐匹配的服务器配置
发现与 Image Foresting Transform 相关的最受欢迎的开源项目和工具,了解最新的开发趋势和创新。
Stable Diffusion 的网页版界面
适用于GPU云端和本地环境的ComfyUI Docker镜像。包含AI-Dock基础镜像,用于身份验证和提升用户体验。
Turn any PDF or image document into structured data for your AI. A powerful, lightweight OCR toolkit that bridges the gap between images/PDFs and LLMs. Supports 80+ languages.
Upscayl:首屈一指的免费开源AI图像放大软件,支持Linux、MacOS和Windows系统。
开源免费的替代方案,可替代OpenAI、Claude等。支持本地自托管,无需GPU,可在家用硬件上运行。可直接替换OpenAI,支持gguf、transformers、diffusers等多种模型架构。功能包括:文本、音频、视频、图像生成,语音克隆,分布式和P2P推理。
GFPGAN致力于开发用于现实人脸修复的实用算法。
这是目前最大规模的PyTorch图像编码器/骨干网络集合,包含训练、评估、推理、导出脚本和预训练权重——涵盖ResNet、ResNeXT、EfficientNet、NFNet、Vision Transformer (ViT)、MobileNetV4、MobileNet-V3 & V2、RegNet、DPN、CSPNet、Swin Transformer、MaxViT、CoAtNet、ConvNeXt等多种网络。
Real-ESRGAN的目标是开发用于通用图像/视频修复的实用算法。
Diffusers:一个基于PyTorch和FLAX的库,包含最先进的扩散模型,用于图像、视频和音频生成。
你的 AI 第二大脑,可自行托管。从网络或你的文档中获取答案。构建自定义代理,安排自动化任务,进行深度研究。将任何在线或本地大型语言模型 (LLM) 变成你个人的自主 AI(例如 GPT、Claude、Gemini、Llama、Qwen、Mistral)。立即开始 – 免费。
开箱即用的OCR,支持80多种语言和所有流行的文字系统,包括拉丁文、中文、阿拉伯文、天城文、西里尔文等等。
Qdrant 是一款高性能、大规模的向量数据库和向量搜索引擎,专为下一代人工智能而设计。云端版本也已上线:https://cloud.qdrant.io/
Invoke 是一个领先的 Stable Diffusion 模型创意引擎,赋能专业人士、艺术家和爱好者使用最新的 AI 技术生成和创作视觉媒体。该方案提供业界领先的 WebUI,并作为多个商业产品的基础。
基于PyTorch的图像到图像转换
使用Pytorch实现视觉Transformer,这是一种仅用单个Transformer编码器就能轻松达到图像分类领域最先进水平(SOTA)的简易方法。
MiniCPM-V 4.5: A GPT-4o Level MLLM for Single Image, Multi Image and Video Understanding on Your Phone
2025年计算机视觉与模式识别会议(CVPR 2025)论文及开源项目集锦
用于真实世界模糊运动的模糊插值Transformer(CVPR 2023)
落地SAM:融合DINO、Segment Anything、Stable Diffusion和Recognize Anything,实现自动检测、分割和生成任何物体
pix2tex:利用视觉Transformer(ViT)将方程式图片转换成LaTeX代码。