AI开源&商用产品

AI产品提交

模型库

MCP服务端

MCP客户端

MCP服务调试

案例教程

AI热门资讯

今日AI热点

Img2txt 相关的热门 GitHub AI项目仓库

发现与 Img2txt 相关的最受欢迎的开源项目和工具，了解最新的开发趋势和创新。

Stable Diffusion Webui

Stable Diffusion 的网页版界面

Transformers

Pytorch、TensorFlow和JAX框架下最先进的机器学习转换器

Unsloth

使用Llama 3.3、DeepSeek-R1和推理大型语言模型微调，速度提升2倍，内存占用减少70%！

Jan

Jan是一款开源的ChatGPT替代品，可在你的电脑上完全离线运行。

Pytorch Image Models

这是目前最大规模的PyTorch图像编码器/骨干网络集合，包含训练、评估、推理、导出脚本和预训练权重——涵盖ResNet、ResNeXT、EfficientNet、NFNet、Vision Transformer (ViT)、MobileNetV4、MobileNet-V3 & V2、RegNet、DPN、CSPNet、Swin Transformer、MaxViT、CoAtNet、ConvNeXt等多种网络。

LocalAI

开源免费的替代方案，可替代OpenAI、Claude等。支持本地自托管，无需GPU，可在家用硬件上运行。可直接替换OpenAI，支持gguf、transformers、diffusers等多种模型架构。功能包括：文本、音频、视频、图像生成，语音克隆，分布式和P2P推理。

Diffusers

Diffusers：一个基于PyTorch和FLAX的库，包含最先进的扩散模型，用于图像、视频和音频生成。

PDFMathTranslate

AI 驱动的 PDF 学术论文翻译，完美保留原有排版格式。支持 Google、DeepL、Ollama、OpenAI 等多种翻译引擎，提供命令行界面 (CLI)、图形用户界面 (GUI)、Docker 镜像和 Zotero 插件。

InvokeAI

Invoke 是一个领先的 Stable Diffusion 模型创意引擎，赋能专业人士、艺术家和爱好者使用最新的 AI 技术生成和创作视觉媒体。该方案提供业界领先的 WebUI，并作为多个商业产品的基础。

Deep Learning For Image Processing

图像处理的深度学习，包括图像分类、目标检测等。

Pytorch CycleGAN And Pix2pix

computer-graphics

基于PyTorch的图像到图像转换

Chat2DB

一款热门的AI驱动型数据库工具和SQL客户端，拥有强大的图形界面，支持MySQL、Oracle、PostgreSQL、DB2、SQL Server、SQLite、H2、ClickHouse等多种数据库。

LLaVA

在NeurIPS 2023大会上以口头报告形式发表的视觉指令微调（LLaVA）模型，其能力已达到甚至超越了GPT-4V的水平。

Self Llm

这份《开源大模型食用指南》专为中国用户设计，手把手教你如何在Linux系统上快速微调（全参数/LoRA）并部署国内外开源大模型（LLM）/多模态大模型（MLLM）。

Dive Into DL PyTorch

computer-vision

这个项目把《动手学深度学习》一书中原本用MXNet框架写的代码，改成了用PyTorch框架实现的版本。

Chinese LLaMA Alpaca

中文版LLaMA和Alpaca大语言模型，支持本地CPU/GPU训练和部署

Llama Cookbook

欢迎来到Llama食谱！这是你构建Llama模型的指南，涵盖了推理、微调、检索增强生成（RAG）等入门知识。我们还会向你展示如何使用Llama模型家族解决端到端问题，以及如何在各种服务提供商平台上使用它们。

MaxKB

一个即用型且灵活的基于检索增强生成 (RAG) 的聊天机器人，支持主流大型语言模型 (LLM)，例如 DeepSeek-R1、Llama 3.3、Qwen2、OpenAI 等。

Screenshot To Code

一个能够将设计样稿转换成静态网站的神经网络。

Numpy Ml

使用NumPy进行机器学习