发现与 Img2txt 相关的最受欢迎的开源项目和工具,了解最新的开发趋势和创新。
Stable Diffusion 的网页版界面
Pytorch、TensorFlow和JAX框架下最先进的机器学习转换器
使用Llama 3.3、DeepSeek-R1和推理大型语言模型微调,速度提升2倍,内存占用减少70%!
Jan是一款开源的ChatGPT替代品,可在你的电脑上完全离线运行。
这是目前最大规模的PyTorch图像编码器/骨干网络集合,包含训练、评估、推理、导出脚本和预训练权重——涵盖ResNet、ResNeXT、EfficientNet、NFNet、Vision Transformer (ViT)、MobileNetV4、MobileNet-V3 & V2、RegNet、DPN、CSPNet、Swin Transformer、MaxViT、CoAtNet、ConvNeXt等多种网络。
开源免费的替代方案,可替代OpenAI、Claude等。支持本地自托管,无需GPU,可在家用硬件上运行。可直接替换OpenAI,支持gguf、transformers、diffusers等多种模型架构。功能包括:文本、音频、视频、图像生成,语音克隆,分布式和P2P推理。
Diffusers:一个基于PyTorch和FLAX的库,包含最先进的扩散模型,用于图像、视频和音频生成。
AI 驱动的 PDF 学术论文翻译,完美保留原有排版格式。支持 Google、DeepL、Ollama、OpenAI 等多种翻译引擎,提供命令行界面 (CLI)、图形用户界面 (GUI)、Docker 镜像和 Zotero 插件。
Invoke 是一个领先的 Stable Diffusion 模型创意引擎,赋能专业人士、艺术家和爱好者使用最新的 AI 技术生成和创作视觉媒体。该方案提供业界领先的 WebUI,并作为多个商业产品的基础。
图像处理的深度学习,包括图像分类、目标检测等。
基于PyTorch的图像到图像转换
一款热门的AI驱动型数据库工具和SQL客户端,拥有强大的图形界面,支持MySQL、Oracle、PostgreSQL、DB2、SQL Server、SQLite、H2、ClickHouse等多种数据库。
在NeurIPS 2023大会上以口头报告形式发表的视觉指令微调(LLaVA)模型,其能力已达到甚至超越了GPT-4V的水平。
这份《开源大模型食用指南》专为中国用户设计,手把手教你如何在Linux系统上快速微调(全参数/LoRA)并部署国内外开源大模型(LLM)/多模态大模型(MLLM)。
这个项目把《动手学深度学习》一书中原本用MXNet框架写的代码,改成了用PyTorch框架实现的版本。
中文版LLaMA和Alpaca大语言模型,支持本地CPU/GPU训练和部署
欢迎来到Llama食谱!这是你构建Llama模型的指南,涵盖了推理、微调、检索增强生成(RAG)等入门知识。我们还会向你展示如何使用Llama模型家族解决端到端问题,以及如何在各种服务提供商平台上使用它们。
一个即用型且灵活的基于检索增强生成 (RAG) 的聊天机器人,支持主流大型语言模型 (LLM),例如 DeepSeek-R1、Llama 3.3、Qwen2、OpenAI 等。
一个能够将设计样稿转换成静态网站的神经网络。
使用NumPy进行机器学习