发现与 Pdf Generation 相关的最受欢迎的开源项目和工具,了解最新的开发趋势和创新。
Stable Diffusion 的网页版界面
这款工具旨在为GPT、GLM等大型语言模型提供更便捷易用的交互界面,尤其针对论文阅读、润色和写作进行了优化。它采用模块化设计,支持自定义快捷按钮和函数插件,并能剖析和翻译Python和C++等项目代码。此外,它还具备PDF和LaTeX论文的翻译和总结功能,支持同时查询多个LLM模型(例如ChatGLM3等本地模型),并已接入通义千问、DeepSeekCoder、讯飞星火、文心一言、Llama 2、RWKV、Claude 2、MOSS等多种模型。
一个命令行界面平台,用于代码生成的实验。这是 lovable.dev 网站的前身。
Langchain-Chatchat(原Langchain-ChatGLM)是一个基于Langchain框架,结合ChatGLM、Qwen、Llama等大型语言模型,实现基于检索增强生成(RAG)和智能体(Agent)应用的本地知识库系统。
开源免费的替代方案,可替代OpenAI、Claude等。支持本地自托管,无需GPU,可在家用硬件上运行。可直接替换OpenAI,支持gguf、transformers、diffusers等多种模型架构。功能包括:文本、音频、视频、图像生成,语音克隆,分布式和P2P推理。
你的 AI 第二大脑,可自行托管。从网络或你的文档中获取答案。构建自定义代理,安排自动化任务,进行深度研究。将任何在线或本地大型语言模型 (LLM) 变成你个人的自主 AI(例如 GPT、Claude、Gemini、Llama、Qwen、Mistral)。立即开始 – 免费。
Diffusers:一个基于PyTorch和FLAX的库,包含最先进的扩散模型,用于图像、视频和音频生成。
开箱即用的云端模板,适用于基于检索增强生成(RAG)的应用、AI 数据管道和企业级搜索,并支持实时数据。?支持Docker。?始终与Sharepoint、Google Drive、S3、Kafka、PostgreSQL、实时数据API等同步。
AI 驱动的 PDF 学术论文翻译,完美保留原有排版格式。支持 Google、DeepL、Ollama、OpenAI 等多种翻译引擎,提供命令行界面 (CLI)、图形用户界面 (GUI)、Docker 镜像和 Zotero 插件。
Invoke 是一个领先的 Stable Diffusion 模型创意引擎,赋能专业人士、艺术家和爱好者使用最新的 AI 技术生成和创作视觉媒体。该方案提供业界领先的 WebUI,并作为多个商业产品的基础。
基于PyTorch的图像到图像转换
JARVIS是一个连接大型语言模型(LLM)和机器学习(ML)社区的系统。论文链接:https://arxiv.org/pdf/2303.17580.pdf
一个AI编排框架,用于构建可定制、可用于生产环境的大型语言模型(LLM)应用。它能够将组件(模型、向量数据库、文件转换器)连接到管道或代理,从而与您的数据进行交互。借助先进的检索方法,它最适合构建基于检索的增强生成(RAG)系统、问答系统、语义搜索或对话式智能体聊天机器人。
Crawlee 是一个基于 Node.js 的网页抓取和浏览器自动化库,用于构建可靠的爬虫程序。它支持 JavaScript 和 TypeScript,可以提取数据用于 AI、大型语言模型 (LLM)、检索增强生成 (RAG) 或 GPT 等应用。它能够下载网站上的 HTML、PDF、JPG、PNG 等各种类型的文件。兼容 Puppeteer、Playwright、Cheerio、JSDOM 和原生 HTTP 请求。支持有头和无头模式,并提供代理轮换功能。
落地SAM:融合DINO、Segment Anything、Stable Diffusion和Recognize Anything,实现自动检测、分割和生成任何物体
稳定的扩散模型 WebUI 协作平台
LangChain 和 LangGraph AI 的 PDF 聊天机器人代理
支持多语言的大型语音生成模型,具备推理、训练和部署的全栈能力。
构建企业级 RAG(检索增强生成)流水线的统一框架,该框架使用小型专用模型
Ian Goodfellow、Yoshua Bengio和Aaron Courville合著的《MIT深度学习》(PDF格式,完整版及部分章节)