发现与 Extract Files 相关的最受欢迎的开源项目和工具,了解最新的开发趋势和创新。
Video-based AI memory library. Store millions of text chunks in MP4 files with lightning-fast semantic search. No database needed.
这是一个图形界面工具,可以从视频中提取硬字幕(硬编码字幕),并生成 SRT 文件。无需使用第三方 API,本工具基于深度学习技术,本地实现文本识别,包含字幕区域检测和字幕内容提取功能。
可完全自定义的 AI 聊天机器人组件,适用于您的网站
Document intelligence framework for Python - Extract text, metadata, and structured data from PDFs, images, Office documents, and more. Built on Pandoc, PDFium, and Tesseract.
Meltano:一款声明式、代码优先的数据集成引擎,能帮你实现最疯狂的数据和机器学习驱动型产品创意。告别编写、维护和扩展你自己的API集成吧!
BOM, STL files and instructions for PAROL6 3D printed robot arm
一个基于 Node.js 的命令行工具,它利用 Ollama 和 LM Studio 模型(例如 Llava、Gemma、Llama 等)根据文件内容智能地重命名文件。
Petastorm库支持使用Apache Parquet格式数据集在单机或分布式环境下训练和评估深度学习模型。它兼容Tensorflow、Pytorch和PySpark等机器学习框架,并可通过纯Python代码使用。
这个神经网络模型能够从语音中识别五种不同的男女情绪。(深度学习,自然语言处理,Python)
一个使用人工智能从文档中提取结构化数据的开源平台。
基于超点图的大规模点云语义分割
让ChatGPT帮你总结Hacker News新闻
在多目标人脸中检测、跟踪并提取最佳人脸(排除侧脸,选择最佳正面人脸)。
GitFriend is an AI-powered GitHub companion built with React, TypeScript, and Firebase. It helps users resolve Git/GitHub issues through smart AI chat, generates dynamic and professional README files, and adds commit emojis to enhance commit history.
macOS 系统的命令行语音识别和转录功能
一份精心整理的开放信息抽取 (OIE) 资源列表,包含论文、代码、数据等。
A modern web-based metadata editor for audio files, designed for managing large music collections with clean bulk editing capabilities.
Modified version of Chatterbox that accepts text files as input and no character restrictions. I use it to make audiobooks, especially for my kids.
CSV-AI 是一款强大的应用程序,它基于 LangChain、OpenAI 和 Streamlit,能够帮助你轻松挖掘 CSV 文件中的隐藏信息。使用 CSV-AI,你可以在一个地方方便地交互、总结和分析你的 CSV 文件。
基于Python的开源ETL工具,用于文件爬取、文档处理(文本提取、OCR)、内容分析(实体提取和命名实体识别)和数据增强(标注)流程,以及数据导入到Solr或Elasticsearch索引和关联数据图数据库。