发现与 Twitter Scraper 相关的最受欢迎的开源项目和工具,了解最新的开发趋势和创新。
Crawlee 是一个基于 Node.js 的网页抓取和浏览器自动化库,用于构建可靠的爬虫程序。它支持 JavaScript 和 TypeScript,可以提取数据用于 AI、大型语言模型 (LLM)、检索增强生成 (RAG) 或 GPT 等应用。它能够下载网站上的 HTML、PDF、JPG、PNG 等各种类型的文件。兼容 Puppeteer、Playwright、Cheerio、JSDOM 和原生 HTTP 请求。支持有头和无头模式,并提供代理轮换功能。
ELIZA是一个开放域聊天机器人,可以与Discord和Twitter集成。
每天利用大型语言模型从海量信息和各种来源中挖掘你感兴趣的内容。
利用大型语言模型将任何网页转换成结构化数据
通过图片识别和反向图片搜索,查找你朋友的Instagram、Facebook和Twitter账号。
一个由社区驱动,基于ChatGPT的阅读和与AI机器人聊天的方式
利用Elasticsearch、Twitter、新闻标题以及Python的自然语言处理和情感分析技术,对股市进行分析和预测。
开源软件的分析、比较、趋势和排名,你还可以通过自然语言处理(基于OpenAI)洞察超过70亿条数据。关注我们的Twitter:@ossinsight
一款强大的网页抓取工具,由大型语言模型 (LLM) 提供支持,包括 OpenAI、Gemini 和 Ollama。
这个仓库汇集了人工智能领域众多优质信息来源,帮你及时了解行业动态,避免错过重要信息或陷入信息孤岛。
TrendPublish:一款全自动人工智能内容创作和发布系统。它能自动管理微信公众号,从多个来源(如Twitter/X、网站)抓取数据,并利用DeepseekAI、千问、讯飞等AI模型生成内容。系统具备智能内容分析和排序功能,支持定时发布和多种模板,采用Node.js和TypeScript开发,并内置AI技术趋势追踪工具。
使用高性能、分布式AI-RPA技术,大规模自动化网页操作,完整且准确地抓取网页数据。
2017年国际网络社会科学会议(ICWSM)论文“自动化仇恨言论检测及冒犯性语言问题”的代码库
这是一个基于机器学习和推特情绪分析的股票市场预测网页应用(代码包含API密钥)。前端使用Flask和WordPress构建。该应用可以预测任何用户输入的纳斯达克或NSE股票未来七天的股价。预测使用三种算法:ARIMA、LSTM和线性回归。该应用结合未来七天的预测价格和推文情绪分析,给出股价涨跌的建议。
由OpenAI的ChatGPT API驱动的推特机器人,它活啦!
Tock:开源对话式人工智能工具包
一个多线程的网页爬虫,能够递归地爬取网站并为每个页面创建一个 Markdown 文件,专为大型语言模型的检索增强生成 (RAG) 而设计。
利用GPT和其他语言模型从所有信息来源中提取知识。对信息来源进行索引,并进行问答互动。
用于推特情感分析的深度神经网络
基于GPT的通用网页抓取器MVP是一个解决方案,它利用GPT模型和网页抓取库,根据用户输入和网站分析生成抓取代码,从而简化网页抓取流程。