Mozilla为火狐浏览器推出"AI窗口"新功能,作为可选模式与私密窗口、经典窗口并列。用户可通过内置AI助手和聊天机器人互动,提升浏览的智能性、灵活性和便捷性。此举显示Mozilla正积极布局人工智能领域。
开源工具Presentation-AI爆火,用户只需输入一句话,即可在浏览器中流式生成结构完整、视觉精美的PPT。作为Gamma.app的免费开源替代,它支持本地部署,以高度可控性和专业质量,引发全球开发者和职场用户关注。
【AI日报】HeyGen发布新一代AI视频翻译引擎,实现跨语言视频高质量本地化。核心技术突破使外国人能轻松说中文,唇形同步精准到毫秒,为开发者提供创新AI产品应用参考。
ComfyUI云平台公测上线,用户无需本地部署和高端显卡,通过浏览器即可使用全功能Stable Diffusion进行AI图像生成,大幅降低使用门槛,让普通创作者轻松获得专业级AI视觉生产力。
免费开源,无需迁移,为现有Chrome浏览器添加AI超能力
一款内置 ChatGPT 的新型浏览器。
专为Mac设计的生产力浏览器,具备智能组织、多模式、隐私保护等特性
AI驱动的销售与营销浏览器,可自动化任务,云驱动灵活可扩展。
NVFP4
Qwen3-Coder-480B-A35B-Instruct是一款强大的代码生成模型,具有480B总参数和35B激活参数,在智能编码、浏览器使用和基础编码任务方面表现出色,支持256K长上下文处理能力。
trentmkelly
用于检测Reddit评论中AI生成内容的二分类文本分类模型,支持浏览器扩展实时检测。
OTA-AI
OTA-v1是基于Qwen2.5-14B微调的专业级浏览器智能体模型,专精于浏览器环境控制,通过browser-use等框架实现高精度自动化网页操作。
tomasmcm
TeapotLLM的ONNX版本,支持通过Transformers.js在浏览器中运行的多语言文本生成模型。
onnx-community
基于ONNX格式的轻量级零样本目标检测模型,兼容Transformers.js,适用于浏览器端部署。
这是OpenAI Whisper-tiny模型的ONNX格式转换版本,专门适配transformers.js库,用于在Web浏览器中实现高效的语音识别功能。
microsoft
适用于浏览器内推理的Phi-3 Mini-4K-Instruct ONNX模型,通过ONNX Runtime Web加速浏览器中的推理。
Xenova
基于 YOLOv9 的目标检测模型,适配 Transformers.js,支持在浏览器中运行
MoritzLaurer
这是一个小型高效的零样本分类模型,基于microsoft/deberta-v3-xsmall微调而成,专为边缘设备或浏览器内用例设计。
这是一个超小体积、高效能的零样本分类模型,专为边缘设备和浏览器应用设计。
基于Facebook wav2vec2-base-960h模型的ONNX格式转换版本,专为Transformers.js设计,支持浏览器端语音识别
tennessejoyce
Titlewave是一款Chrome浏览器扩展,旨在帮助用户为Stack Overflow问题选择更佳的标题。该模型用于根据问题正文生成新的标题建议。
一个基于Playwright的MCP服务器,为LLM提供浏览器自动化能力
BrowserTools MCP是一个强大的浏览器监控与交互工具,通过Chrome扩展和本地服务器实现AI对浏览器的智能分析与操作。
基于MCP协议的AI驱动浏览器自动化服务器,支持自然语言控制网页操作和深度网络研究。
Browser MCP是一个MCP服务器+Chrome扩展,通过AI应用(如VS Code、Claude等)实现浏览器自动化操作,具有快速、隐私保护、保持登录状态和规避检测等特点。
OpenDia是一款开源浏览器扩展工具,允许AI模型直接控制用户浏览器,利用现有登录状态、书签等数据进行自动化操作,支持多种浏览器和AI模型,注重隐私保护。
Playwright MCP是一个基于Playwright的浏览器自动化服务器,通过结构化数据而非像素输入实现LLM与网页的交互。
这是一个持续更新的MCP服务器精选列表,涵盖了浏览器控制、艺术与文化、云平台、命令行、通信、客户数据平台、数据库、开发者工具、数据科学工具、文件系统、金融与金融科技、游戏、知识与记忆、位置服务、营销、监控、搜索和实用工具等多个类别。每个项目都附带了GitHub链接和星标数量,方便用户快速了解和使用。
Notte是一个开源的全栈网络AI代理框架,提供浏览器会话、自动化LLM驱动的代理、网页观察与操作、凭证管理等功能,旨在将互联网转化为代理友好的环境,并通过自然语言描述网站结构,降低LLM的认知负担。
一个基于browser-use的MCP服务器,使AI代理能够控制网页浏览器进行自动化操作。
302AI BrowserUse MCP Server是一个基于AI的浏览器自动化服务器,通过Model Context Protocol (MCP)实现自然语言控制浏览器和网络研究。
Awesome MCP Servers 是一个全面的Model Context Protocol (MCP)服务器集合,涵盖了7158个MCP服务器,分为33个类别,包括AI集成、艺术媒体、浏览器自动化、云服务、数据库、开发者工具、文件系统、金融、游戏、硬件、医疗、基础设施、知识管理、位置地图、市场营销、监控、多媒体处理、操作系统、项目管理、科学研究、安全、社交媒体、旅行交通、实用工具和版本控制等。
Hyperbrowser的MCP服务器提供网页抓取、结构化数据提取和浏览器代理工具。
一个基于Playwright的MCP服务器,为LLM提供浏览器自动化能力,包括网页交互、截图和JavaScript执行等功能。
一个基于Selenium WebDriver的MCP服务器实现,提供浏览器自动化功能
BrowserTools MCP是一个强大的浏览器监控与交互工具,通过Chrome扩展和本地Node服务器实现AI应用对浏览器数据的捕获与分析,支持与多种MCP客户端兼容。
该项目展示了Model Context Protocol(MCP)的示例实现,MCP是一种标准化协议,用于增强AI助手的能力,通过自定义工具和数据源扩展其功能。项目包含多个MCP服务器示例,如任务管理器、文件浏览器和天气服务,并提供了如何设置和使用这些服务器的指南。
一个基于MCP协议的隐身浏览器服务器,利用Playwright和反检测技术提供网页浏览和截图功能。
gbox是一个开源的自托管沙箱项目,为MCP集成和其他AI代理用例提供安全环境。它包含终端、浏览器、文件编辑器等工具,支持本地任务执行和文件处理,并提供了Python和Typescript SDK。
基于MCP协议的浏览器自动化代理工具