谷歌正将Chrome浏览器升级为AI助手,推出集成AI的新功能。核心亮点是侧边栏体验,Gemini用户可直接调用AI对比购物、总结评论、搜索活动时间,推动搜索向智能代理进化。
阿里“通义千问”春节免单活动红包链接遭微信屏蔽,显示诱导下载,用户需通过浏览器访问。千问App已调整为复制口令分享,以应对拦截。
AI浏览器插件普及,但隐私风险加剧。研究显示超半数Chrome AI插件收集用户数据,近三分之一获取个人身份信息。
百度文心助手春节红包活动在微信内分享受限,用户需复制链接至外部浏览器访问。此前微信已发布春节营销活动治理公告。
RoxyBrowser指纹浏览器,跨境电商适用,多账号多开且安全隔离。
云浏览器基础设施,供AI团队和自动化使用,可通过应用或API启动,免费试用7天。
点选浏览器元素,借助Claude等AI写代码,桥接视觉设计与前端开发。
基于浏览器的AI网站构建器,可生成编辑HTML,无订阅限制,代码可导出。
Alibaba
$0.3
Input tokens/M
-
Output tokens/M
32
Context Length
onnx-community
Supertonic-TTS-ONNX是一个基于ONNX格式的文本到语音转换模型,能够将英文文本转换为自然流畅的语音。该模型基于Supertone/supertonic基础模型开发,专为Transformers.js库优化,支持在浏览器环境中高效运行。
SAM3是基于概念的任意分割模型,能够根据输入的点、框等提示信息生成精确的图像分割掩码。该版本是ONNX格式的SAM3跟踪器模型,通过Transformers.js库可在浏览器环境中高效运行。
noctrex
Jan-v2-VL是一款具有80亿参数的视觉语言模型,专为在真实软件环境(如浏览器和桌面应用程序)中执行长时、多步骤任务而设计。它将语言推理与视觉感知相结合,能够遵循复杂指令、维持中间状态,并从轻微执行错误中恢复。
prithivMLmods
Jan-v2-VL 是一个拥有80亿参数的视觉语言模型,专为在浏览器和桌面应用程序等真实软件环境中执行长周期、多步骤任务而设计。它将语言推理与视觉感知紧密结合,能够遵循复杂指令、维持中间状态并从轻微执行错误中恢复,实现稳定且持续的任务完成。
NVFP4
Qwen3-Coder-480B-A35B-Instruct是一款强大的代码生成模型,具有480B总参数和35B激活参数,在智能编码、浏览器使用和基础编码任务方面表现出色,支持256K长上下文处理能力。
trentmkelly
用于检测Reddit评论中AI生成内容的二分类文本分类模型,支持浏览器扩展实时检测。
OTA-AI
OTA-v1是基于Qwen2.5-14B微调的专业级浏览器智能体模型,专精于浏览器环境控制,通过browser-use等框架实现高精度自动化网页操作。
tomasmcm
TeapotLLM的ONNX版本,支持通过Transformers.js在浏览器中运行的多语言文本生成模型。
基于ONNX格式的轻量级零样本目标检测模型,兼容Transformers.js,适用于浏览器端部署。
这是OpenAI Whisper-tiny模型的ONNX格式转换版本,专门适配transformers.js库,用于在Web浏览器中实现高效的语音识别功能。
本项目将 OpenAI 的 Whisper-small 语音识别模型转换为 ONNX 格式,使其能够与 Transformers.js 库兼容,从而实现在 Web 浏览器或 Node.js 环境中直接运行,无需依赖 Python 后端。
microsoft
适用于浏览器内推理的Phi-3 Mini-4K-Instruct ONNX模型,通过ONNX Runtime Web加速浏览器中的推理。
Xenova
基于 YOLOv9 的目标检测模型,适配 Transformers.js,支持在浏览器中运行
MoritzLaurer
这是一个小型高效的零样本分类模型,基于microsoft/deberta-v3-xsmall微调而成,专为边缘设备或浏览器内用例设计。
这是一个超小体积、高效能的零样本分类模型,专为边缘设备和浏览器应用设计。
基于Facebook wav2vec2-base-960h模型的ONNX格式转换版本,专为Transformers.js设计,支持浏览器端语音识别
tennessejoyce
Titlewave是一款Chrome浏览器扩展,旨在帮助用户为Stack Overflow问题选择更佳的标题。该模型用于根据问题正文生成新的标题建议。
一个基于Playwright的MCP服务器,为LLM提供浏览器自动化能力
BrowserTools MCP是一个强大的浏览器监控与交互工具,通过Chrome扩展和本地服务器实现AI对浏览器的智能分析与操作。
Runno是一个JavaScript工具包集合,用于在浏览器和Node.js等环境中安全地运行多种编程语言的代码,通过WebAssembly和WASI实现沙盒化执行,支持Python、Ruby、JavaScript、SQLite、C/C++等语言,并提供Web组件、MCP服务器等集成方式。
基于MCP协议的AI驱动浏览器自动化服务器,支持自然语言控制网页操作和深度网络研究。
Browser MCP是一个MCP服务器+Chrome扩展,通过AI应用(如VS Code、Claude等)实现浏览器自动化操作,具有快速、隐私保护、保持登录状态和规避检测等特点。
OpenDia是一款开源浏览器扩展工具,允许AI模型直接控制用户浏览器,利用现有登录状态、书签等数据进行自动化操作,支持多种浏览器和AI模型,注重隐私保护。
Playwright MCP是一个基于Playwright的浏览器自动化服务器,通过结构化数据而非像素输入实现LLM与网页的交互。
这是一个持续更新的MCP服务器精选列表,涵盖了浏览器控制、艺术与文化、云平台、命令行、通信、客户数据平台、数据库、开发者工具、数据科学工具、文件系统、金融与金融科技、游戏、知识与记忆、位置服务、营销、监控、搜索和实用工具等多个类别。每个项目都附带了GitHub链接和星标数量,方便用户快速了解和使用。
Notte是一个开源的全栈网络AI代理框架,提供浏览器会话、自动化LLM驱动的代理、网页观察与操作、凭证管理等功能,旨在将互联网转化为代理友好的环境,并通过自然语言描述网站结构,降低LLM的认知负担。
一个基于browser-use的MCP服务器,使AI代理能够控制网页浏览器进行自动化操作。
302AI BrowserUse MCP Server是一个基于AI的浏览器自动化服务器,通过Model Context Protocol (MCP)实现自然语言控制浏览器和网络研究。
Awesome MCP Servers 是一个全面的Model Context Protocol (MCP)服务器集合,涵盖了7158个MCP服务器,分为33个类别,包括AI集成、艺术媒体、浏览器自动化、云服务、数据库、开发者工具、文件系统、金融、游戏、硬件、医疗、基础设施、知识管理、位置地图、市场营销、监控、多媒体处理、操作系统、项目管理、科学研究、安全、社交媒体、旅行交通、实用工具和版本控制等。
Hyperbrowser的MCP服务器提供网页抓取、结构化数据提取和浏览器代理工具。
一个基于Playwright的MCP服务器,为LLM提供浏览器自动化能力,包括网页交互、截图和JavaScript执行等功能。
一个基于Selenium WebDriver的MCP服务器实现,提供浏览器自动化功能
Awesome MCP Servers 是一个精选的 Model Context Protocol (MCP) 服务器列表,涵盖了浏览器自动化、艺术与文化、云平台、命令行工具、通信、客户数据平台、数据库、开发者工具、文件系统、金融与金融科技、游戏、知识与记忆、位置服务、营销、监控、搜索、安全、旅行与交通、版本控制以及其他工具和集成等多个领域。
Fetch Browser是一个强大的无头浏览器MCP服务器,专为AI代理设计,无需API密钥即可获取网页内容和执行Google搜索。支持多种内容格式转换和智能错误处理。
gbox是一个开源的自托管沙箱项目,为MCP集成和其他AI代理用例提供安全环境。它包含终端、浏览器、文件编辑器等工具,支持本地任务执行和文件处理,并提供了Python和Typescript SDK。
一个基于MCP协议的隐身浏览器服务器,利用Playwright和反检测技术提供网页浏览和截图功能。