谷歌Gemini3Pro的“Vibe Coding”功能让零基础用户用自然语言快速生成网页。文科用户实测,一句话指令两分钟完成高考倒计时页面,自动添加交互设计和随机语录,突出自然语言编程在教育场景的应用潜力。
谷歌Gemini3通过Canvas功能提前展示多模态能力,可将《我的世界》与塔防游戏结合成网页,复刻Switch模拟器运行宝可梦,被誉“最强前端AI”。其他案例包括生成新粗野主义网页、黑洞可视化、交互风扇和YouTube克隆,均以单HTML文件实现,引爆开发者社群。
谷歌Gemini Pro/Ultra订阅用户现可体验Veo3.1视频模型,新增“Ingredients to Video”功能:支持同时上传三张参考图,分别提取人物、场景与风格特征,融合生成8秒1080p视频。生成内容自带SynthID隐形水印,支持网页/移动端文本输入一键生成。系统确保跨帧角色一致性与光影连贯,演示案例显示三张自拍+赛博城市背景+油画风格图可合成“印象派未来街头漫步”视频。
Google推出NotebookLM新工具"Deep Research",支持自动在线调研,兼容Google Sheets、Drive、PDF及Word等文件。提供快速和深度两种模式:快速模式即时返回简要来源,深度模式后台浏览数百网页生成带引用的完整报告。用户可添加其他来源,报告和引用一键保存至笔记本。功能一周内全面推送。
Director是Browserbase的无代码工具,可根据提示创建可重复的网页自动化操作。
InPage AI是一款能够将AI功能直接带入浏览器的Chrome扩展,帮助用户撰写邮件、生成内容、总结网页等。
一个可以复制任何网页UI界面并生成代码提示的工具。
利用AI一键生成网页
Openai
$2.8
Input tokens/M
$11.2
Output tokens/M
1k
Context Length
Google
$0.49
$2.1
Xai
$1.4
$3.5
2k
$7.7
$30.8
200
-
Anthropic
$105
$525
$0.7
$7
$35
$17.5
$21
Alibaba
$4
$16
$6
$24
256
Baidu
128
Bytedance
$1.2
$3.6
4
$2
SamuelBang
AesCoder-4B是一个专注于提升代码美学质量的大语言模型,通过智能奖励反馈机制优化代码生成的美学表现,在网页设计、游戏开发等视觉编码任务中表现出色。
Tesslate
WEBGEN DEVSTRAL IMAGES 是一个专注于网页生成的人工智能模型,能够利用 HTML、CSS、JS 和 Tailwind 技术生成单页式网页。该项目基于自定义模板进行训练,采用监督微调方法,使用 GPT-OSS-120B 生成的数据集进行训练。
QuantFactory
UIGEN-FX-4B-Preview是一个具有40亿参数的UI生成模型,专门针对前端开发进行优化,能够在22个框架中表现得像一名前端工程师。该模型专注于生成语义化的HTML代码,具有优秀的布局节奏、间距控制和组件组合能力,适合快速生成单文件网页。
enacimie
这是一个基于Tesslate/WEBGEN-4B-Preview转换的GGUF格式模型,专门用于网页生成和UI设计任务。模型采用Q4_K_M量化格式,在保持较好性能的同时减少了模型大小。
giladgd
GPT-OSS-120b-GGUF 是 OpenAI 发布的 1200 亿参数开源文本生成模型,采用 Apache 2.0 宽松许可证,支持灵活的推理强度配置和完整思维链访问,具备原生函数调用、网页浏览和代码执行能力。
ncls-p
基于Qwen2.5-7B-Instruct微调的模型,专门用于从博客文章和网页内容中提取关键要点,生成简洁的要点式摘要。
tokyotech-llm
用于评估日语网页教育价值的fastText分类器,包含基于维基百科和LLM生成的两种分类器
LLM360
CrystalChat-7B-Web2Code是基于CrystalChat-7B大语言模型的多模态大语言模型,专门用于网页图像到HTML代码的生成。该模型借鉴了LLaVa-v1.5的训练方法,具有完全开源、高度透明的特点,支持从手绘图像或现有网页生成对应的HTML代码。
VibeCheck Web测试工具是一个AI驱动的网页测试代理,通过MCP协议集成到AI编程助手(如GitHub Copilot、Cursor等)中,实现自动化测试录制、执行和发现。它利用Playwright控制浏览器,支持自然语言描述生成测试脚本,执行回归测试,并自动发现潜在测试步骤,提高开发效率和测试准确性。
Content Core是一个AI驱动的多功能内容提取与处理平台,支持从网页、文档、音视频等各类来源提取内容,并提供智能清理、摘要生成等功能,支持命令行、Python库、MCP服务等多种集成方式。
CTX是一款连接代码库与大型语言模型(LLM)的工具,通过自动化生成结构化上下文文件,解决AI开发中代码上下文传递效率低下的问题。支持从代码文件、Git仓库、网页等多种来源收集信息,并可通过MCP服务器直接为AI助手提供项目上下文。
Tavily MCP服务器是一个基于Tavily搜索API的AI网络搜索服务,提供网页搜索、答案生成和新闻搜索功能,支持多种安装和配置方式。
自动生成Cypress页面对象类和完整测试套件的MCP服务,支持网页抓取、元素识别和多种测试场景生成
一个为Windsurf提供图像生成和网页抓取功能的MCP服务器,支持Flux Pro模型生成图像和ScrapeGraph API进行网页内容提取。
自动生成完整网站图标集的MCP服务,支持从PNG图片或URL创建多种尺寸的favicon、苹果触摸图标及网页应用清单文件。
Spiral MCP服务器为Spiral API提供标准化接口,支持文本生成、文件处理和网页内容提取功能。
MCP URL2SNAP是一个轻量级的Model Context Protocol (MCP)服务器,允许LLM通过指定URL捕获网页截图并返回图像访问链接。该项目简化了网页快照的生成和共享过程,适合集成到Claude Desktop等AI应用或自动化工作流中。
一个允许Claude与OpenAI对话并使用gpt-image-1生成图像资产的工具,适用于游戏或网页开发中需要生成单个资产的场景。
MCP-URL2SNAP是一个轻量级的Model Context Protocol (MCP)服务器,允许LLM通过指定URL捕获网页截图并返回图像访问URL,简化了网页快照的生成和共享过程。
一个基于MCP协议的UI/UX设计自动化套件,通过AI辅助实现从设计灵感到开发交付的端到端工作流,包含网页灵感采集、Figma设计集成和React代码生成三大核心功能。
一个基于Node.js和Gemini API的AI研究助手工具,通过Firecrawl进行网页数据抓取,利用Gemini大模型进行深度语言理解和报告生成,支持迭代式深度研究,并可与MCP协议集成。
Open Deep Research MCP Server是一个AI驱动的深度研究助手,通过结合搜索引擎、网页抓取和AI技术进行迭代式深度研究,生成全面报告。支持MCP协议和CLI两种使用方式,具备可靠性评估、范围控制、自动生成后续问题等功能。
该项目实现了一个MCP协议服务器,提供基于OpenRouter的网页搜索工具,能够生成简洁、实时的答案。
一个基于Playwright和Axe-core的自动化网页可访问性扫描工具,提供WCAG合规检查、标注截图和详细报告生成功能。
一个基于MCP协议的网页内容扫描与分析服务器,提供网页抓取、链接提取、网站爬取、链接检查、模式匹配和站点地图生成等功能。
一个基于Ollama LLM模型的MCP服务器项目,提供维基百科文章抓取和摘要生成功能,包含命令行客户端和Streamlit网页界面。
一个提供AI视觉分析能力的MCP服务器,支持网页截图、视觉分析、文件操作和报告生成等功能。
一个结合LangChain、MCP协议、RAG技术和Ollama的智能搜索引擎,支持网页搜索、信息检索和答案生成,具备本地和云端LLM调用能力。