Google開源AI設計工具Stitch的核心格式DESIGN.md,通過機器可讀的標準化協議解決AI Agent界面生成中的品牌一致性問題。該格式整合YAML格式的設計標記(如顏色、字體參數)與純文本註釋,爲AI提供直觀設計準則和邏輯支撐,使其在生成符合品牌形象的UI界面時,同步遵循WCAG無障礙規則。
微軟推出升級版圖像生成模型MAI-Image-2-Efficient,主打低成本與高效能。該模型以近乎半價提供生產級質量,適合企業快速生成產品實拍圖和UI原型圖。生成速度提升22%,整體效率提高4倍,成本顯著降低。
蘋果發佈兩項機器學習研究:SQUIRE系統利用GPT-4o和槽查詢中間表示,提升AI生成UI的可控性與微調效率;另一項研究則強化圖像安全審查能力,旨在解決現有技術痛點。
Anthropic正爲Claude開發常駐代理Conway,打造獨立運行、始終在線的智能環境。它將擁有獨立UI,超越傳統聊天界面,作爲代理工作空間運行。Conway可直接操作瀏覽器、連接外部工具,並集成代碼功能,實現深度任務處理與代碼執行。
OpenAI推出的全能型AI圖像生成器,具備超高文本準確率與像素級UI設計能力。
快速文本轉圖像及編輯,支持海報、UI 模擬和產品視覺設計
AI 助力用戶測試平臺
AI輔助的視覺UI開發工具,通過精確的DOM信息和自然語言描述幫助AI準確理解您的UI修改意圖。
Bytedance
$3.5
輸入tokens/百萬
$12
輸出tokens/百萬
128
上下文長度
Baidu
-
unsloth
JanusCoder-8B是基於Qwen3-8B構建的開源代碼智能基礎模型,旨在建立統一的視覺編程接口。該模型在JANUSCODE-800K(迄今為止最大的多模態代碼語料庫)上訓練,能夠處理各種視覺編程任務,包括數據可視化、交互式Web UI和代碼驅動動畫等。
Disty0
本項目是對騰訊混元圖像3.0模型進行4位(UINT4,SVD秩為32)量化的成果,採用了SDNQ量化方法,專門用於文本到圖像的生成任務。
Tesslate
UIGENT-30B-Lora-200是基於Qwen3-Coder-30B-A3B-Instruct微調的大語言模型,專門針對文本生成任務優化,特別擅長處理HTML相關內容,同時具備多種文本生成能力。
DevQuasar
這是 Tesslate/UIGEN-FX-4B-Preview 模型的量化版本,致力於通過量化技術讓大型語言模型更易於部署和使用,實現'讓知識為每個人所用'的理念。
QuantFactory
UIGEN-FX-4B-Preview是一個具有40億參數的UI生成模型,專門針對前端開發進行優化,能夠在22個框架中表現得像一名前端工程師。該模型專注於生成語義化的HTML代碼,具有優秀的佈局節奏、間距控制和組件組合能力,適合快速生成單文件網頁。
enacimie
這是一個基於Tesslate/WEBGEN-4B-Preview轉換的GGUF格式模型,專門用於網頁生成和UI設計任務。模型採用Q4_K_M量化格式,在保持較好性能的同時減少了模型大小。
macpaw-research
這是基於Ultralytics/YOLO11微調的計算機視覺模型,專門用於檢測macOS應用程序截圖中的UI元素,是Screen2AX項目的一部分,致力於利用計算機視覺技術生成無障礙元數據。
UIGEN-X-8B的量化版本,致力於讓知識為大眾所用。該模型基於Tesslate/UIGEN-X-8B進行優化,提供更高效的推理性能。
electroglyph
這是一個基於ONNX的量化模型,是Qwen/Qwen3-Embedding-0.6B的uint8量化版本,在保持檢索性能的同時減少了模型大小。
yujiepan
基於ByteDance-Seed/UI-TARS-1.5-7B模型的量化版本,採用GPTQ技術進行4位權重量化和16位激活量化,實現圖像文本到文本的轉換功能,具有高效的推理性能。
Mungert
UI-TARS-1.5-7B是基於先進技術的多模態模型,在圖像文本轉換等任務中表現出色,採用創新的量化方法,能在極低比特率下保持較高的準確性。
LZXzju
UI-R1-E-3B是基於Qwen2.5-VL-3B-Instruct微調的高效GUI定位模型,專注於視覺問答任務,特別擅長在用戶界面截圖中定位和識別操作元素。
Lucy-in-the-Sky
這是ByteDance-Seed/UI-TARS-1.5-7B模型的GGUF量化版本,專門針對GUI界面理解和多模態任務進行了優化。該模型採用4位量化技術,在保持性能的同時顯著減少了模型大小和內存需求。
UIGEN-T2是基於Qwen2.5-Coder-7B-Instruct微調的UI生成模型,專注於生成HTML和Tailwind CSS代碼
mlx-community
UI-TARS-1.5-7B-6bit 是一個基於 MLX 格式轉換的視覺語言模型,支持圖像理解和文本生成任務。
UI-TARS-1.5-7B-4bit是一個多模態模型,專注於圖像文本到文本的轉換任務,支持英文語言。
parasail-ai
UI-TARS是下一代原生GUI智能體模型,具備類人的感知、推理和行動能力,可與圖形用戶界面(GUI)實現無縫交互。
UI-TARS是下一代原生GUI代理模型,具備類人感知、推理和行動能力,可與圖形用戶界面(GUI)進行無縫交互。
prithivMLmods
Raptor-X5-UIGEN是基於Qwen 2.5 14B模態架構設計的大語言模型,專注於UI設計、極簡編碼和內容密集型開發,具有增強的推理能力和結構化響應生成。
UIGEN-T1.5是基於Qwen2.5-Coder-32B-Instruct微調的先進Transformer UI生成模型,專門用於生成現代且獨特的前端用戶界面。
assistant-ui是一個開源TypeScript/React庫,用於快速構建生產級AI聊天界面,提供可組合的UI組件、流式響應、無障礙訪問等功能,支持多種AI後端和模型。
Changesets是一個自動化工具,用於幫助管理多包或單包代碼庫的版本控制和發佈流程。
一個為AI工作流提供shadcn/ui組件集成的MCP服務器,支持React、Svelte和Vue框架,包含組件源碼、示例和元數據訪問功能。
Magic Component Platform (MCP) 是一個AI驅動的UI組件生成工具,通過自然語言描述幫助開發者快速創建現代化UI組件,支持多種IDE集成。
iOS模擬器MCP服務器是一個通過Model Context Protocol(MCP)與iOS模擬器交互的工具,支持獲取模擬器信息、控制UI交互和檢查UI元素等功能。
AI開發助手MCP服務器是一個基於AI的代碼開發工具包,提供代碼架構生成、UI截圖分析和代碼審查等功能,專為Cursor設計。
一個基於ADB的Android設備控制服務器,通過MCP協議提供設備管理功能,支持ADB命令執行、屏幕截圖、UI佈局分析和應用包管理。
napi 是一個由 NanoAPI 開發的工具,旨在自動分析軟件架構複雜性,支持從代碼庫中提取功能模塊,提供 CLI 和 UI 兩種操作方式,併兼容主流 CI/CD 平臺,幫助開發者優化架構設計。
Magic UI的官方ModelContextProtocol (MCP)服務器,提供豐富的UI組件和效果實現細節,支持多種客戶端集成。
Go進程檢查工具,提供goroutine狀態、內存統計和二進制信息分析,支持終端UI和HTTP API
Claude Mobile是一個MCP服務器,支持通過自然語言控制Android、iOS、Desktop和Aurora OS設備,提供統一的自動化操作、智能截圖、權限管理和UI交互功能。
Flux UI組件參考的MCP服務,提供組件文檔和示例的查詢功能
一個基於Appium的iPhone自動化MCP服務器,支持設備信息獲取、應用控制、UI交互和屏幕截圖等功能。
Magic Component Platform (MCP) 是一個AI驅動的UI組件生成工具,通過自然語言描述快速創建現代化UI組件,支持多款IDE集成和即時預覽。
本教程詳細介紹瞭如何使用Python構建一個完整的MCP(模型上下文協議)服務器和客戶端系統,包括帶圖形界面的客戶端實現。MCP協議用於語言模型與工具提供者之間的通信,教程涵蓋了從環境搭建、服務器實現、客戶端開發到UI集成的全過程。
一個為Starwind UI設計的MCP服務器實現,提供組件開發輔助工具
PopUI是macOS上的Claude Desktop伴侶應用,提供雙向交互式UI工具。
Stitch MCP是一個用於Google Stitch AI設計平臺的通用MCP服務器,允許用戶在兼容MCP的編輯器中通過AI快速生成和提取UI/UX設計代碼與圖像,支持零配置和跨平臺使用。
一個用於通過ADB自動化Android模擬器的MCP服務器,提供UI檢查、元素操作、截圖等功能,支持與Claude和OpenAI Codex集成。
mcp-baepsae是一個用於iOS模擬器和macOS應用自動化的本地MCP服務器,通過TypeScript MCP層和Swift原生橋接,提供UI檢查、輸入模擬、應用管理等工具。