マイクロソフトはWindows 11の時計アプリをアップグレードし、より強力な集中機能、タスク管理およびAIスマート提案を導入しています。新しいUIは丸みを帯びたデザインで、タスクパネルは半画面を占め、タイトルや日付で並べ替えが可能で、Microsoft To Doとシームレスに接続されています。Focusモードでは、作業に集中している際、アプリを最小化して実行できます。
Googleが公開したAIデザインツール「Stitch」のコアフォーマット「DESIGN.md」は、機械可読な標準化プロトコルによりAIエージェントのインターフェース生成におけるブランド一貫性問題を解決。YAML形式のデザイントークン(色、フォントパラメータなど)とプレーンテキスト注釈を統合し、AIに直感的なデザインガイドラインと論理的サポートを提供。ブランドイメージに沿ったUI生成時にWCAGアクセシビリティルールにも準拠させる。....
マイクロソフトはEdgeブラウザのUIを刷新し、角丸デザイン、統一された配色とフォントを採用。CopilotとBingの要素を統合し、一貫性のあるモダンなクロスプラットフォーム体験を提供します。....
マイクロソフトはアップグレード版の画像生成モデル「MAI-Image-2-Efficient」を発表しました。このモデルは低コストと高性能が特徴で、生产レベルの品質をほぼ半額で提供します。企業が製品の実写画像やUIプロトタイプを素早く生成するのに適しています。生成速度は22%向上し、全体の効率は4倍になり、コストが著しく削減されています。
高速なテキストから画像への変換と編集が可能で、ポスター、UIシミュレーション、製品ビジュアルデザインをサポートします。
OpenAIが提供する万能型AI画像生成器で、超高品質なテキスト認識能力とピクセル単位のUI設計能力を持っています。
AIがユーザーテストプラットフォームを支援する
AIアシスタントによる視覚的なUI開発ツールで、正確なDOM情報と自然言語の説明を通じてAIがUI変更の意図を正確に理解し、期待に応えるコードを生成します。
Bytedance
$3.5
入力トークン/百万
$12
出力トークン/百万
128
コンテキスト長
Baidu
-
unsloth
JanusCoder-8Bは、Qwen3-8Bをベースに構築されたオープンソースのコードインテリジェンス基礎モデルで、統一されたビジュアルプログラミングインターフェイスを構築することを目的としています。このモデルは、JANUSCODE-800K(これまでで最大のマルチモーダルコードコーパス)で学習され、データ可視化、インタラクティブなWeb UI、コード駆動のアニメーションなど、さまざまなビジュアルプログラミングタスクを処理できます。
Disty0
このプロジェクトは、騰訊の混元画像3.0モデルを4ビット(UINT4、SVDランク32)で量子化した成果で、SDNQ量子化方法を採用し、テキストから画像の生成タスクに特化しています。
Tesslate
UIGENT-30B-Lora-200はQwen3-Coder-30B-A3B-Instructをベースに微調整された大規模言語モデルで、テキスト生成タスクに特化して最適化されており、特にHTML関連の内容を扱うことに長けており、同時に様々なテキスト生成能力を備えています。
DevQuasar
これは Tesslate/UIGEN-FX-4B-Preview モデルの量子化バージョンで、量子化技術を通じて大規模言語モデルをより簡単にデプロイして使用できるようにし、「知識をすべての人に利用させる」という理念を実現します。
QuantFactory
UIGEN-FX-4B-Previewは40億のパラメータを持つUI生成モデルで、フロントエンド開発に特化して最適化されており、22のフレームワークでフロントエンドエンジニアのように機能します。このモデルは意味論的なHTMLコードの生成に焦点を当てており、優れたレイアウトリズム、間隔制御、コンポーネント組み合わせ能力を持ち、単一ファイルのウェブページを迅速に生成するのに適しています。
enacimie
これはTesslate/WEBGEN-4B-Previewをベースに変換されたGGUF形式のモデルで、ウェブページ生成とUIデザインタスクに特化しています。モデルはQ4_K_M量子化形式を採用し、良好なパフォーマンスを維持しながらモデルサイズを削減しています。
macpaw-research
これはUltralytics/YOLO11を微調整したコンピュータビジョンモデルで、macOSアプリケーションのスクリーンショット内のUI要素を検出するために特別に設計されており、Screen2AXプロジェクトの一部で、コンピュータビジョン技術を利用して障害者対応のメタデータを生成することに取り組んでいます。
UIGEN-X-8Bの量子化バージョンで、知識を大衆に利用してもらうことを目指しています。このモデルはTesslate/UIGEN-X-8Bをベースに最適化され、より効率的な推論性能を提供します。
electroglyph
これはONNXに基づく量子化モデルで、Qwen/Qwen3-Embedding-0.6Bのuint8量子化バージョンであり、検索性能を維持しながらモデルサイズを削減しています。
yujiepan
ByteDance-Seed/UI-TARS-1.5-7Bモデルに基づく量子化バージョンで、GPTQ技術を用いて4ビットの重み量子化と16ビットの活性化量子化を行い、画像テキストからテキストへの変換機能を実現し、効率的な推論性能を持ちます。
Mungert
UI-TARS-1.5-7Bは先進技術に基づくマルチモーダルモデルで、画像とテキストの変換などのタスクで優れた性能を発揮します。革新的な量子化方法を採用し、極低ビットレートでも高い精度を維持することができます。
LZXzju
UI-R1-E-3BはQwen2.5-VL-3B-Instructを微調整した効率的なGUI位置特定モデルで、視覚的質問応答タスクに特化し、ユーザーインターフェースのスクリーンショット内での操作要素の位置特定と認識に優れています。
Lucy-in-the-Sky
これはByteDance-Seed/UI-TARS-1.5-7BモデルのGGUF量子化バージョンで、GUIインターフェース理解とマルチモーダルタスクに特化して最適化されています。このモデルは4ビット量子化技術を採用し、性能を維持しながらモデルサイズとメモリ要件を大幅に削減しています。
UIGEN-T2はQwen2.5-Coder-7B-Instructを微調整したUI生成モデルで、HTMLとTailwind CSSコードの生成に特化しています
mlx-community
UI-TARS-1.5-7B-6bitは、MLX形式に変換されたビジュアル言語モデルで、画像理解とテキスト生成タスクをサポートします。
UI-TARS-1.5-7B-4bitはマルチモーダルモデルで、画像テキストからテキストへの変換タスクに特化しており、英語をサポートしています。
parasail-ai
UI-TARSは次世代のネイティブGUIインテリジェントエージェントモデルで、人間に似た感知、推論、行動能力を備え、グラフィカルユーザーインターフェイス(GUI)とシームレスにインタラクションできます。
UI-TARSは次世代のネイティブGUIプロキシモデルで、人間型の感知、推論、行動能力を備え、グラフィカルユーザーインターフェース(GUI)とシームレスにインタラクションできます。
prithivMLmods
Raptor-X5-UIGENはQwen 2.5 14Bモダリティアーキテクチャを基に設計された大規模言語モデルで、UI設計、ミニマルコーディング、コンテンツ集約型開発に特化し、強化された推論能力と構造化された応答生成を備えています。
UIGEN-T1.5はQwen2.5-Coder-32B-Instructを微調整した先進的なTransformer UI生成モデルで、モダンでユニークなフロントエンドユーザーインターフェースの生成に特化しています。
assistant-uiは、生産レベルのAIチャットインターフェイスを迅速に構築するためのオープンソースのTypeScript/Reactライブラリで、組み合わせ可能なUIコンポーネント、ストリーミング応答、アクセシビリティなどの機能を提供し、複数のAIバックエンドとモデルをサポートしています。
Magic Component Platform (MCP) はAI駆動のUIコンポーネント生成ツールで、自然言語での記述を通じて、開発者が迅速に現代的なUIコンポーネントを作成するのを支援し、複数のIDEとの統合をサポートします。
AIワークフローにshadcn/uiコンポーネントの統合を提供するMCPサーバーで、React、Svelte、Vueフレームワークをサポートし、コンポーネントのソースコード、使用例、メタデータへのアクセス機能を備えています。
Changesetsは、マルチパッケージまたはシングルパッケージのコードベースのバージョン管理とリリースプロセスを管理するのに役立つ自動化ツールです。
iOSシミュレータMCPサーバは、Model Context Protocol(MCP)を通じてiOSシミュレータとやり取りするツールで、シミュレータの情報の取得、UIの操作、UI要素の確認などの機能をサポートしています。
AI開発アシスタントMCPサーバーは、AIベースのコード開発ツールキットで、コードアーキテクチャ生成、UIスクリーンショット分析、コードレビューなどの機能を提供し、Cursor用に設計されています。
napiはNanoAPIによって開発されたツールで、ソフトウェアアーキテクチャの複雑性を自動的に分析し、コードベースから機能モジュールを抽出することをサポートします。CLIとUIの両方の操作方法を提供し、主流のCI/CDプラットフォームと互換性があり、開発者がアーキテクチャ設計を最適化するのを支援します。
ADBに基づくAndroidデバイス制御サーバーで、MCPプロトコルを通じてデバイス管理機能を提供し、ADBコマンドの実行、画面キャプチャ、UIレイアウト分析、アプリケーションパッケージ管理をサポートします。
Magic UIの公式ModelContextProtocol (MCP)サーバーで、豊富なUIコンポーネントとエフェクトの実装詳細を提供し、複数のクライアントの統合をサポートします。
Goプロセス検査ツールで、goroutineの状態、メモリ統計、バイナリ情報の分析を提供し、ターミナルUIとHTTP APIをサポートします。
Flux UIコンポーネントの参照用のMCPサービスで、コンポーネントのドキュメントと例の検索機能を提供します。
Claude MobileはMCPサーバーで、自然言語を使ってAndroid、iOS、デスクトップ、Aurora OSデバイスを制御でき、統一された自動化操作、スマートスクリーンショット、権限管理、UIインタラクション機能を提供します。
LangCare MCP FHIRサーバーは、企業レベルのMCPサーバーで、FHIR R4電子カルテシステム用に設計されており、AIアシスタントが患者の健康記録に安全にアクセスし管理できるようにします。4種類の汎用FHIR操作ツールを提供し、40種類以上の臨床ワークフローガイドと対話型UIアプリケーションを内蔵し、EPIC、Cerner、GCPなどの複数のバックエンドをサポートし、Go言語で記述されており、企業レベルのセキュリティとHIPAAコンプライアンスを備えています。
Widget MCPは、LLMチャットに簡単なウィジェットを追加するプロジェクトで、タイマー、単位変換、事実表示などの一般的な機能を含み、MCP - UIプロトコルをサポートし、SmitheryとGooseクライアントで使用できます。
UIThub MCPサーバーはClaude用に設計されたGitHubリポジトリ内容のインタラクティブサービスで、APIを通じてコードライブラリの内容をスマートに取得して分析できます。
Gemini UIデザインサーバーは、MCPプロトコルに基づく企業向けUI/UXデザインとフロントエンド実装の専門システムで、Google Gemini 2.5 PROを統合することで、専門的なUIコンポーネントデザイン、コードレビュー、フロントエンドコード生成、アーキテクチャコンサルティングサービスを提供します。
TypeScriptで実装されたMCPサーバーで、AIアシスタントがshadcn/uiコンポーネントにアクセスして操作するためのサポートを提供します。ソースコード、サンプルコード、およびインストールガイドの取得が含まれます。
VSCode/Cursor拡張機能で、統合されたMCPサーバーとUIパネルを提供し、コマンドラインツールのドキュメントを検索および表示します。ワークスペース内のツールを自動検出し、WebViewパネルを通じてドキュメントを表示することをサポートします。
Android-MCPは軽量級のオープンソースプロジェクトで、AIエージェントとAndroidデバイス間のブリッジとして機能し、MCPサーバーを介してアプリケーションのナビゲーション、UIインタラクション、自動化テストなどの現実世界のタスクを実行します。従来のコンピュータビジョンや事前設定されたスクリプトに依存する必要はありません。
これはAIエージェント向けに設計されたAndroid MCPツールキットで、SVGからVectorDrawableへの変換、ADBログの読み取り、UI自動化、テキスト長の推定などのツールを提供し、Android開発プロセスとAIエージェントを効率的に接続することを目的としています。