大模型競爭轉向智能體,商湯正研發業內首個原生全模態智能體基座,集成“理解、生成、行動”統一內核,直接對標GPT-Image 2,推動AI從被動問答向主動執行的突破。
商湯科技正祕密研發多模態大模型“U1Pro”,面向設計場景,由首席科學家林達華牽頭。該模型隸屬“日日新”家族,目標對標OpenAI的GPT-Image2,強調長程邏輯與思考能力,預計7月啓動內測並商用。
微軟AI首席執行官穆斯塔法·蘇萊曼宣佈推出第二代圖像生成模型MAI-Image-2。該模型在權威評測榜單LMArena中表現強勁,躍升至全球第三位,僅次於谷歌Gemini-3.1-flash-image-preview和OpenAI GPT-image-1.5-high-fidelity。相比初代模型,第二代在綜合質量上實現顯著提升。
Adobe 爲 Firefly 平臺引入 OpenAI 的 GPT-Image1.5 模型,並推出限時激勵:1月15日前,Pro 和 Premium 訂閱用戶可無限量使用該模型生成圖片。此舉顯示 Adobe 正從單一模型轉向構建多模態 AI 生態。
由 GPT Image 2 驅動的 4K 高清 AI 圖像生成與商用素材創作平臺。
Image Gen MCP Server是一個通用AI圖像生成服務,通過Model Context Protocol(MCP)標準協議為各類LLM聊天機器人提供跨平臺、多模型的圖像生成能力,支持OpenAI和Google的多種圖像模型,實現文本對話到可視化內容的無縫轉換。
該項目實現了一個MCP服務器,通過OpenAI的gpt-image-1模型提供圖像生成和編輯功能,支持文本描述生成圖像、基於參考圖像編輯或修復圖像,並可將結果保存到本地。
ImageGen MCP Server是一個支持多種AI圖像生成模型(包括GPT-Image-1、Google Imagen 4、Flux 1.1等)的MCP服務器,提供靈活的圖像生成、尺寸調整和輸出格式選項,可無縫集成到各種MCP客戶端中。
一個基於OpenAI gpt-image-1模型的圖像生成與編輯MCP服務器,支持通過文本提示創建和修改圖像,提供便捷的集成方式和豐富的配置選項。
一個基於OpenAI GPT-4o/gpt-image-1模型的圖像生成與編輯工具,支持通過文本提示生成圖像、編輯圖像(如修復、擴展、合成等),併兼容多種MCP客戶端。
一個允許Claude與OpenAI對話並使用gpt-image-1生成圖像資產的工具,適用於遊戲或網頁開發中需要生成單個資產的場景。