xAI即將爲iOS版Grok Imagine工具推出視頻生成功能,用戶可通過文本或圖像提示創建高清動態視頻,並支持從內容提要中直接重混提示以快速迭代創作。界面輕度優化提升操作流暢性,基於Aurora/Grok核心模型,支持一鍵高清升級,生成數秒短片,適用於廣告和創意內容。重混機制降低輸入門檻,簡化創作流程。
Adobe發佈專業級AI圖像生成模型Firefly Image5,實現從“夠用”到專業級的質變。新功能包括原生400萬像素輸出、分層提示編輯、自定義藝術風格模型及AI語音配樂生成,打通圖像、視頻、音頻的AI創作閉環,重新定義創意工作流。
谷歌Gemini Canvas推出新功能,可根據提示詞或文件快速生成PPT,旨在提升學生和職場人士的製作效率。操作簡便,用戶輸入提示即可自動生成幻燈片。
OpenAI正開發AI音樂生成工具,可根據文本或音頻提示創作音樂,拓展多模態內容生成能力。主要聚焦視頻配樂和精準伴奏,支持爲視頻定製背景音樂等實用場景。
insMind免費AI文本轉視頻生成器,在線根據文本提示創建精彩視頻
AI提示生成、優化與管理工具,輕鬆生成優化提示,管理複用提示。
提供優質圖像生成提示詞,瀏覽模板一鍵複製創作驚豔圖像
免費AI Sora 2提示生成器,將想法轉化為專業視頻提示
nvidia
-
輸入tokens/百萬
輸出tokens/百萬
128k
上下文長度
anthropic
$108
$540
200k
noctrex
這是PromptCoT-2.0-SelfPlay-30B-A3B模型的MXFP4_MOE量化版本,專門用於文本生成任務。該模型採用了思維鏈提示和自博弈訓練技術,通過量化優化實現了更高效的推理性能。
stablellama
這是一個基於Qwen/Qwen-Image模型的LyCORIS適配器,專門用於文本到圖像和圖像到圖像的生成任務。該模型在訓練過程中未使用驗證提示,採用了優化的訓練配置和量化技術。
neuralvfx
LibreFLUX-ControlNet是一個基於ControlNet架構的文本到圖像生成模型,使用LibreFLUX作為基礎Transformer模型。該模型在SA1B數據集上進行訓練,能夠根據文本提示和控制圖像生成高質量的圖像內容。
EpistemeAI
這是第一代強大的vibe-code大語言模型,經過優化可直接根據結構鬆散的'氛圍編碼'提示生成自然語言和代碼補全。相比早期模型,它具有更低的提示工程開銷、更平滑的潛在空間插值,更容易引導生成可用代碼。
Lambent
Mira是一個基於多個Gemma 3 27B基礎模型融合的文本生成模型,通過精心挑選的訓練數據和特定訓練方式,具備獨特的詩意文本生成能力。該模型在角色扮演和創意寫作方面表現出色,能夠根據不同的系統提示生成富有文學色彩的文本。
nunchaku-tech
基於sdxl-turbo經過Nunchaku量化處理的文本到圖像生成模型,旨在根據文本提示生成高質量圖像。該模型針對高效推理進行了優化,在保持性能的同時顯著減小模型大小。
gtmepm
simpletuner-lora 是一個基於 stabilityai/stable-diffusion-3.5-medium 的 LyCORIS 適配器,專門用於文生圖等圖像生成任務。該模型通過 LoRA 微調技術實現,主要使用驗證提示為'A photo-realistic image of a cat'進行訓練。
Alissonerdx
HuMo是一個統一的、以人為中心的視頻生成框架,能夠根據文本、圖像和音頻等多模態輸入,生成高質量、細粒度且可控的人類視頻。它支持強大的文本提示跟隨、一致的主體保留以及同步的音頻驅動運動。
VeryAladeen
HuMo是一個以人為中心的視頻生成框架,能夠利用文本、圖像和音頻等多模態輸入生成高質量、細粒度且可控的人類視頻,支持文本提示跟隨、主體保留和音頻驅動運動同步。
QuantFactory
這是Tesslate/WEBGEN-4B-Preview的量化版本,專注於生成單文件網站,能將提示轉化為簡潔、響應式的HTML/CSS/Tailwind代碼。模型小巧適合本地運行和快速迭代,具有開放權重、移動優先輸出、默認無外部JS等特點。
Wan-AI
Wan2.2-S2V-14B是一個專為音頻驅動的電影級視頻生成而設計的混合專家(MoE)模型。它能夠根據輸入的音頻、參考圖像和文本提示生成高質量的視頻內容,支持480P和720P分辨率,並具備複雜運動生成和電影級美學效果。
camenduru
FLUX.1 [dev] 是一個具有120億參數的整流流變壓器,專門用於文本到圖像生成。它在圖像生成質量方面表現卓越,僅次於FLUX.1 [pro],具有出色的提示跟隨能力和高效的訓練方式,為科研和創作提供強大支持。
John6666
Intorealism XL 是一款強大的文本到圖像生成模型,能夠生成逼真、細膩的圖像,涵蓋人像、風景等多種主題,在光影、紋理等方面表現出色,嚴格遵循輸入提示進行圖像創作。
InvokeAI
FLUX.1 Krea [dev] 是一個擁有120億參數的先進整流流變換器模型,專門用於根據文本描述生成高質量圖像。該模型在美學攝影領域表現卓越,具有出色的提示遵循能力,採用引導蒸餾技術訓練,並開放權重供非商業用途使用。
Colossus Project Flux 的 Nunchaku 量化版本,旨在根據文本提示生成高質量圖像。該模型在優化推理效率的同時,將性能損失降至最低。
Acly
MobileSAM是一款輕量級的圖像分割模型,能夠根據點或框提示生成目標掩碼,專為在消費級硬件上進行高效推理而設計。
這是一個經過Nunchaku量化的SANA-1.6B模型版本,專門用於根據文本提示生成高質量圖像。該模型通過先進的SVDQuant量化技術,在保持生成質量的同時顯著優化了推理效率,適用於各種文本到圖像的生成任務。
Nunchaku 量化的 FLUX.1-dev 模型,用於根據文本提示生成高質量圖像,優化了推理效率。
sriprabha
這是一個基於FLUX.1-schnell的LyCORIS適配器,專門用於文本到圖像生成任務。該模型通過LoRA技術進行微調,在訓練過程中未使用驗證提示,文本編碼器未進行訓練,可複用基礎模型的文本編碼器進行推理。
Roblox
Roblox Guard 1.0是一款基於Llama-3.1-8B-Instruct微調的最先進指令微調大語言模型,專門設計用於保護文本生成API的安全。它能夠在提示詞和回覆層面進行雙級安全分類,有效審核用戶查詢和模型輸出,確保內容符合安全政策。
一個基於Model Context Protocol (MCP)的服務,支持規範驅動的開發流程,通過結構化提示引導開發者從需求生成、設計文檔到代碼實現的系統化開發過程。
Lucidity是一個模型上下文協議(MCP)服務器,旨在通過智能提示分析提升AI生成代碼的質量。它提供結構化指導,幫助識別和解決代碼質量問題,支持多種編程語言,並能與AI助手無縫集成。
Roblox Studio MCP服務器是一個專為Roblox Studio開發設計的TypeScript實現,提供資源、工具和提示,支持LLM應用程序通過標準化接口訪問Roblox Studio文檔、模板和代碼生成功能。
遊戲資產生成器利用AI模型和MCP協議,通過文本提示快速生成2D和3D遊戲資源。
一個基於TypeScript的MCP服務器,使用OpenAI的DALL-E 3模型根據文本提示生成圖像。
一個基於OpenAI gpt-image-1模型的圖像生成與編輯MCP服務器,支持通過文本提示創建和修改圖像,提供便捷的集成方式和豐富的配置選項。
OracleDB MCP Server是一個提供Oracle數據庫表/列上下文給LLM的服務器,支持通過LLM提示與數據庫交互、生成SQL語句並返回結果。
oatpp-mcp是基於Oat++框架實現的Anthropic模型上下文協議(MCP),支持自動生成API工具、STDIO和HTTP SSE傳輸方式,以及提示、資源和工具等服務器功能。
該項目是一個基於FastMCP庫構建的Kaggle MCP服務器,提供搜索和下載Kaggle數據集的功能,並能生成EDA筆記本提示。
一個基於Rust庫的MCP服務器,用於從代碼庫生成上下文提示,幫助AI助手更好地理解和處理代碼倉庫。
一個基於TypeScript的MCP服務器,使用OPENAI的dall-e-3模型根據文本提示生成圖像,並支持將生成的圖像保存到本地指定目錄。
AI Studio MCP Server是一個集成Google AI Studio/Gemini API的模型上下文協議服務器,提供支持文件、對話歷史和系統提示的內容生成功能。
一個基於Google Gemini API的MCP服務器,提供圖像生成功能,支持通過文本提示創建圖像並自動上傳到ImgBB圖床。
Image Generation MCP Server是一個為Claude Desktop提供圖像生成功能的MCP服務器,使用Replicate Flux模型,支持通過文本提示生成圖像,並可通過Smithery或npm安裝配置。
LetzAI MCP 是一個用於圖像生成的模型上下文協議,通過 Claude 桌面應用集成,支持基於提示詞生成和放大圖像。
cal2prompt是一個命令行工具,可將Google日曆日程轉換為自定義提示或文本片段,支持模板引擎和MCP服務器模式。
一個基於OpenAI GPT-4o/gpt-image-1模型的圖像生成與編輯工具,支持通過文本提示生成圖像、編輯圖像(如修復、擴展、合成等),併兼容多種MCP客戶端。
該項目是一個基於Google Veo2模型的視頻生成MCP服務器,支持通過文本提示或圖像生成視頻,並提供MCP資源訪問功能。
ComfyUI的MCP服務,提供圖像生成和提示詞優化功能,支持自動調整尺寸和隨機種子生成。
一個基於Git倉庫內容生成提示的MCP服務器