最好的文本描述 AI工具模型_精選文本描述資訊

AI資訊

騰訊炸場！10億參數文生3D動作神器開源，遊戲NPC一鍵“活”了！

騰訊混元團隊開源HY-Motion1.0模型，基於DiT架構與流匹配技術，通過文本描述即可生成高質量3D骨骼動畫，兼容主流3D工具，大幅降低動畫製作門檻。該模型採用全階段訓練策略，利用超3000小時動作數據優化生成效果。

13.2k 52 分鐘前

阿里巴巴推出新款 Qwen 模型，三秒音頻即可克隆聲音

阿里巴巴雲發佈兩款AI語音模型，Qwen3-TTS-VD-Flash支持用戶通過文本指令定製聲音，可精確描述聲音的情感、節奏等特徵，實現個性化語音生成。

14.7k 昨天

英偉達發佈開放式推理 AI 助力自動駕駛技術邁向新臺階

英偉達在NeurIPS大會上發佈自動駕駛AI模型Alpamayo-R1（AR1），這是全球首個行業級開放推理視覺語言行動模型。它能同時處理文本和圖像，將傳感器信息轉化爲自然語言描述，結合推理鏈AI和路徑規劃技術，以應對複雜駕駛場景，加速無人駕駛汽車發展。

13.9k 5 小時前

全新開源語音模型 Maya1：實現實時、富有表現力的文本轉語音

Maya Research推出Maya1文本轉語音模型，30億參數，可在單GPU實時運行。模型通過自然語言描述和文本輸入，生成可控且富有表現力的語音，精準模擬人類情感與聲音細節，如指定年齡、口音或角色特徵。

11.6k 昨天

AI產品

Seedream 5.0

Seedream 5.0可將文本描述瞬間轉化為精美圖像，免費且無限創作

圖片生成

5.8k

Nano Banana AI, So Cheap

NanoBananas是一款AI圖像生成平臺，通過簡單的文本描述即可生成驚人的圖像、表情和角色設計。

圖片生成

7.2k

AINanoBanana

AI Nano Banana是一款基於AI的圖像生成和編輯平臺，通過簡單的文本描述創建令人驚歎的視覺效果。

圖片生成

7.5k

RapidChart.ai

使用AI快速生成UML圖表，從簡單的文本描述中生成類圖、ER圖等。快速、直觀、強大。

AI設計工具

24.5k

模型

Gemini 2.0 Flash-Lite

Google

$0.49

輸入tokens/百萬

$2.1

輸出tokens/百萬

上下文長度

GPT-4.1 mini

Openai

$2.8

輸入tokens/百萬

$11.2

輸出tokens/百萬

上下文長度

Grok 4 Fast

Xai

$1.4

輸入tokens/百萬

$3.5

輸出tokens/百萬

上下文長度

o3-mini

Openai

$7.7

輸入tokens/百萬

$30.8

輸出tokens/百萬

200

上下文長度

GPT-5 Codex

Openai

輸入tokens/百萬

輸出tokens/百萬

上下文長度

Claude 3 Opus

Anthropic

$105

輸入tokens/百萬

$525

輸出tokens/百萬

200

上下文長度

Gemini 2.0 Flash

Google

$0.7

輸入tokens/百萬

$2.8

輸出tokens/百萬

上下文長度

Claude Haiku 4.5

Anthropic

輸入tokens/百萬

$35

輸出tokens/百萬

200

上下文長度

Gemini 2.5 Flash

Google

$2.1

輸入tokens/百萬

$17.5

輸出tokens/百萬

上下文長度

Claude Sonnet 4.5

Anthropic

$21

輸入tokens/百萬

$105

輸出tokens/百萬

200

上下文長度

Claude 3 Sonnet

Anthropic

$21

輸入tokens/百萬

$105

輸出tokens/百萬

200

上下文長度

Gemini 2.5 Flash-Lite

Google

$0.7

輸入tokens/百萬

$2.8

輸出tokens/百萬

上下文長度

qwen3-max

Alibaba

輸入tokens/百萬

$24

輸出tokens/百萬

256

上下文長度

qwen-image-plus

Alibaba

輸入tokens/百萬

輸出tokens/百萬

上下文長度

qwen3-coder-plus

Alibaba

輸入tokens/百萬

$16

輸出tokens/百萬

上下文長度

Qianfan-Lightning

Baidu

輸入tokens/百萬

輸出tokens/百萬

128

上下文長度

Doubao-Seed-Translation

Bytedance

$1.2

輸入tokens/百萬

$3.6

輸出tokens/百萬

上下文長度

Qwen3-Next-80B-A3B-Instruct

Alibaba

輸入tokens/百萬

輸出tokens/百萬

256

上下文長度

wan2.5-t2v-preview

Alibaba

輸入tokens/百萬

輸出tokens/百萬

上下文長度

wan2.5-i2v-preview

Alibaba

輸入tokens/百萬

輸出tokens/百萬

上下文長度

MCP

Image Gen Server

基於即夢AI的圖像生成服務，專為Cursor IDE設計，實現文本描述到圖像的生成與保存。

python

12.7k

4.0分

Nano Banana Pro Mcp

一個基於Google Gemini圖像生成模型的MCP服務器，允許AI代理通過文本提示生成、編輯和描述圖像，支持多種模型和配置選項。

typescript

6.1k

2.5分

Primitive Go Mcp Server

一個基於Go語言的MCP服務器，通過OpenAI的DALL-E API實現文本描述生成圖像功能，可與Claude等大型語言模型集成使用。

6.4k

2.5分

Mcp Diagram

MCP-Diagram是一個通過文本描述快速生成多種類型圖表（如架構圖、UML類圖等）的服務器工具，支持與Claude等AI助手集成。

java

6.4k

2.5分

OpenAI Image Generation

該項目實現了一個MCP服務器，通過OpenAI的gpt-image-1模型提供圖像生成和編輯功能，支持文本描述生成圖像、基於參考圖像編輯或修復圖像，並可將結果保存到本地。

python

7.5k

2.5分

Mcp Image Recognition

一個提供圖像識別功能的MCP服務器，支持Anthropic和OpenAI的視覺API，具備圖像描述、多格式支持、可配置主備服務商及OCR文本提取功能。

python

11k

2.5分

Flux Image Mcp Server

Flux Image MCP Server是一個基於Flux Schnell模型的圖像生成服務，通過Replicate平臺提供API接口，支持通過文本描述生成圖像。

typescript

6.6k

2.5分

Gemini Nanobanana Mcp

Gemini Nanobanana MCP 是一個讓用戶通過文本描述生成AI圖像的Claude插件，集成了Google Gemini 2.5 Flash圖像生成功能，支持多種圖像編輯和創作方式。

javascript

6.5k

2.5分

Mcp Server

一個基於Inspire後端圖像搜索能力的MCP服務器，提供通過文本描述搜索相似圖片的功能。

typescript

2.5分

Mcp Grep

一個基於grep命令的MCP服務器，提供強大的文本搜索功能，支持自然語言描述和正則表達式搜索。

typescript

6.6k

2.0分

Mcp Nanobanana

Nano Banana是一個專業的MCP擴展，用於通過文本描述生成、編輯和修復圖像，支持多種圖像處理功能，如生成圖標、圖案、故事和圖表等。

typescript

2.0分

Freepik Flux Ai Mcp Sunucusu

一個基於Freepik Flux AI的MCP服務器，用於通過文本描述生成圖像，支持多種寬高比，並與Claude Desktop集成。

javascript

8.2k

2.0分

Prasanthmj_primitive Go Mcp Server

一個基於Go語言的MCP服務器，通過OpenAI的DALL-E API實現文本描述生成圖像功能，支持與Claude等大型語言模型集成。

7.4k

2.0分

Zxkane_mcp Server Amazon Bedrock

一個基於Amazon Bedrock Nova Canvas模型的MCP服務器，提供高質量的AI圖像生成服務，支持文本描述生成圖像、負面提示優化、尺寸配置和種子控制等功能。

typescript

8.5k

2.0分

Replicate Image Generate

一個基於HTTP的圖片生成服務器，通過調用Replicate的Flux Schnell模型來根據文本描述生成圖像。

智啟未來，您的人工智能解決方案智庫

友情链接:

AI Newsletters AI Tools MCP Servers AI News AIBase LLM Leaderboard AI Ranking

商務合作網站地圖

AI資訊

騰訊炸場！10億參數文生3D動作神器開源，遊戲NPC一鍵“活”了！

阿里巴巴推出新款 Qwen 模型，三秒音頻即可克隆聲音

​英偉達發佈開放式推理 AI 助力自動駕駛技術邁向新臺階

全新開源語音模型 Maya1：實現實時、富有表現力的文本轉語音

AI產品

Seedream 5.0

Nano Banana AI, So Cheap

AINanoBanana

RapidChart.ai

模型

Gemini 2.0 Flash-Lite

GPT-4.1 mini

Grok 4 Fast

o3-mini

GPT-5 Codex

Claude 3 Opus

Gemini 2.0 Flash

Claude Haiku 4.5

Gemini 2.5 Flash

Claude Sonnet 4.5

Claude 3 Sonnet

Gemini 2.5 Flash-Lite

qwen3-max

qwen-image-plus

qwen3-coder-plus

Qianfan-Lightning

Doubao-Seed-Translation

Qwen3-Next-80B-A3B-Instruct

wan2.5-t2v-preview

wan2.5-i2v-preview

Flux2 Dev Gguf

Flux2_berthe_morisot

Anime2Realism

HoloCine GGUF

TRELLIS Text Xlarge Clone

FIBO

Rexcrowle Qwen Image Lora

Simpletuner Example Pixart Lycoris Lokr

RequirementClassifier

SD15 ControlNet

Rtmi Qwen Image Lora

Reed Nsfw Illustrious Sdxl V30 Il Sdxl

HunyuanImage 2.1 Diffusers

FLUX.1 Wireframe Dev Lora

Poshanimals

Lejos Borges Simpletuner Lora

FLUX.1 Layout ControlNet

NetaYume Lumina Image 2.0 GGUF

Gr4f1tt0_v1_qwen

Chroma 8 Steps GGUF

MCP

Image Gen Server

Nano Banana Pro Mcp

Primitive Go Mcp Server

Mcp Diagram

OpenAI Image Generation

Mcp Image Recognition

Flux Image Mcp Server

Gemini Nanobanana Mcp

Mcp Server

Mcp Grep

Mcp Nanobanana

Freepik Flux Ai Mcp Sunucusu

Prasanthmj_primitive Go Mcp Server

Zxkane_mcp Server Amazon Bedrock

Replicate Image Generate

英偉達發佈開放式推理 AI 助力自動駕駛技術邁向新臺階