Best 文本描述 AI Tools & Models - Premium 文本描述 News

AI News

xAI发布Grok Imagine Video1.5:一张图片秒变视频，直面Google Veo竞争

xAI发布Grok Imagine Video1.5预览版，进军AI视频生成赛道。该模型可将单张静态图片转换为短视频，支持720p分辨率输出。用户上传图片后，通过文本提示描述镜头运动、画面节奏和氛围，模型能保留原始图像细节、光影和风格，生成自然流畅的动态视频。

14.6k 9 hours ago

xAI发布Grok Imagine Video1.5:一张图片秒变视频，直面Google Veo竞争

谷歌 Gemini 测试版曝光:新增图像标记工具与对话式局部编辑功能

谷歌Gemini安卓测试版升级图像编辑功能，引入标记界面与实时文本描述，提升AI图像局部调优能力，解决指令传递不精准问题，重构交互逻辑。

12.4k 4 hours ago

Lightricks 开源 AI 视频模型 LTX-2 实现长达20秒的高速音视频一体化合成

以色列科技公司Lightricks推出LTX-2视听合成系统，能根据文本描述直接生成20秒高清视频，实现音画同步。该系统突破传统“先画面后配音”流程，采用双流并行计算架构，通过190亿参数提升计算效能，更真实还原自然音画环境。

15.7k yesterday

Lightricks 开源 AI 视频模型 LTX-2 实现长达20秒的高速音视频一体化合成

腾讯炸场！10亿参数文生3D动作神器开源，游戏NPC一键“活”了！

腾讯混元团队开源HY-Motion1.0模型，基于DiT架构与流匹配技术，通过文本描述即可生成高质量3D骨骼动画，兼容主流3D工具，大幅降低动画制作门槛。该模型采用全阶段训练策略，利用超3000小时动作数据优化生成效果。

27.9k yesterday

AI Products

Describe Image

AI驱动，将图像和视频转化为描述、OCR、Alt文本等多种形式

AI设计工具

4.6k

AutoGenogram

最简单的AI家谱图生成器，可文本描述或上传图像，秒建、分析并导出PDF。

AI设计工具

6.7k

3D-Agent

一款集成在Blender中的AI插件，可通过文本描述直接生成高质量、拓扑结构清晰的3D模型。

3D建模

8.1k

HY Motion

基于腾讯开源模型，可将文本描述即时转化为高保真3D角色动画。

3D建模

8.8k

Models

GPT-4.1 mini

Openai

$2.8

Input tokens/M

$11.2

Output tokens/M

Context Length

Gemini 2.0 Flash-Lite

Google

$0.49

Input tokens/M

$2.1

Output tokens/M

Context Length

Grok 4 Fast

Xai

$1.4

Input tokens/M

$3.5

Output tokens/M

Context Length

o3-mini

Openai

$7.7

Input tokens/M

$30.8

Output tokens/M

200

Context Length

GPT-5 Codex

Openai

Input tokens/M

Output tokens/M

Context Length

Claude 3 Opus

Anthropic

$105

Input tokens/M

$525

Output tokens/M

200

Context Length

Gemini 2.0 Flash

Google

$0.7

Input tokens/M

$2.8

Output tokens/M

Context Length

Claude Haiku 4.5

Anthropic

Input tokens/M

$35

Output tokens/M

200

Context Length

Gemini 2.5 Flash

Google

$2.1

Input tokens/M

$17.5

Output tokens/M

Context Length

Claude Sonnet 4.5

Anthropic

$21

Input tokens/M

$105

Output tokens/M

200

Context Length

Claude 3 Sonnet

Anthropic

$21

Input tokens/M

$105

Output tokens/M

200

Context Length

Gemini 2.5 Flash-Lite

Google

$0.7

Input tokens/M

$2.8

Output tokens/M

Context Length

qwen-image-plus

Alibaba

Input tokens/M

Output tokens/M

Context Length

qwen3-coder-plus

Alibaba

Input tokens/M

$16

Output tokens/M

Context Length

Qianfan-Lightning

Baidu

Input tokens/M

Output tokens/M

128

Context Length

qwen3-max

Alibaba

Input tokens/M

$24

Output tokens/M

256

Context Length

Doubao-Seed-Translation

Bytedance

$1.2

Input tokens/M

$3.6

Output tokens/M

Context Length

Qwen3-Next-80B-A3B-Instruct

Alibaba

Input tokens/M

Output tokens/M

256

Context Length

wan2.5-i2v-preview

Alibaba

Input tokens/M

Output tokens/M

Context Length

qwen3-omni-flash-realtime

Alibaba

$3.9

Input tokens/M

$15.2

Output tokens/M

Context Length

MCP

Paperbanana

PaperBanana是一个自动化生成学术图表和统计图的智能框架，支持从文本描述生成高质量的论文插图，采用多智能体管道和迭代优化，提供CLI、Python API和MCP服务器等多种使用方式。

python

11.7k

5.0points

Image Gen Server

基于即梦AI的图像生成服务，专为Cursor IDE设计，实现文本描述到图像的生成与保存。

python

24.5k

4.0points

Tldraw Agent

tldraw-agent是一个基于AI的文本转图表生成工具，支持通过命令行、库、MCP服务等多种方式使用，可将文本描述（如架构图、流程图）自动生成为PNG或SVG格式的图表。

typescript

10k

2.5points

Mcp Image Recognition

一个提供图像识别功能的MCP服务器，支持Anthropic和OpenAI的视觉API，具备图像描述、多格式支持、可配置主备服务商及OCR文本提取功能。

python

18.4k

2.5points

Primitive Go Mcp Server

一个基于Go语言的MCP服务器，通过OpenAI的DALL-E API实现文本描述生成图像功能，可与Claude等大型语言模型集成使用。

10.1k

2.5points

Nano Banana Pro Mcp

一个基于Google Gemini图像生成模型的MCP服务器，允许AI代理通过文本提示生成、编辑和描述图像，支持多种模型和配置选项。

typescript

14.9k

2.5points

Gemini Nanobanana Mcp

Gemini Nanobanana MCP 是一个让用户通过文本描述生成AI图像的Claude插件，集成了Google Gemini 2.5 Flash图像生成功能，支持多种图像编辑和创作方式。

javascript

8.7k

2.5points

Mcp Server

一个基于Inspire后端图像搜索能力的MCP服务器，提供通过文本描述搜索相似图片的功能。

typescript

9.1k

2.5points

OpenAI Image Generation

该项目实现了一个MCP服务器，通过OpenAI的gpt-image-1模型提供图像生成和编辑功能，支持文本描述生成图像、基于参考图像编辑或修复图像，并可将结果保存到本地。

python

10.7k

2.5points

Mcp Diagram

MCP-Diagram是一个通过文本描述快速生成多种类型图表（如架构图、UML类图等）的服务器工具，支持与Claude等AI助手集成。

java

13.6k

2.5points

Flux Image Mcp Server

Flux Image MCP Server是一个基于Flux Schnell模型的图像生成服务，通过Replicate平台提供API接口，支持通过文本描述生成图像。

typescript

9.2k

2.5points

Manim Mcp

manim-mcp 是一个基于 manimgl 库的文本转视频动画生成工具，通过多智能体 LLM 流水线将自然语言描述转换为高质量数学动画，可作为 CLI 工具、AI 代理或 MCP 服务器与 Claude 等助手集成。

python

10.1k

2.5points

Zxkane_mcp Server Amazon Bedrock

一个基于Amazon Bedrock Nova Canvas模型的MCP服务器，提供高质量的AI图像生成服务，支持文本描述生成图像、负面提示优化、尺寸配置和种子控制等功能。

typescript

9.3k

2.0points

Mcp Grep

一个基于grep命令的MCP服务器，提供强大的文本搜索功能，支持自然语言描述和正则表达式搜索。

typescript

8.9k

2.0points

Freepik Flux Ai Mcp Sunucusu

一个基于Freepik Flux AI的MCP服务器，用于通过文本描述生成图像，支持多种宽高比，并与Claude Desktop集成。

javascript

9.7k

2.0points

Mcp Nanobanana

Nano Banana是一个专业的MCP扩展，用于通过文本描述生成、编辑和修复图像，支持多种图像处理功能，如生成图标、图案、故事和图表等。

typescript

11.8k

2.0points

Replicate Image Generate

一个基于HTTP的图片生成服务器，通过调用Replicate的Flux Schnell模型来根据文本描述生成图像。

typescript

10.1k

2.0points

Prasanthmj_primitive Go Mcp Server

一个基于Go语言的MCP服务器，通过OpenAI的DALL-E API实现文本描述生成图像功能，支持与Claude等大型语言模型集成。

8.9k

2.0points

Doubao Image Video Mcp

一个基于Model Context Protocol的豆包图片和视频生成服务器，支持通过文本描述生成高质量图片和视频，并查询视频生成任务状态。

typescript

12.7k

2.0points

Streamdeck Mcp

Stream Deck MCP是一个让AI通过自然语言描述来设计和配置Elgato Stream Deck布局的工具。用户只需用英语描述需求，AI即可自动创建页面、设置按钮（包括文本、图标、颜色和操作），支持多页面工作流、家庭自动化、游戏配置等场景。使用前需关闭Elgato官方软件以获取USB独占访问权限。

python

10.9k

2.0points

Empowering the future, your artificial intelligence solution think tank

English 简体中文繁體中文にほんご

FirendLinks:

AI Newsletters AI Tools MCP Servers AI News AI Marketing LLM Leaderboard AI Ranking

Business Cooperation Site Map

AI News

xAI发布Grok Imagine Video1.5:一张图片秒变视频，直面Google Veo竞争

谷歌 Gemini 测试版曝光:新增图像标记工具与对话式局部编辑功能

Lightricks 开源 AI 视频模型 LTX-2 实现长达20秒的高速音视频一体化合成

腾讯炸场！10亿参数文生3D动作神器开源，游戏NPC一键“活”了！

AI Products

Describe Image

AutoGenogram

3D-Agent

HY Motion

Models

GPT-4.1 mini

Gemini 2.0 Flash-Lite

Grok 4 Fast

o3-mini

GPT-5 Codex

Claude 3 Opus

Gemini 2.0 Flash

Claude Haiku 4.5

Gemini 2.5 Flash

Claude Sonnet 4.5

Claude 3 Sonnet

Gemini 2.5 Flash-Lite

qwen-image-plus

qwen3-coder-plus

Qianfan-Lightning

qwen3-max

Doubao-Seed-Translation

Qwen3-Next-80B-A3B-Instruct

wan2.5-i2v-preview

qwen3-omni-flash-realtime

Flux2 Dev Gguf

Flux2_berthe_morisot

Anime2Realism

HoloCine GGUF

TRELLIS Text Xlarge Clone

FIBO

Rexcrowle Qwen Image Lora

Simpletuner Example Pixart Lycoris Lokr

RequirementClassifier

SD15 ControlNet

Rtmi Qwen Image Lora

Reed Nsfw Illustrious Sdxl V30 Il Sdxl

HunyuanImage 2.1 Diffusers

FLUX.1 Wireframe Dev Lora

Poshanimals

Lejos Borges Simpletuner Lora

FLUX.1 Layout ControlNet

NetaYume Lumina Image 2.0 GGUF

Gr4f1tt0_v1_qwen

Chroma 8 Steps GGUF

MCP

Paperbanana

Image Gen Server

Tldraw Agent

Mcp Image Recognition

Primitive Go Mcp Server

Nano Banana Pro Mcp

Gemini Nanobanana Mcp

Mcp Server

OpenAI Image Generation

Mcp Diagram

Flux Image Mcp Server

Manim Mcp

Zxkane_mcp Server Amazon Bedrock

Mcp Grep

Freepik Flux Ai Mcp Sunucusu

Mcp Nanobanana

Replicate Image Generate

Prasanthmj_primitive Go Mcp Server

Doubao Image Video Mcp

Streamdeck Mcp