Best 文本描述生成 AI Tools & Models - Premium 文本描述生成 News

AI News

Lightricks 开源 AI 视频模型 LTX-2 实现长达20秒的高速音视频一体化合成

以色列科技公司Lightricks推出LTX-2视听合成系统，能根据文本描述直接生成20秒高清视频，实现音画同步。该系统突破传统“先画面后配音”流程，采用双流并行计算架构，通过190亿参数提升计算效能，更真实还原自然音画环境。

Lightricks 开源 AI 视频模型 LTX-2 实现长达20秒的高速音视频一体化合成

腾讯炸场！10亿参数文生3D动作神器开源，游戏NPC一键“活”了！

腾讯混元团队开源HY-Motion1.0模型，基于DiT架构与流匹配技术，通过文本描述即可生成高质量3D骨骼动画，兼容主流3D工具，大幅降低动画制作门槛。该模型采用全阶段训练策略，利用超3000小时动作数据优化生成效果。

21.1k 15 hours ago

腾讯炸场！10亿参数文生3D动作神器开源，游戏NPC一键“活”了！

阿里巴巴推出新款 Qwen 模型，三秒音频即可克隆声音

阿里巴巴云发布两款AI语音模型，Qwen3-TTS-VD-Flash支持用户通过文本指令定制声音，可精确描述声音的情感、节奏等特征，实现个性化语音生成。

17k 9 hours ago

阿里巴巴推出新款 Qwen 模型，三秒音频即可克隆声音

全新开源语音模型 Maya1：实现实时、富有表现力的文本转语音

Maya Research推出Maya1文本转语音模型，30亿参数，可在单GPU实时运行。模型通过自然语言描述和文本输入，生成可控且富有表现力的语音，精准模拟人类情感与声音细节，如指定年龄、口音或角色特征。

12.2k 5 days ago

全新开源语音模型 Maya1：实现实时、富有表现力的文本转语音

AI Products

nanobananas

nanobananas

NanoBananas是一款AI图像生成平台，通过简单的文本描述即可生成惊人的图像、表情和角色设计。

AINanoBanana

AINanoBanana

AI Nano Banana是一款基于AI的图像生成和编辑平台，通过简单的文本描述创建令人惊叹的视觉效果。

RapidChart.ai

RapidChart.ai

使用AI快速生成UML图表，从简单的文本描述中生成类图、ER图等。快速、直观、强大。

AI Doll

AI Doll

AI Doll通过AI生成、3D建模和专业打印将您的文本描述转化为定制动作人偶。

Models

GPT-4.1 mini

Openai

GPT-4.1 mini

$2.8

Input tokens/M

$11.2

Output tokens/M

1k

Context Length

Gemini 2.0 Flash-Lite

Google

Gemini 2.0 Flash-Lite

$0.49

Input tokens/M

$2.1

Output tokens/M

1k

Context Length

Grok 4 Fast

Xai

Grok 4 Fast

$1.4

Input tokens/M

$3.5

Output tokens/M

2k

Context Length

o3-mini

Openai

o3-mini

$7.7

Input tokens/M

$30.8

Output tokens/M

200

Context Length

GPT-5 Codex

Openai

GPT-5 Codex

-

Input tokens/M

-

Output tokens/M

-

Context Length

Claude 3 Opus

Anthropic

Claude 3 Opus

$105

Input tokens/M

$525

Output tokens/M

200

Context Length

Gemini 2.0 Flash

Google

Gemini 2.0 Flash

$0.7

Input tokens/M

$2.8

Output tokens/M

1k

Context Length

Claude Haiku 4.5

Anthropic

Claude Haiku 4.5

$7

Input tokens/M

$35

Output tokens/M

200

Context Length

Gemini 2.5 Flash

Google

Gemini 2.5 Flash

$2.1

Input tokens/M

$17.5

Output tokens/M

1k

Context Length

Claude Sonnet 4.5

Anthropic

Claude Sonnet 4.5

$21

Input tokens/M

$105

Output tokens/M

200

Context Length

Claude 3 Sonnet

Anthropic

Claude 3 Sonnet

$21

Input tokens/M

$105

Output tokens/M

200

Context Length

Gemini 2.5 Flash-Lite

Google

Gemini 2.5 Flash-Lite

$0.7

Input tokens/M

$2.8

Output tokens/M

1k

Context Length

qwen-image-plus

Alibaba

qwen-image-plus

-

Input tokens/M

-

Output tokens/M

-

Context Length

qwen3-coder-plus

Alibaba

qwen3-coder-plus

$4

Input tokens/M

$16

Output tokens/M

1k

Context Length

qwen3-max

Alibaba

qwen3-max

$6

Input tokens/M

$24

Output tokens/M

256

Context Length

wan2.5-i2i-preview

Alibaba

wan2.5-i2i-preview

-

Input tokens/M

-

Output tokens/M

-

Context Length

Qianfan-Lightning

Baidu

Qianfan-Lightning

-

Input tokens/M

-

Output tokens/M

128

Context Length

qwen-image-edit

Alibaba

qwen-image-edit

-

Input tokens/M

-

Output tokens/M

-

Context Length

Doubao-Seed-Translation

Bytedance

Doubao-Seed-Translation

$1.2

Input tokens/M

$3.6

Output tokens/M

4

Context Length

Qwen3-Next-80B-A3B-Instruct

Alibaba

Qwen3-Next-80B-A3B-Instruct

$2

Input tokens/M

-

Output tokens/M

256

Context Length

MCP

image-gen-server

Image Gen Server

基于即梦AI的图像生成服务，专为Cursor IDE设计，实现文本描述到图像的生成与保存。

primitive-go-mcp-server

Primitive Go Mcp Server

一个基于Go语言的MCP服务器，通过OpenAI的DALL-E API实现文本描述生成图像功能，可与Claude等大型语言模型集成使用。

nano-banana-pro-mcp

Nano Banana Pro Mcp

一个基于Google Gemini图像生成模型的MCP服务器，允许AI代理通过文本提示生成、编辑和描述图像，支持多种模型和配置选项。

gemini-nanobanana-mcp

Gemini Nanobanana Mcp

Gemini Nanobanana MCP 是一个让用户通过文本描述生成AI图像的Claude插件，集成了Google Gemini 2.5 Flash图像生成功能，支持多种图像编辑和创作方式。

flux-image-mcp-server

Flux Image Mcp Server

Flux Image MCP Server是一个基于Flux Schnell模型的图像生成服务，通过Replicate平台提供API接口，支持通过文本描述生成图像。

OpenAI Image Generation

OpenAI Image Generation

该项目实现了一个MCP服务器，通过OpenAI的gpt-image-1模型提供图像生成和编辑功能，支持文本描述生成图像、基于参考图像编辑或修复图像，并可将结果保存到本地。

mcp-diagram

Mcp Diagram

MCP-Diagram是一个通过文本描述快速生成多种类型图表（如架构图、UML类图等）的服务器工具，支持与Claude等AI助手集成。

zxkane_mcp-server-amazon-bedrock

Zxkane_mcp Server Amazon Bedrock

一个基于Amazon Bedrock Nova Canvas模型的MCP服务器，提供高质量的AI图像生成服务，支持文本描述生成图像、负面提示优化、尺寸配置和种子控制等功能。

freepik-flux-ai-mcp-sunucusu

Freepik Flux Ai Mcp Sunucusu

一个基于Freepik Flux AI的MCP服务器，用于通过文本描述生成图像，支持多种宽高比，并与Claude Desktop集成。

replicate-image-generate

Replicate Image Generate

一个基于HTTP的图片生成服务器，通过调用Replicate的Flux Schnell模型来根据文本描述生成图像。

mcp-nanobanana

Mcp Nanobanana

Nano Banana是一个专业的MCP扩展，用于通过文本描述生成、编辑和修复图像，支持多种图像处理功能，如生成图标、图案、故事和图表等。

prasanthmj_primitive-go-mcp-server

Prasanthmj_primitive Go Mcp Server

一个基于Go语言的MCP服务器，通过OpenAI的DALL-E API实现文本描述生成图像功能，支持与Claude等大型语言模型集成。

doubao-image-video-mcp

Doubao Image Video Mcp

一个基于Model Context Protocol的豆包图片和视频生成服务器，支持通过文本描述生成高质量图片和视频，并查询视频生成任务状态。

AIBase

Empowering the future, your artificial intelligence solution think tank

English 简体中文繁體中文にほんご

FirendLinks:

AI Newsletters AI Tools MCP Servers AI News AIBase LLM Leaderboard AI Ranking

© 2026AIBase

Business Cooperation Site Map