最好的文本描述 AI工具模型_精选文本描述资讯 - AIBase

AI资讯

腾讯炸场！10亿参数文生3D动作神器开源，游戏NPC一键“活”了！

腾讯混元团队开源HY-Motion1.0模型，基于DiT架构与流匹配技术，通过文本描述即可生成高质量3D骨骼动画，兼容主流3D工具，大幅降低动画制作门槛。该模型采用全阶段训练策略，利用超3000小时动作数据优化生成效果。

19.9k 3 小时前

腾讯炸场！10亿参数文生3D动作神器开源，游戏NPC一键“活”了！

阿里巴巴推出新款 Qwen 模型，三秒音频即可克隆声音

阿里巴巴云发布两款AI语音模型，Qwen3-TTS-VD-Flash支持用户通过文本指令定制声音，可精确描述声音的情感、节奏等特征，实现个性化语音生成。

14.5k 4 小时前

阿里巴巴推出新款 Qwen 模型，三秒音频即可克隆声音

英伟达发布开放式推理 AI 助力自动驾驶技术迈向新台阶

英伟达在NeurIPS大会上发布自动驾驶AI模型Alpamayo-R1（AR1），这是全球首个行业级开放推理视觉语言行动模型。它能同时处理文本和图像，将传感器信息转化为自然语言描述，结合推理链AI和路径规划技术，以应对复杂驾驶场景，加速无人驾驶汽车发展。

英伟达发布开放式推理 AI 助力自动驾驶技术迈向新台阶

全新开源语音模型 Maya1：实现实时、富有表现力的文本转语音

Maya Research推出Maya1文本转语音模型，30亿参数，可在单GPU实时运行。模型通过自然语言描述和文本输入，生成可控且富有表现力的语音，精准模拟人类情感与声音细节，如指定年龄、口音或角色特征。

全新开源语音模型 Maya1：实现实时、富有表现力的文本转语音

AI产品

Seedream 5.0

Seedream 5.0

Seedream 5.0可将文本描述瞬间转化为精美图像，免费且无限创作

nanobananas

nanobananas

NanoBananas是一款AI图像生成平台，通过简单的文本描述即可生成惊人的图像、表情和角色设计。

AINanoBanana

AINanoBanana

AI Nano Banana是一款基于AI的图像生成和编辑平台，通过简单的文本描述创建令人惊叹的视觉效果。

RapidChart.ai

RapidChart.ai

使用AI快速生成UML图表，从简单的文本描述中生成类图、ER图等。快速、直观、强大。

模型

GPT-4.1 mini

Openai

GPT-4.1 mini

$2.8

输入tokens/百万

$11.2

输出tokens/百万

1k

上下文长度

Gemini 2.0 Flash-Lite

Google

Gemini 2.0 Flash-Lite

$0.49

输入tokens/百万

$2.1

输出tokens/百万

1k

上下文长度

Grok 4 Fast

Xai

Grok 4 Fast

$1.4

输入tokens/百万

$3.5

输出tokens/百万

2k

上下文长度

o3-mini

Openai

o3-mini

$7.7

输入tokens/百万

$30.8

输出tokens/百万

200

上下文长度

GPT-5 Codex

Openai

GPT-5 Codex

-

输入tokens/百万

-

输出tokens/百万

-

上下文长度

Claude 3 Opus

Anthropic

Claude 3 Opus

$105

输入tokens/百万

$525

输出tokens/百万

200

上下文长度

Gemini 2.0 Flash

Google

Gemini 2.0 Flash

$0.7

输入tokens/百万

$2.8

输出tokens/百万

1k

上下文长度

Claude Haiku 4.5

Anthropic

Claude Haiku 4.5

$7

输入tokens/百万

$35

输出tokens/百万

200

上下文长度

Gemini 2.5 Flash

Google

Gemini 2.5 Flash

$2.1

输入tokens/百万

$17.5

输出tokens/百万

1k

上下文长度

Claude Sonnet 4.5

Anthropic

Claude Sonnet 4.5

$21

输入tokens/百万

$105

输出tokens/百万

200

上下文长度

Claude 3 Sonnet

Anthropic

Claude 3 Sonnet

$21

输入tokens/百万

$105

输出tokens/百万

200

上下文长度

Gemini 2.5 Flash-Lite

Google

Gemini 2.5 Flash-Lite

$0.7

输入tokens/百万

$2.8

输出tokens/百万

1k

上下文长度

qwen-image-plus

Alibaba

qwen-image-plus

-

输入tokens/百万

-

输出tokens/百万

-

上下文长度

qwen3-coder-plus

Alibaba

qwen3-coder-plus

$4

输入tokens/百万

$16

输出tokens/百万

1k

上下文长度

Qianfan-Lightning

Baidu

Qianfan-Lightning

-

输入tokens/百万

-

输出tokens/百万

128

上下文长度

qwen3-max

Alibaba

qwen3-max

$6

输入tokens/百万

$24

输出tokens/百万

256

上下文长度

Doubao-Seed-Translation

Bytedance

Doubao-Seed-Translation

$1.2

输入tokens/百万

$3.6

输出tokens/百万

4

上下文长度

Qwen3-Next-80B-A3B-Instruct

Alibaba

Qwen3-Next-80B-A3B-Instruct

$2

输入tokens/百万

-

输出tokens/百万

256

上下文长度

wan2.5-i2v-preview

Alibaba

wan2.5-i2v-preview

-

输入tokens/百万

-

输出tokens/百万

-

上下文长度

qwen3-omni-flash-realtime

Alibaba

qwen3-omni-flash-realtime

$3.9

输入tokens/百万

$15.2

输出tokens/百万

64

上下文长度

MCP

image-gen-server

Image Gen Server

基于即梦AI的图像生成服务，专为Cursor IDE设计，实现文本描述到图像的生成与保存。

mcp-image-recognition

Mcp Image Recognition

一个提供图像识别功能的MCP服务器，支持Anthropic和OpenAI的视觉API，具备图像描述、多格式支持、可配置主备服务商及OCR文本提取功能。

primitive-go-mcp-server

Primitive Go Mcp Server

一个基于Go语言的MCP服务器，通过OpenAI的DALL-E API实现文本描述生成图像功能，可与Claude等大型语言模型集成使用。

nano-banana-pro-mcp

Nano Banana Pro Mcp

一个基于Google Gemini图像生成模型的MCP服务器，允许AI代理通过文本提示生成、编辑和描述图像，支持多种模型和配置选项。

gemini-nanobanana-mcp

Gemini Nanobanana Mcp

Gemini Nanobanana MCP 是一个让用户通过文本描述生成AI图像的Claude插件，集成了Google Gemini 2.5 Flash图像生成功能，支持多种图像编辑和创作方式。

mcp-server

Mcp Server

一个基于Inspire后端图像搜索能力的MCP服务器，提供通过文本描述搜索相似图片的功能。

mcp-diagram

Mcp Diagram

MCP-Diagram是一个通过文本描述快速生成多种类型图表（如架构图、UML类图等）的服务器工具，支持与Claude等AI助手集成。

flux-image-mcp-server

Flux Image Mcp Server

Flux Image MCP Server是一个基于Flux Schnell模型的图像生成服务，通过Replicate平台提供API接口，支持通过文本描述生成图像。

OpenAI Image Generation

OpenAI Image Generation

该项目实现了一个MCP服务器，通过OpenAI的gpt-image-1模型提供图像生成和编辑功能，支持文本描述生成图像、基于参考图像编辑或修复图像，并可将结果保存到本地。

zxkane_mcp-server-amazon-bedrock

Zxkane_mcp Server Amazon Bedrock

一个基于Amazon Bedrock Nova Canvas模型的MCP服务器，提供高质量的AI图像生成服务，支持文本描述生成图像、负面提示优化、尺寸配置和种子控制等功能。

mcp-grep

Mcp Grep

一个基于grep命令的MCP服务器，提供强大的文本搜索功能，支持自然语言描述和正则表达式搜索。

freepik-flux-ai-mcp-sunucusu

Freepik Flux Ai Mcp Sunucusu

一个基于Freepik Flux AI的MCP服务器，用于通过文本描述生成图像，支持多种宽高比，并与Claude Desktop集成。

replicate-image-generate

Replicate Image Generate

一个基于HTTP的图片生成服务器，通过调用Replicate的Flux Schnell模型来根据文本描述生成图像。

mcp-nanobanana

Mcp Nanobanana

Nano Banana是一个专业的MCP扩展，用于通过文本描述生成、编辑和修复图像，支持多种图像处理功能，如生成图标、图案、故事和图表等。

prasanthmj_primitive-go-mcp-server

Prasanthmj_primitive Go Mcp Server

一个基于Go语言的MCP服务器，通过OpenAI的DALL-E API实现文本描述生成图像功能，支持与Claude等大型语言模型集成。

AIBase

智启未来，您的人工智能解决方案智库

English 简体中文繁體中文にほんご

友情链接:

AI Newsletters AI Tools MCP Servers AI News AIBase LLM Leaderboard AI Ranking

© 2026AIBase

商务合作网站地图