Best 视频生成音频 AI Tools & Models - Premium 视频生成音频 News

AI News

Seedance 2.0 全球上线，登顶 Artificial Analysis 视频排行榜

字节跳动推出AI视频生成模型Seedance2.0，支持文本、图像、音频及视频多输入，可生成1080p高保真视频，实现音视频同步，提升运动稳定性和物理真实感。在独立盲测中，其文本到视频生成表现优异。

21.5k 14 minutes ago

Seedance 2.0 全球上线，登顶 Artificial Analysis 视频排行榜

谷歌发布首个原生多模态嵌入模型 Gemini Embedding 2：让机器真正“读懂”世界

谷歌推出原生多模态嵌入模型Gemini Embedding2，支持文本、图像、视频、音频和文档，统一映射到向量空间，实现跨媒体深度理解。与生成式模型不同，它专注于“理解”，将数据转化为向量，帮助系统识别语义关系。

14.4k 23 hours ago

谷歌发布首个原生多模态嵌入模型 Gemini Embedding 2：让机器真正“读懂”世界

AI 界的“春节档”爆了！字节、智谱、MiniMAX 扎堆上新，多款大模型上演“神仙打架”

2026年春节期间，国产AI大模型赛道迎来密集发布潮，字节跳动、智谱、MiniMAX等头部企业相继推出新品，带动资本市场对AI应用板块热情高涨。其中，字节跳动发布的Seedance 2.0视频生成模型尤为瞩目，支持文本和图像输入，可生成长达60秒的多镜头视频，并实现了画质跨越，具备原生音频同步与出色的运镜规划能力。

10.9k yesterday

字节快手巅峰对决:Seedance2.0携“导演级”控制入局，相关股价应声大涨20%

字节跳动内测多模态视频生成模型Seedance2.0，整合图像、视频、音频和文本处理能力，提供“导演级”控制精度，显著提升内容创作效率与质量。

14.7k 2 days ago

字节快手巅峰对决:Seedance2.0携“导演级”控制入局，相关股价应声大涨20%

AI Products

ModelHunter.AI

一站式AI API商店，一个接口覆盖视频、图像和音频无限生成能力

API服务

4.6k

Ima Claw

Ima Studio的多模态AI平台，用文本提示生成图、视频和音频

AI设计工具

4.9k

LTX 2.3 AI Video Generator

LTX 2.3在线生成视频，支持4K、同步音频和9:16竖屏模式

视频生成

4.9k

Sora 2 video

OpenAI的下一代视频音频生成模型，可从文本或图像生成高品质视频。

视频生成

3.7k

Models

GPT-4.1 mini

Openai

$2.8

Input tokens/M

$11.2

Output tokens/M

Context Length

Gemini 2.0 Flash-Lite

Google

$0.49

Input tokens/M

$2.1

Output tokens/M

Context Length

Grok 4 Fast

Xai

$1.4

Input tokens/M

$3.5

Output tokens/M

Context Length

o3-mini

Openai

$7.7

Input tokens/M

$30.8

Output tokens/M

200

Context Length

GPT-5 Codex

Openai

Input tokens/M

Output tokens/M

Context Length

Claude 3 Opus

Anthropic

$105

Input tokens/M

$525

Output tokens/M

200

Context Length

Gemini 2.0 Flash

Google

$0.7

Input tokens/M

$2.8

Output tokens/M

Context Length

Claude Haiku 4.5

Anthropic

Input tokens/M

$35

Output tokens/M

200

Context Length

Gemini 2.5 Flash

Google

$2.1

Input tokens/M

$17.5

Output tokens/M

Context Length

Claude Sonnet 4.5

Anthropic

$21

Input tokens/M

$105

Output tokens/M

200

Context Length

Claude 3 Sonnet

Anthropic

$21

Input tokens/M

$105

Output tokens/M

200

Context Length

Gemini 2.5 Flash-Lite

Google

$0.7

Input tokens/M

$2.8

Output tokens/M

Context Length

qwen-image-plus

Alibaba

Input tokens/M

Output tokens/M

Context Length

qwen3-coder-plus

Alibaba

Input tokens/M

$16

Output tokens/M

Context Length

wan2.5-i2i-preview

Alibaba

Input tokens/M

Output tokens/M

Context Length

qwen3-max

Alibaba

Input tokens/M

$24

Output tokens/M

256

Context Length

qwen3-vl-235b-a22b-thinking

Alibaba

Input tokens/M

$20

Output tokens/M

Context Length

Qianfan-Lightning

Baidu

Input tokens/M

Output tokens/M

128

Context Length

qwen-image-edit

Alibaba

Input tokens/M

Output tokens/M

Context Length

qwen3-livetranslate-flaltimeash-re-2025-09-22

Alibaba

Input tokens/M

$240

Output tokens/M

Context Length

MCP

Media Editor

一个基于MCP协议的媒体编辑服务器，提供视频剪辑、音频转录和主题缩略图生成功能，支持与Claude等AI助手集成实现自动化媒体处理。

python

6.2k

2.0points

Bobtista_luma Ai Mcp Server

Luma AI MCP服务器是一个基于Model Context Protocol的服务，集成了Luma AI的Dream Machine API(v1)，提供AI生成视频/图像的工具集，包括文本/图像转视频、视频扩展、音频添加、画质提升等功能，支持通过Claude Desktop直接调用。

python

9.1k

2.0points

Empowering the future, your artificial intelligence solution think tank

English 简体中文繁體中文にほんご

FirendLinks:

AI Newsletters AI Tools MCP Servers AI News AIBase LLM Leaderboard AI Ranking

Business Cooperation Site Map

AI News

Seedance 2.0 全球上线，登顶 Artificial Analysis 视频排行榜

​谷歌发布首个原生多模态嵌入模型 Gemini Embedding 2：让机器真正“读懂”世界

AI 界的“春节档”爆了！字节、智谱、MiniMAX 扎堆上新，多款大模型上演“神仙打架”

字节快手巅峰对决:Seedance2.0携“导演级”控制入局，相关股价应声大涨20%

AI Products

ModelHunter.AI

Ima Claw

LTX 2.3 AI Video Generator

Sora 2 video

Models

GPT-4.1 mini

Gemini 2.0 Flash-Lite

Grok 4 Fast

o3-mini

GPT-5 Codex

Claude 3 Opus

Gemini 2.0 Flash

Claude Haiku 4.5

Gemini 2.5 Flash

Claude Sonnet 4.5

Claude 3 Sonnet

Gemini 2.5 Flash-Lite

qwen-image-plus

qwen3-coder-plus

wan2.5-i2i-preview

qwen3-max

qwen3-vl-235b-a22b-thinking

Qianfan-Lightning

qwen-image-edit

qwen3-livetranslate-flaltimeash-re-2025-09-22

Ovi

Wan2.1 HuMo GGUF

Wan2_1 HuMo_17B GGUF

Wan2.2 S2V 14B

Gemma 3n E2B It Litert Preview GGUF

Qwen2.5 Omni 3B GGUF

OmniAvatar 14B

Qwen2.5 Omni 7B GGUF

Qwen2.5 Omni 3B GGUF

Qwen2.5 Omni 7B GPTQ Int4

Qwen2.5 Omni 7B AWQ

Ming Lite Omni

Qwen2.5 Omni 3B

VideoLLaMA2.1 7B AV CoT

Qwen2.5 Omni 7B

Wan2.1 T2V 14B

Ola 7b

VideoLLaMA2 8x7B

V Express

MCP

Media Editor

Bobtista_luma Ai Mcp Server

谷歌发布首个原生多模态嵌入模型 Gemini Embedding 2：让机器真正“读懂”世界