最好的音效生成模型 AI工具模型_精选音效生成模型资讯

AI资讯

阿里万相2.6发布:支持“角色扮演”与多分镜控制，单次视频时长达15秒

阿里巴巴12月16日发布新一代万相2.6系列模型，针对影视制作和图像创作全面升级，号称“全球功能最全的视频生成模型”。该模型已上线阿里云百炼和官网，核心亮点包括国内首个“角色扮演”功能，并支持音画同步、多镜头生成及声音驱动等，在画质、音效等方面实现技术突破。

10.7k 8 分钟前

快手可灵 2.6 全量上线！“音画同出” ，画面、自然语音、匹配音效、环境氛围

快手旗下可灵AI推出首个“音画同出”模型可灵2.6，能同时生成画面、语音、音效和环境氛围，打通音画世界。该模型提供“文生音画”和“图生音画”两种创作路径，用户可通过一句话或图片快速生成完整视频，提升创作体验。

10.2k 昨天

爱诗科技发布PixVerse V5.5：国内首个“导演级”多镜头叙事视频大模型落地

爱诗科技推出PixVerse V5.5（国内版“拍我AI V5.5”），实现全量升级并开放体验。该模型是国内首个支持“多镜头+音画同步一键直出”的AI视频大模型，推动AI生成视频从“单镜头素材”进入“完整叙事短片”阶段。基于自研MVL架构，V5.5能在5-10秒内自动完成脚本拆解、分镜调度及音效生成，显著提升视频制作的完整性与效率。

11.5k 1 天前

爱诗科技发布PixVerse V5.5：国内首个“导演级”多镜头叙事视频大模型落地

AI日报：智谱清影2.0发布；深圳上线全国首个AI智能劳动仲裁系统；1688推跨境AI智能体“遨虾”

智谱AI发布清影2.0，支持文本生成1080P高清视频，并集成CogSound模型自动添加音效，实现视听一体创作。该产品被视为国产版“Sora”，为开发者提供创新AI应用工具。

21.6k 9 小时前

AI日报：智谱清影2.0发布；深圳上线全国首个AI智能劳动仲裁系统；1688推跨境AI智能体“遨虾”

AI产品

Sora 2

最新视频生成模型，更真实、可控，支持同步对话与音效。

视频生成

13.2k

模型

GPT-4.1 mini

Openai

$2.8

输入tokens/百万

$11.2

输出tokens/百万

上下文长度

Gemini 2.0 Flash-Lite

Google

$0.49

输入tokens/百万

$2.1

输出tokens/百万

上下文长度

Grok 4 Fast

Xai

$1.4

输入tokens/百万

$3.5

输出tokens/百万

上下文长度

o3-mini

Openai

$7.7

输入tokens/百万

$30.8

输出tokens/百万

200

上下文长度

GPT-5 Codex

Openai

输入tokens/百万

输出tokens/百万

上下文长度

Claude 3 Opus

Anthropic

$105

输入tokens/百万

$525

输出tokens/百万

200

上下文长度

Gemini 2.0 Flash

Google

$0.7

输入tokens/百万

$2.8

输出tokens/百万

上下文长度

Claude Haiku 4.5

Anthropic

输入tokens/百万

$35

输出tokens/百万

200

上下文长度

Gemini 2.5 Flash

Google

$2.1

输入tokens/百万

$17.5

输出tokens/百万

上下文长度

Claude Sonnet 4.5

Anthropic

$21

输入tokens/百万

$105

输出tokens/百万

200

上下文长度

Claude 3 Sonnet

Anthropic

$21

输入tokens/百万

$105

输出tokens/百万

200

上下文长度

Gemini 2.5 Flash-Lite

Google

$0.7

输入tokens/百万

$2.8

输出tokens/百万

上下文长度

qwen-image-plus

Alibaba

输入tokens/百万

输出tokens/百万

上下文长度

qwen3-coder-plus

Alibaba

输入tokens/百万

$16

输出tokens/百万

上下文长度

qwen3-vl-plus

Alibaba

输入tokens/百万

$10

输出tokens/百万

256

上下文长度

wan2.5-i2i-preview

Alibaba

输入tokens/百万

输出tokens/百万

上下文长度

qwen3-max

Alibaba

输入tokens/百万

$24

输出tokens/百万

256

上下文长度

Qianfan-Lightning

Baidu

输入tokens/百万

输出tokens/百万

128

上下文长度

qwen3-vl-235b-a22b-thinking

Alibaba

输入tokens/百万

$20

输出tokens/百万

上下文长度

qwen-image-edit

Alibaba

输入tokens/百万

输出tokens/百万

上下文长度

MCP

MaxMSP MCP Server

该项目通过Model Context Protocol（MCP）让大型语言模型直接理解和生成Max音频处理软件中的音效模块，支持解释、修改和创建音效模块，并提供与LLM的交互界面。

智启未来，您的人工智能解决方案智库

友情链接:

AI Newsletters AI Tools MCP Servers AI News AIBase LLM Leaderboard AI Ranking

商务合作网站地图

AI资讯

阿里万相2.6发布:支持“角色扮演”与多分镜控制，单次视频时长达15秒

快手可灵 2.6 全量上线！“音画同出” ，画面、自然语音、匹配音效、环境氛围

爱诗科技发布PixVerse V5.5：国内首个“导演级”多镜头叙事视频大模型落地

AI日报：智谱清影2.0发布；深圳上线全国首个AI智能劳动仲裁系统；1688推跨境AI智能体“遨虾”

AI产品

Sora 2

模型

GPT-4.1 mini

Gemini 2.0 Flash-Lite

Grok 4 Fast

o3-mini

GPT-5 Codex

Claude 3 Opus

Gemini 2.0 Flash

Claude Haiku 4.5

Gemini 2.5 Flash

Claude Sonnet 4.5

Claude 3 Sonnet

Gemini 2.5 Flash-Lite

qwen-image-plus

qwen3-coder-plus

qwen3-vl-plus

wan2.5-i2i-preview

qwen3-max

Qianfan-Lightning

qwen3-vl-235b-a22b-thinking

qwen-image-edit

Handler

Audio Magnet Medium

Bark Small

Tango Full

Bark

Tango

MCP

MaxMSP MCP Server

AI资讯

阿里万相2.6发布:支持“角色扮演”与多分镜控制，单次视频时长达15秒

快手可灵 2.6 全量上线！“音画同出” ，画面、自然语音、匹配音效 、环境氛围

爱诗科技发布PixVerse V5.5：国内首个“导演级”多镜头叙事视频大模型落地

AI日报：智谱清影2.0发布；深圳上线全国首个AI智能劳动仲裁系统；1688推跨境AI智能体“遨虾”

AI产品

Sora 2

模型

GPT-4.1 mini

Gemini 2.0 Flash-Lite

Grok 4 Fast

o3-mini

GPT-5 Codex

Claude 3 Opus

Gemini 2.0 Flash

Claude Haiku 4.5

Gemini 2.5 Flash

Claude Sonnet 4.5

Claude 3 Sonnet

Gemini 2.5 Flash-Lite

qwen-image-plus

qwen3-coder-plus

qwen3-vl-plus

wan2.5-i2i-preview

qwen3-max

Qianfan-Lightning

qwen3-vl-235b-a22b-thinking

qwen-image-edit

Handler

Audio Magnet Medium

Bark Small

Tango Full

Bark

Tango

MCP

MaxMSP MCP Server

快手可灵 2.6 全量上线！“音画同出” ，画面、自然语音、匹配音效、环境氛围