最好的音效生成模型 AI工具模型_精選音效生成模型資訊

AI資訊

阿里萬相2.6發佈:支持“角色扮演”與多分鏡控制，單次視頻時長達15秒

阿里巴巴12月16日發佈新一代萬相2.6系列模型，針對影視製作和圖像創作全面升級，號稱“全球功能最全的視頻生成模型”。該模型已上線阿里雲百鍊和官網，核心亮點包括國內首個“角色扮演”功能，並支持音畫同步、多鏡頭生成及聲音驅動等，在畫質、音效等方面實現技術突破。

9.8k 47 分鐘前

快手可靈 2.6 全量上線！“音畫同出” ，畫面、自然語音、匹配音效、環境氛圍

快手旗下可靈AI推出首個“音畫同出”模型可靈2.6，能同時生成畫面、語音、音效和環境氛圍，打通音畫世界。該模型提供“文生音畫”和“圖生音畫”兩種創作路徑，用戶可通過一句話或圖片快速生成完整視頻，提升創作體驗。

10.2k 昨天

愛詩科技發佈PixVerse V5.5：國內首個“導演級”多鏡頭敘事視頻大模型落地

愛詩科技推出PixVerse V5.5（國內版“拍我AI V5.5”），實現全量升級並開放體驗。該模型是國內首個支持“多鏡頭+音畫同步一鍵直出”的AI視頻大模型，推動AI生成視頻從“單鏡頭素材”進入“完整敘事短片”階段。基於自研MVL架構，V5.5能在5-10秒內自動完成腳本拆解、分鏡調度及音效生成，顯著提升視頻製作的完整性與效率。

11.5k 前天

愛詩科技發佈PixVerse V5.5：國內首個“導演級”多鏡頭敘事視頻大模型落地

AI日報：智譜清影2.0發佈；深圳上線全國首個AI智能勞動仲裁系統；1688推跨境AI智能體“遨蝦”

智譜AI發佈清影2.0，支持文本生成1080P高清視頻，並集成CogSound模型自動添加音效，實現視聽一體創作。該產品被視爲國產版“Sora”，爲開發者提供創新AI應用工具。

21.6k 18 小時前

AI日報：智譜清影2.0發佈；深圳上線全國首個AI智能勞動仲裁系統；1688推跨境AI智能體“遨蝦”

AI產品

Sora 2

最新視頻生成模型，更真實、可控，支持同步對話與音效。

視頻生成

8.9k

模型

Gemini 2.0 Flash-Lite

Google

$0.49

輸入tokens/百萬

$2.1

輸出tokens/百萬

上下文長度

GPT-4.1 mini

Openai

$2.8

輸入tokens/百萬

$11.2

輸出tokens/百萬

上下文長度

Grok 4 Fast

Xai

$1.4

輸入tokens/百萬

$3.5

輸出tokens/百萬

上下文長度

o3-mini

Openai

$7.7

輸入tokens/百萬

$30.8

輸出tokens/百萬

200

上下文長度

GPT-5 Codex

Openai

輸入tokens/百萬

輸出tokens/百萬

上下文長度

Claude 3 Opus

Anthropic

$105

輸入tokens/百萬

$525

輸出tokens/百萬

200

上下文長度

Gemini 2.0 Flash

Google

$0.7

輸入tokens/百萬

$2.8

輸出tokens/百萬

上下文長度

Claude Haiku 4.5

Anthropic

輸入tokens/百萬

$35

輸出tokens/百萬

200

上下文長度

Gemini 2.5 Flash

Google

$2.1

輸入tokens/百萬

$17.5

輸出tokens/百萬

上下文長度

Claude Sonnet 4.5

Anthropic

$21

輸入tokens/百萬

$105

輸出tokens/百萬

200

上下文長度

Claude 3 Sonnet

Anthropic

$21

輸入tokens/百萬

$105

輸出tokens/百萬

200

上下文長度

Gemini 2.5 Flash-Lite

Google

$0.7

輸入tokens/百萬

$2.8

輸出tokens/百萬

上下文長度

wan2.5-i2i-preview

Alibaba

輸入tokens/百萬

輸出tokens/百萬

上下文長度

qwen3-max

Alibaba

輸入tokens/百萬

$24

輸出tokens/百萬

256

上下文長度

qwen-image-plus

Alibaba

輸入tokens/百萬

輸出tokens/百萬

上下文長度

qwen3-coder-plus

Alibaba

輸入tokens/百萬

$16

輸出tokens/百萬

上下文長度

Qianfan-Lightning

Baidu

輸入tokens/百萬

輸出tokens/百萬

128

上下文長度

Doubao-Seed-Translation

Bytedance

$1.2

輸入tokens/百萬

$3.6

輸出tokens/百萬

上下文長度

qwen-image-edit

Alibaba

輸入tokens/百萬

輸出tokens/百萬

上下文長度

Qwen3-Next-80B-A3B-Instruct

Alibaba

輸入tokens/百萬

輸出tokens/百萬

256

上下文長度

MCP

MaxMSP MCP Server

該項目通過Model Context Protocol（MCP）讓大型語言模型直接理解和生成Max音頻處理軟件中的音效模塊，支持解釋、修改和創建音效模塊，並提供與LLM的交互界面。

智啟未來，您的人工智能解決方案智庫

友情链接:

AI Newsletters AI Tools MCP Servers AI News AIBase LLM Leaderboard AI Ranking

商務合作網站地圖

AI資訊

阿里萬相2.6發佈:支持“角色扮演”與多分鏡控制，單次視頻時長達15秒

快手可靈 2.6 全量上線！“音畫同出” ，畫面、自然語音、匹配音效、環境氛圍

愛詩科技發佈PixVerse V5.5：國內首個“導演級”多鏡頭敘事視頻大模型落地

AI日報：智譜清影2.0發佈；深圳上線全國首個AI智能勞動仲裁系統；1688推跨境AI智能體“遨蝦”

AI產品

Sora 2

模型

Gemini 2.0 Flash-Lite

GPT-4.1 mini

Grok 4 Fast

o3-mini

GPT-5 Codex

Claude 3 Opus

Gemini 2.0 Flash

Claude Haiku 4.5

Gemini 2.5 Flash

Claude Sonnet 4.5

Claude 3 Sonnet

Gemini 2.5 Flash-Lite

wan2.5-i2i-preview

qwen3-max

qwen-image-plus

qwen3-coder-plus

Qianfan-Lightning

Doubao-Seed-Translation

qwen-image-edit

Qwen3-Next-80B-A3B-Instruct

Handler

Audio Magnet Medium

Bark Small

Tango Full

Bark

Tango

MCP

MaxMSP MCP Server

AI資訊

阿里萬相2.6發佈:支持“角色扮演”與多分鏡控制，單次視頻時長達15秒

快手可靈 2.6 全量上線！“音畫同出” ，畫面、自然語音、匹配音效 、環境氛圍

愛詩科技發佈PixVerse V5.5：國內首個“導演級”多鏡頭敘事視頻大模型落地

AI日報：智譜清影2.0發佈；深圳上線全國首個AI智能勞動仲裁系統；1688推跨境AI智能體“遨蝦”

AI產品

Sora 2

模型

Gemini 2.0 Flash-Lite

GPT-4.1 mini

Grok 4 Fast

o3-mini

GPT-5 Codex

Claude 3 Opus

Gemini 2.0 Flash

Claude Haiku 4.5

Gemini 2.5 Flash

Claude Sonnet 4.5

Claude 3 Sonnet

Gemini 2.5 Flash-Lite

wan2.5-i2i-preview

qwen3-max

qwen-image-plus

qwen3-coder-plus

Qianfan-Lightning

Doubao-Seed-Translation

qwen-image-edit

Qwen3-Next-80B-A3B-Instruct

Handler

Audio Magnet Medium

Bark Small

Tango Full

Bark

Tango

MCP

MaxMSP MCP Server

快手可靈 2.6 全量上線！“音畫同出” ，畫面、自然語音、匹配音效、環境氛圍