Best 音乐大模型 AI Tools & Models - Premium 音乐大模型 News

AI News

AI 音乐进入“翻唱”时代！MiniMax 发布 Music 2.6：推出全新 Cover 功能与 Agent 技能

MiniMax发布新一代AI音乐生成模型Music 2.6，实现从底层引擎到创作工具的全维度升级。核心优化包括大幅降低生成延迟、提升音乐结构连贯性、改善音质与听感，并新增“音乐续写”等创作功能。此次更新旨在为创作者提供更精准、流畅的音乐生成体验，拓宽AI音乐交互边界。

25.9k 16 hours ago

音乐人要“失业”？谷歌 DeepMind 发布 Lyria 3 Pro：AI 已能独立编排完整长金曲

谷歌DeepMind推出增强版音乐创作大模型Lyria 3 Pro，标志着生成式AI在音频领域从生成短乐句迈向全曲创作。该模型音质显著提升，核心突破在于具备“结构意识”，能生成逻辑完整的长音频，实现从“碎片”到“篇章”的进化。

16.3k 19 hours ago

Google DeepMind 发布 Lyria 3 Pro：AI 音乐从"30秒试听"变成完整歌曲

Google DeepMind 新推出的 Lyria 3 Pro 模型将音乐生成时长从 30 秒大幅提升至 3 分钟，并新增“结构感知”能力，使模型能理解并生成包含前奏、主歌、副歌等完整结构的歌曲，突破了此前仅能生成背景音效的限制。

14.9k 8 hours ago

Google DeepMind 发布 Lyria 3 Pro：AI 音乐从"30秒试听"变成完整歌曲

蚂蚁集团开源全模态大模型Ming-flash-omni 2.0：多模态理解、图像编辑与语音生成全面提升

蚂蚁集团开源全模态大模型Ming-Flash-Omni2.0，在视觉语言理解、语音生成、图像处理等多项基准测试中表现优异，部分指标超越Gemini2.5Pro。该模型首创全场景音频统一生成能力，支持在同一条音轨中生成语音、音效和音乐，用户通过自然语言指令即可调整音色、语速等参数。

19.7k 15 hours ago

蚂蚁集团开源全模态大模型Ming-flash-omni 2.0：多模态理解、图像编辑与语音生成全面提升

AI Products

ACE-Step 1.5

最强大的本地音乐生成模型，超越大多数商业替代品。

音乐生成

NotaGen

NotaGen 是一个用于符号音乐生成的模型，采用大语言模型训练范式，专注于生成高质量古典乐谱。

音乐生成

15.8k

ChatMusician

集成音乐能力的开源LLM

AI音乐生成

19.6k

Models

GPT-4.1 mini

Openai

$2.8

Input tokens/M

$11.2

Output tokens/M

Context Length

Gemini 2.0 Flash-Lite

Google

$0.49

Input tokens/M

$2.1

Output tokens/M

Context Length

Grok 4 Fast

Xai

$1.4

Input tokens/M

$3.5

Output tokens/M

Context Length

o3-mini

Openai

$7.7

Input tokens/M

$30.8

Output tokens/M

200

Context Length

GPT-5 Codex

Openai

Input tokens/M

Output tokens/M

Context Length

Claude 3 Opus

Anthropic

$105

Input tokens/M

$525

Output tokens/M

200

Context Length

Gemini 2.0 Flash

Google

$0.7

Input tokens/M

$2.8

Output tokens/M

Context Length

Claude Haiku 4.5

Anthropic

Input tokens/M

$35

Output tokens/M

200

Context Length

Gemini 2.5 Flash

Google

$2.1

Input tokens/M

$17.5

Output tokens/M

Context Length

Claude Sonnet 4.5

Anthropic

$21

Input tokens/M

$105

Output tokens/M

200

Context Length

Claude 3 Sonnet

Anthropic

$21

Input tokens/M

$105

Output tokens/M

200

Context Length

Gemini 2.5 Flash-Lite

Google

$0.7

Input tokens/M

$2.8

Output tokens/M

Context Length

qwen3-coder-plus

Alibaba

Input tokens/M

$16

Output tokens/M

Context Length

qwen3-vl-plus

Alibaba

Input tokens/M

$10

Output tokens/M

256

Context Length

qwen3-vl-235b-a22b-thinking

Alibaba

Input tokens/M

$20

Output tokens/M

Context Length

Qianfan-Lightning

Baidu

Input tokens/M

Output tokens/M

128

Context Length

qwen3-max

Alibaba

Input tokens/M

$24

Output tokens/M

256

Context Length

qwen-image-edit

Alibaba

Input tokens/M

Output tokens/M

Context Length

qwen3-livetranslate-flaltimeash-re-2025-09-22

Alibaba

Input tokens/M

$240

Output tokens/M

Context Length

Doubao-Seed-Translation

Bytedance

$1.2

Input tokens/M

$3.6

Output tokens/M

Context Length

MCP

Llm Jukebox

一个基于模型上下文协议（MCP）的服务，允许大型语言模型搜索、下载和播放YouTube音乐。

python

9.2k

2.5points

Empowering the future, your artificial intelligence solution think tank

English 简体中文繁體中文にほんご

FirendLinks:

AI Newsletters AI Tools MCP Servers AI News AIBase LLM Leaderboard AI Ranking

Business Cooperation Site Map

AI News

AI 音乐进入“翻唱”时代！MiniMax 发布 Music 2.6：推出全新 Cover 功能与 Agent 技能

音乐人要“失业”？谷歌 DeepMind 发布 Lyria 3 Pro：AI 已能独立编排完整长金曲

Google DeepMind 发布 Lyria 3 Pro：AI 音乐从"30秒试听"变成完整歌曲

蚂蚁集团开源全模态大模型Ming-flash-omni 2.0：多模态理解、图像编辑与语音生成全面提升

AI Products

ACE-Step 1.5

NotaGen

ChatMusician

Models

GPT-4.1 mini

Gemini 2.0 Flash-Lite

Grok 4 Fast

o3-mini

GPT-5 Codex

Claude 3 Opus

Gemini 2.0 Flash

Claude Haiku 4.5

Gemini 2.5 Flash

Claude Sonnet 4.5

Claude 3 Sonnet

Gemini 2.5 Flash-Lite

qwen3-coder-plus

qwen3-vl-plus

qwen3-vl-235b-a22b-thinking

Qianfan-Lightning

qwen3-max

qwen-image-edit

qwen3-livetranslate-flaltimeash-re-2025-09-22

Doubao-Seed-Translation

Audio Flamingo 3

MuQ MuLan Large

Pathumma Llm Audio 1.0.0

Bigvgan_base_22khz_80band

Music Large 800k

Mustango

MCP

Llm Jukebox