Best AI音频平台 AI Tools & Models - Premium AI音频平台 News

AI News

昆仑元 AI 推出全新全模态融合模型 BaiZe-Omni-14b-a2b，推动 AI 技术新进展

昆仑元AI在2025世界计算大会上发布全模态融合模型BaiZe-Omni-14b-a2b，基于昇腾平台，具备文本、音频、图像和视频的理解与生成能力。采用模态解耦编码、统一跨模态融合和双分支功能设计等创新架构，推动多模态应用发展。模型流程包括输入处理、模态适配、融合、核心功能和输出解码。

12.4k yesterday

昆仑元 AI 推出全新全模态融合模型 BaiZe-Omni-14b-a2b，推动 AI 技术新进展

Quora 的 Poe 应用推出支持最多 200 人的 AI 群聊功能

Quora旗下AI平台Poe推出群聊功能，支持最多200人同时与多种AI模型互动，涵盖文本、图像、视频和音频生成。此举与OpenAI的ChatGPT群聊试点同步，推动AI交互变革，增强用户与亲友或同事的协作交流。

Quora 的 Poe 应用推出支持最多 200 人的 AI 群聊功能

ElevenLabs签下麦康纳与凯恩推出明星语音授权市场

AI音频公司ElevenLabs与奥斯卡得主Matthew McConaughey、Michael Caine达成语音克隆合作，将其AI声线纳入新平台“Iconic Voice Marketplace”。该平台已收录超25位名人语音，提供合法授权使用渠道。McConaughey作为公司投资人，将利用自身声音参与项目。

11.5k 22 hours ago

ElevenLabs签下麦康纳与凯恩推出明星语音授权市场

Step-Audio-EditX 发布:30亿参数音频 LLM 打开语音“可编辑时代”

StepFun AI发布开源项目Step-Audio-EditX，基于30亿参数音频语言模型，将语音编辑转化为类似文本标记的可控操作，突破传统波形处理模式。该技术有望实现"像编辑文本一样编辑语音"的直观交互，相关论文已发布于arXiv平台（编号2511.03601）。

Step-Audio-EditX 发布:30亿参数音频 LLM 打开语音“可编辑时代”

AI Products

Ai Sora2

Ai Sora2

Sora2 AI平台将想法转化为逼真视频，含同步音频和特效，创作轻松

AI Sora 2 Video

AI Sora 2 Video

Sora 2是AI视频与音频生成平台，可依文本生成带声音的逼真视频

Adtwin AI

Adtwin AI

AI音频广告制作平台，为市场营销人员、品牌和代理商提供便捷的广告创建、团队协作、定位客户、分发和像素分析。免费创建，发布付费。

Zarin

Zarin

Zarin是首个开源AI平台，集成了200多个热门和最新的AI多模型，可生成图片、视频、音频、代码、学术论文等。

Models

Claude Haiku 4.5

Anthropic

Claude Haiku 4.5

$7

Input tokens/M

$35

Output tokens/M

200

Context Length

Gemini 2.5 Flash

Google

Gemini 2.5 Flash

$2.1

Input tokens/M

$17.5

Output tokens/M

1k

Context Length

qwen-image-plus

Alibaba

qwen-image-plus

-

Input tokens/M

-

Output tokens/M

-

Context Length

Qianfan-Lightning

Baidu

Qianfan-Lightning

-

Input tokens/M

-

Output tokens/M

128

Context Length

wan2.5-i2i-preview

Alibaba

wan2.5-i2i-preview

-

Input tokens/M

-

Output tokens/M

-

Context Length

qwen-image-edit

Alibaba

qwen-image-edit

-

Input tokens/M

-

Output tokens/M

-

Context Length

wan2.5-t2v-preview

Alibaba

wan2.5-t2v-preview

-

Input tokens/M

-

Output tokens/M

-

Context Length

wan2.5-t2i-preview

Alibaba

wan2.5-t2i-preview

-

Input tokens/M

-

Output tokens/M

-

Context Length

wan2.5-i2v-preview

Alibaba

wan2.5-i2v-preview

-

Input tokens/M

-

Output tokens/M

-

Context Length

Doubao - Seedream - 4.0

Bytedance

Doubao - Seedream - 4.0

-

Input tokens/M

-

Output tokens/M

-

Context Length

Doubao - Seedream - 3.0 - t2i

Bytedance

Doubao - Seedream - 3.0 - t2i

-

Input tokens/M

-

Output tokens/M

-

Context Length

Doubao-SeedEdit-3.0-i2i

Bytedance

Doubao-SeedEdit-3.0-i2i

-

Input tokens/M

-

Output tokens/M

-

Context Length

Doubao-Seedance-1.0-pro

Bytedance

Doubao-Seedance-1.0-pro

-

Input tokens/M

-

Output tokens/M

-

Context Length

qwen-mt-image

Alibaba

qwen-mt-image

-

Input tokens/M

-

Output tokens/M

-

Context Length

百度蒸汽机2.0音视一体

Baidu

百度蒸汽机2.0音视一体

-

Input tokens/M

-

Output tokens/M

-

Context Length

腾讯混元生视频-视频特效

Tencent

腾讯混元生视频-视频特效

-

Input tokens/M

-

Output tokens/M

-

Context Length

腾讯混元生视频

Tencent

腾讯混元生视频

-

Input tokens/M

-

Output tokens/M

-

Context Length

Qwen-Image

Alibaba

Qwen-Image

$2

Input tokens/M

-

Output tokens/M

-

Context Length

Claude Opus 4.1

Anthropic

Claude Opus 4.1

$105

Input tokens/M

$525

Output tokens/M

200

Context Length

Qianfan-ToyTalk

Baidu

Qianfan-ToyTalk

-

Input tokens/M

-

Output tokens/M

32

Context Length

MCP

carla-mcp-server

Carla Mcp Server

Carla MCP服务器是一个专业的音频制作AI控制平台，通过45个工具提供完整的音频插件宿主控制，支持自然语言操作专业音频工作流程

play-sound-mcp-server

Play Sound Mcp Server

一个为AI代理提供音频播放功能的MCP服务器，可在编码任务完成时播放提示音，支持自定义音频和智能回退机制，目前主要支持macOS平台。

AIBase

Empowering the future, your artificial intelligence solution think tank

English 简体中文繁體中文にほんご

FirendLinks:

AI Newsletters AI Tools MCP Servers AI News AIBase LLM Leaderboard AI Ranking

© 2025AIBase

Business Cooperation Site Map