最好的AI Speech Model AI工具模型_精选AI Speech Model资讯

AI资讯

Sesame 发布 CSM 语音模型：跨越“恐怖谷”，逼真程度惊艳全球

Sesame 公司最新推出的语音合成模型“Conversational Speech Model”（简称 CSM）近日在 X 平台上引发热议，被誉为“像真人说话一样的语音模型”。这款模型以其惊艳的自然度和情感表达能力，不仅让用户“已经无法分辨”其与人类的区别，还宣称成功跨越了语音领域的“恐怖谷效应”。随着演示视频和用户反馈的传播，CSM 正迅速成为 AI 语音技术的新标杆。跨越“恐怖谷”:CSM 的技术突破“恐怖谷效应”是指当人工合成的语音或形象接近真实人类但仍存细微差异时，会引发人类的不适感。Sesame 通

26.4k 17 小时前

AI产品

Stability AI text-to-speech models

Stability AI 高保真文本转语音模型

文本转声音

12.6k

模型

qwen-image-plus

Alibaba

输入tokens/百万

输出tokens/百万

上下文长度

wan2.5-i2i-preview

Alibaba

输入tokens/百万

输出tokens/百万

上下文长度

qwen-image-edit

Alibaba

输入tokens/百万

输出tokens/百万

上下文长度

wan2.5-t2v-preview

Alibaba

输入tokens/百万

输出tokens/百万

上下文长度

wan2.5-t2i-preview

Alibaba

输入tokens/百万

输出tokens/百万

上下文长度

wan2.5-i2v-preview

Alibaba

输入tokens/百万

输出tokens/百万

上下文长度

Doubao - Seedream - 4.0

Bytedance

输入tokens/百万

输出tokens/百万

上下文长度

Doubao - Seedream - 3.0 - t2i

Bytedance

输入tokens/百万

输出tokens/百万

上下文长度

Doubao-SeedEdit-3.0-i2i

Bytedance

输入tokens/百万

输出tokens/百万

上下文长度

Doubao-Seedance-1.0-pro

Bytedance

输入tokens/百万

输出tokens/百万

上下文长度

qwen-mt-image

Alibaba

输入tokens/百万

输出tokens/百万

上下文长度

百度蒸汽机2.0音视一体

Baidu

输入tokens/百万

输出tokens/百万

上下文长度

腾讯混元生视频-视频特效

Tencent

输入tokens/百万

输出tokens/百万

上下文长度

腾讯混元生视频

Tencent

输入tokens/百万

输出tokens/百万

上下文长度

Qwen-Image

Alibaba

输入tokens/百万

输出tokens/百万

上下文长度

Claude Opus 4.1

Anthropic

$105

输入tokens/百万

$525

输出tokens/百万

200

上下文长度

GLM-4.5-AirX

Chatglm

输入tokens/百万

输出tokens/百万

128

上下文长度

GLM-4.5-Air

Chatglm

输入tokens/百万

输出tokens/百万

128

上下文长度

Wan2.1-T2V-1.3B

Alibaba

输入tokens/百万

输出tokens/百万

上下文长度

Wan2.1-I2V-14B-480P

Alibaba

输入tokens/百万

输出tokens/百万

上下文长度

智启未来，您的人工智能解决方案智库

English 简体中文繁體中文にほんご

友情链接:

AI Newsletters AI Tools MCP Servers AI News AIBase LLM Leaderboard AI Ranking

商务合作网站地图