谷歌AI图像编辑工具“Nano Banana”一周内吸引超1000万用户,完成2亿次编辑。作为Gemini新功能,该工具成功避免AI图像生成的“恐怖谷效应”,在手办和真人图像编辑中表现优异,成为AI编辑领域的重要突破。
Sesame 公司最新推出的语音合成模型“Conversational Speech Model”(简称 CSM)近日在 X 平台上引发热议,被誉为“像真人说话一样的语音模型”。这款模型以其惊艳的自然度和情感表达能力,不仅让用户“已经无法分辨”其与人类的区别,还宣称成功跨越了语音领域的“恐怖谷效应”。随着演示视频和用户反馈的传播,CSM 正迅速成为 AI 语音技术的新标杆。跨越“恐怖谷”:CSM 的技术突破“恐怖谷效应”是指当人工合成的语音或形象接近真实人类但仍存细微差异时,会引发人类的不适感。Sesame 通
["Sora进军TikTok,标志着AI短视频营销时代的到来。","Sora的出现将大幅降低视频广告制作成本,可能颠覆广告行业。","Sora生成的视频效果更真实,避免了传统AI视频的‘恐怖谷’效应。","Sora将改变视频生产方式,提升品牌讲故事的效率。","尽管Sora带来了自动化的广告创意,但人类创造力仍然不可替代。"]
Google
$0.7
Input tokens/M
$2.8
Output tokens/M
1k
Context Length