微软Copilot新增音频模式,基于MAI-Voice-1模型提供三种语音选择:情感模式支持富有表现力的自由表达;故事模式适合多角色讲故事;脚本模式则用于精确的文本朗读。
微软发布首个自研AI模型MAI-Voice-1和MAI-1-preview,标志着其在AI领域的进一步发展。MAI-Voice-1语音模型能在不到一秒内生成一分钟音频,仅需一块GPU,已应用于Copilot Daily等功能,实现AI主持人朗读服务。
微软发布首批自研AI模型MAI-Voice-1和MAI-1-preview,标志着其减少对外部模型依赖的重要进展。MAI-Voice-1作为语音生成模型,仅需单个GPU即可在1秒内生成1分钟音频,具有高效低成本优势,将为Copilot产品提供技术基础。