StepFun AI发布开源音频编辑模型Step-Audio-EditX,该3B参数模型将音频编辑转化为类似文本编辑的令牌操作,实现直接可控的语音编辑。它解决了当前零样本文本转语音系统在情感、风格等控制上的局限,使表达性语音编辑更简单精确。
阿里夸克推出“C计划”,布局对话式AI应用,目标直指字节跳动“豆包”,旨在强化AI业务竞争。该计划聚焦开发者,推动技术趋势与创新产品应用,助力用户洞悉AI领域动态。
Google Veo3.1推出革命性“精确编辑”功能,支持轻松添加或删除视频元素,同时保持原始视频的完整性和真实感。该技术能处理复杂细节如阴影和环境互动,为创作者提供更高自由度,推动AI视频从生成向专业后期转型,实现全面优化。
谷歌DeepMind推出Veo视频生成模型的“精确编辑”功能,用户可通过文本提示添加或删除视频元素,智能重建场景保持真实性和连贯性。此次更新推动AI视频编辑向精细化转型,提升创作者在Flow平台的效率。
免费4K AI图像生成与编辑器,支持精确文字渲染,适用于多种设计。
Banana Pro是下一代AI图像模型,支持文本转图像、高分辨率渲染和精确编辑
免费AI照片编辑器,用文本提示秒出精确编辑、风格变换的高质量结果。
OpenAI的Sora 2 AI,实现物理精确视频生成,有同步音频和客串功能
Google
$0.7
Input tokens/M
$2.8
Output tokens/M
1k
Context Length
Alibaba
-
Bytedance
$2
Qwen
Qwen-Image是通义系列的多模态图像生成基础模型,在复杂文本渲染和精确图像编辑方面表现卓越,特别擅长中文文本渲染,支持多种图像生成和编辑任务。
BleachNick
基于UltraEdit数据训练的StableDiffusion3模型,专门用于基于掩码和自由形式的图像编辑任务。该模型能够根据文本指令和掩码区域对图像进行精确编辑。
一个基于TypeScript的MCP服务器,提供精确的基于行的文本文件编辑工具,支持正则匹配和内容替换。
Patch File MCP是一个通过块格式补丁来精确修改文件内容的MCP服务器,支持多块修改和安全验证,适用于AI代理对项目文件进行精准编辑。