昆仑万维发布Mureka V7.6和O2模型,推动AI音乐创作发展。新模型优化用户体验和生成效果,引发全球关注。自3月底O1和V6模型上线后,平台新增近700万用户,覆盖超100个国家。持续迭代的V7系列进一步提升了服务能力。
小米更新超级小爱至v7.8.50版,新增“随心修图”功能。用户可通过自然语言指令,利用AI模型自动修图,支持多模态交互识别屏幕和摄像头画面。操作方式包括在相册唤醒小爱或通过App上传照片并输入文字,系统自动完成色彩增强、背景虚化等处理。
9月24日,阿里巴巴旗下夸克发布AI创作平台“造点”,集成AI生图与生视频功能,率先接入通义万相Wan2.5,成为国内首个支持音画同步视频生成的平台。平台引入Midjourney V7模型提升图像生成能力,结合自研技术,为用户提供一站式创作体验。通义万相Wan2.5的集成是核心亮点,强化了音视频同步生成效果。
昆仑万维发布AI音乐单曲《Digital Heartbeat》,由最新Mureka V7.5模型创作,支持10种语言歌词,展示AI音乐潜力。该模型于8月15日上线,升级功能包括多语言支持、参考歌曲、自定义歌手和音频编辑等。
MidAPI.ai提供免费MidJourney API,支持V7等模型生成图像与视频。
Openai
$2.8
Input tokens/M
$11.2
Output tokens/M
1k
Context Length
Google
$0.49
$2.1
Xai
$1.4
$3.5
2k
$7.7
$30.8
200
-
Anthropic
$105
$525
$0.7
$7
$35
$17.5
$21
Alibaba
$4
$16
$1
$10
256
$2
$20
Baidu
128
$6
$24
TheLounger
提供Jib Mix Flux V7 Pixel Heaven - beta模型的GGUF格式量化权重,包含3、4和5比特的'K'量化版本
Yntec
Anything V7 是一个基于稳定扩散技术的文本到图像生成模型,专注于动漫、动画和卡通风格的图像生成。
SimianLuo
潜在一致性模型是从Stable-Diffusion v1-5的Dreamshaper v7微调版本蒸馏而来的文本生成图像模型,能在极短推理时间内生成高质量图像。
facebook
基于fairseq S²的Transformer文本转语音模型,支持俄语单说话人男声,在Common Voice v7上预训练并在CSS10上微调。
基于fairseq S^2的Transformer文本转语音模型,支持简体中文,单人女声,在Common Voice v7和CSS10数据集上训练。
基于fairseq S^2的Transformer文本转语音模型,支持土耳其语单说话人男声,训练数据来自Common Voice v7。