腾讯混元团队开源视频生成加速方案DisCa,通过可学习特征缓存技术,在已蒸馏的少步模型上进一步压缩推理成本,提升生成速度。该方案代码与模型权重已公开,并被CVPR2026收录。
腾讯开源混元3D世界模型2.0,支持文本、图片、视频等多模态输入,可自动生成、重建和模拟3D世界。模型支持Mesh、3DGS、点云等多种格式导出,能与游戏开发流程无缝对接,助力快速生成游戏地图与关卡原型,推动AI“造世界”技术发展。
腾讯混元团队开源“混元3D世界模型2.0”,实现从视频生成到可交互、可编辑3D资产的升级。支持文、图、视频输入,能自动生成包含人、物、景的完整3D空间,并支持多种格式导出,无缝对接主流游戏引擎。
腾讯元宝推出新功能,用户仅需一句话或一张图片即可生成视频。该功能基于腾讯混元团队最新开源的HunyuanVideo1.5模型,简化了视频创作流程,助力开发者洞悉AI技术趋势。
Openai
$2.8
Input tokens/M
$11.2
Output tokens/M
1k
Context Length
Google
$0.49
$2.1
Xai
$1.4
$3.5
2k
$7.7
$30.8
200
-
Anthropic
$105
$525
$0.7
$7
$35
$17.5
$21
Alibaba
$4
$16
$1
$10
256
$2
$20
$6
$24
Baidu
128
jayn7
腾讯混元视频1.5模型的量化GGUF版本,专门用于文本到视频生成任务,支持720P高清视频生成,提供多种量化精度版本以优化使用效率。
本项目提供腾讯混元视频1.5文本到视频模型的量化GGUF版本,支持480P视频生成任务,包含蒸馏模型和完整模型两个版本,可与ComfyUI-GGUF等工具配合使用。
腾讯混元视频1.5模型的量化GGUF版本,专门用于图像转视频和视频生成任务。提供480P分辨率的蒸馏模型和标准模型,支持多种量化精度,包括Q4_K_S、Q8_0和FP16等。
tencent
混元视频-1.5是一款轻量级高性能视频生成模型,仅用83亿参数就能提供顶级的视频质量,显著降低了使用门槛。它能在消费级GPU上流畅运行,支持文本到视频和图像到视频生成,让每个开发者和创作者都能轻松使用。
YarvixPA
基于腾讯混元定制版模型转换的GGUF格式视频生成模型,支持图像转视频任务
trojblue
基于腾讯混元视频基础模型微调的LoRA模型,专门用于生成动漫风格的像素艺术图像,擅长表现角色动态和像素化场景。
混元视频-I2V是一个全新的图像转视频生成框架,基于腾讯混元视频模型扩展,支持从静态图像生成高质量视频内容。
calcuis
基于腾讯混元视频模型的动漫风格适配器,提供高质量文本到视频生成能力,特别优化了动漫风格内容生成。
jbilcke-hf
腾讯混元视频是一个文本生成视频的模型,适配于Hugging Face推理端点。
腾讯混元社区版的文本生成视频模型,支持通过文本提示生成高质量视频内容。
混元视频是腾讯开源的大规模视频生成模型,采用创新的统一架构实现高质量文本到视频生成
FastVideo
混元视频是一个文本生成视频的模型,由腾讯开发。