腾讯混元团队开源视频生成加速方案DisCa,通过可学习特征缓存技术,在已蒸馏的少步模型上进一步压缩推理成本,提升生成速度。该方案代码与模型权重已公开,并被CVPR2026收录。
腾讯开源混元3D世界模型2.0,支持文本、图片、视频等多模态输入,可自动生成、重建和模拟3D世界。模型支持Mesh、3DGS、点云等多种格式导出,能与游戏开发流程无缝对接,助力快速生成游戏地图与关卡原型,推动AI“造世界”技术发展。
腾讯混元团队开源“混元3D世界模型2.0”,实现从视频生成到可交互、可编辑3D资产的升级。支持文、图、视频输入,能自动生成包含人、物、景的完整3D空间,并支持多种格式导出,无缝对接主流游戏引擎。
腾讯正研发互动平台“探梦DreamNow”,主打AI生成内容创作与展示。用户可观看、点赞、评论AI视频图片,并参与互动影游创作。平台尚在开发中。
HunyuanVideo-I2V 是腾讯推出的基于 HunyuanVideo 的图像到视频生成框架。
腾讯开源的大型视频生成模型训练框架
130亿参数的文生视频大模型,实现创意与物理准确性的结合
腾讯QQ多媒体研究团队开发的轻量级灵活视频多语言模型
Openai
$2.8
Input tokens/M
$11.2
Output tokens/M
1k
Context Length
Google
$2.1
$17.5
Alibaba
$2
$20
-
$8
$240
52
$3.9
$15.2
64
$15.8
$12.7
Bytedance
Tencent
$1
$4
32
$0.8
256
Baidu
24
$0.7
$1.95
16
jayn7
腾讯混元视频1.5模型的量化GGUF版本,专门用于文本到视频生成任务,支持720P高清视频生成,提供多种量化精度版本以优化使用效率。
本项目提供腾讯混元视频1.5文本到视频模型的量化GGUF版本,支持480P视频生成任务,包含蒸馏模型和完整模型两个版本,可与ComfyUI-GGUF等工具配合使用。
本项目提供了腾讯HunyuanVideo-1.5-I2V-720p模型的量化GGUF版本,专门用于图像转视频和视频生成任务。该模型支持将静态图像转换为高质量视频内容,提供了多种量化版本以优化性能。
腾讯混元视频1.5模型的量化GGUF版本,专门用于图像转视频和视频生成任务。提供480P分辨率的蒸馏模型和标准模型,支持多种量化精度,包括Q4_K_S、Q8_0和FP16等。
TencentARC
ARC-Qwen-Video-7B是腾讯ARC实验室开发的用于理解现实世界短视频的多模态模型,基于Qwen2.5-VL-7B-Instruct构建,支持音视频同步分析和理解。
ARC-Hunyuan-Video-7B 是腾讯ARC实验室开发的多模态模型,专门用于理解现实世界中的短视频内容。它能够端到端处理视觉、音频和文本信号,通过整合多模态线索实现对视频的深度结构化理解。
YarvixPA
基于腾讯混元定制版模型转换的GGUF格式视频生成模型,支持图像转视频任务
trojblue
基于腾讯混元视频基础模型微调的LoRA模型,专门用于生成动漫风格的像素艺术图像,擅长表现角色动态和像素化场景。
hunyuanvideo-community
腾讯HunyuanVideo-I2V是一个基于Diffusers的图像转视频模型,能够将静态图像转换为动态视频。
calcuis
腾讯混元社区开发的图像转视频模型,能够将输入的文本描述转换为动态视频内容。
tencent
混元视频-I2V是一个全新的图像转视频生成框架,基于腾讯混元视频模型扩展,支持从静态图像生成高质量视频内容。
THUdyh
Ola-7B是由腾讯、清华大学和南洋理工大学联合开发的多模态语言模型,基于Qwen2.5架构,支持文本、图像、视频和音频输入,输出文本内容。
Ola-7B是由腾讯、清华大学和南洋理工大学联合开发的多模态语言模型,基于Qwen2.5架构,支持处理图像、视频、音频和文本输入,并输出文本。
jbilcke-hf
SkyReels-V1-Hunyuan-I2V是由腾讯SkyworkAI开发的文本生成视频模型,基于Hunyuan架构,支持从文本输入生成视频内容。
Ola-7B是由腾讯、清华大学和南洋理工大学联合开发的多模态大语言模型,基于Qwen2.5架构,支持处理文本、图像、视频和音频输入,并生成文本输出。
基于腾讯混元视频模型的动漫风格适配器,提供高质量文本到视频生成能力,特别优化了动漫风格内容生成。
腾讯混元视频是一个文本生成视频的模型,适配于Hugging Face推理端点。
腾讯混元社区版的文本生成视频模型,支持通过文本提示生成高质量视频内容。
city96
腾讯幻影视频模型的GGUF量化版本,专为ComfyUI设计,用于文本生成视频任务
混元视频是腾讯开源的大规模视频生成模型,采用创新的统一架构实现高质量文本到视频生成
腾讯云COS MCP Server是一个基于MCP协议的服务,无需编码即可让大模型快速接入腾讯云存储(COS)和数据万象(CI)能力,提供文件上传下载、图片处理、视频截帧等云端存储与处理功能。
腾讯云COS MCP Server是一个无需编码即可让大模型快速接入腾讯云存储(COS)和数据万象(CI)能力的服务,提供文件上传下载、图片处理、视频处理等云端存储与处理功能。