腾讯将海外大模型品牌“混元”简化为“Tencent HY”,以优化国际品牌标识。此举与新版发布同步,12月5日推出的Tencent HY2.0已率先应用于腾讯AI应用如元宝和im。
腾讯混元开源10亿参数OCR模型HunyuanOCR,基于多模态架构,在多项任务中实现领先性能,支持多场景文字识别应用。
腾讯发布1B参数开源模型HunyuanOCR,基于混元多模态架构,在OCR应用中达到SOTA水平。模型采用端到端设计,一次推理即可获得最优结果,包含原生分辨率视频编码器、自适应视觉适配和轻量化混元语言三大核心组件。
腾讯混元开源10亿参数OCR模型HunyuanOCR,采用端到端设计,集成视频编码器、视觉适配器和轻量化语言模型,在多项榜单获SOTA成绩,以体积小、部署便捷为核心优势,提供高效OCR解决方案。
腾讯混元3D驱动的图片转3D与STL转换器,快速生成高精度3D模型
Hunyuan Image 3.0用突破性扩散AI生成高质量图像,支持多语言。
多模态驱动的定制视频生成架构。
HunyuanVideo-I2V 是腾讯推出的基于 HunyuanVideo 的图像到视频生成框架。
Tencent
$1
输入tokens/百万
$4
输出tokens/百万
32
上下文长度
-
24
$0.8
$2
$0.5
224
$3
$9
16
4
$8
28
$2.4
$9.6
$1.5
$6
128
30
$12
250
$18
6
256
$3.5
$7
lightx2v
本仓库包含为HunyuanVideo-1.5优化的4步蒸馏模型,能够在不使用CFG(无分类器指导)的情况下实现超快速的4步推理,显著减少生成时间,同时保持高质量的视频输出。
jayn7
腾讯混元视频1.5模型的量化GGUF版本,专门用于文本到视频生成任务,支持720P高清视频生成,提供多种量化精度版本以优化使用效率。
本项目提供腾讯混元视频1.5文本到视频模型的量化GGUF版本,支持480P视频生成任务,包含蒸馏模型和完整模型两个版本,可与ComfyUI-GGUF等工具配合使用。
本项目提供了腾讯HunyuanVideo-1.5-I2V-720p模型的量化GGUF版本,专门用于图像转视频和视频生成任务。该模型支持将静态图像转换为高质量视频内容,提供了多种量化版本以优化性能。
腾讯混元视频1.5模型的量化GGUF版本,专门用于图像转视频和视频生成任务。提供480P分辨率的蒸馏模型和标准模型,支持多种量化精度,包括Q4_K_S、Q8_0和FP16等。
为HunyuanVideo-1.5优化的量化模型,与LightX2V框架配合使用,在显著减少内存使用的同时保持高质量视频生成性能。
tencent
混元视频-1.5是一款轻量级高性能视频生成模型,仅用83亿参数就能提供顶级的视频质量,显著降低了使用门槛。它能在消费级GPU上流畅运行,支持文本到视频和图像到视频生成,让每个开发者和创作者都能轻松使用。
混元OCR是由混元原生多模态架构驱动的端到端OCR专家VLM模型,仅用10亿参数的轻量级设计,在多个行业基准测试中取得最先进成绩。该模型擅长处理复杂的多语言文档解析,在文本定位、开放域信息提取、视频字幕提取和图片翻译等实际应用场景中表现出色。
Disty0
本项目是对腾讯混元图像3.0模型进行4位(UINT4,SVD秩为32)量化的成果,采用了SDNQ量化方法,专门用于文本到图像的生成任务。
hunyuanvideo-community
HunyuanImage-2.1 图像精炼器是基于diffusers库构建的图像到图像转换模型,能够将输入图像转换为特定风格的图像,支持高质量图像生成和风格转换。
混元图像2.1是基于diffusers库的文生图模型,能够根据文本描述生成高质量的图像,支持中英双语输入,为用户提供便捷的图像生成体验。
DevQuasar
本项目提供了Huihui-Hunyuan-MT-7B-abliterated模型的量化版本,致力于让知识为每个人所用。这是一个基于Hunyuan架构的7B参数多语言文本生成模型。
Mungert
Hunyuan-MT-7B是腾讯推出的7B参数翻译模型,支持33种语言的互译,包括5种中国少数民族语言。该模型在WMT25比赛中表现出色,在31个语言类别中的30个类别获得第一名,提出了从预训练到集成优化的完整翻译模型训练框架。
混元翻译模型是由腾讯开发的先进机器翻译系统,包含翻译模型混元-MT-7B和集成模型混元-MT-Chimera。该模型支持33种语言的互译,包括中文、英语、法语等主流语言以及中国的五种少数民族语言,在WMT25竞赛中表现优异。
mradermacher
这是腾讯混元翻译模型7B的量化版本,支持多种语言的翻译,能在不同场景下满足多样化的翻译需求。该模型经过GGUF格式量化,提供多种量化级别以适应不同的硬件和性能需求。
基于腾讯 Hunyuan-MT-Chimera-7B 的多语言翻译模型的量化版本,提供多种量化精度选择,支持36种语言的翻译任务,包括主流和小众语言,为多语言交流提供高效工具。
混元是腾讯开源的高效大语言模型系列,专为在各种计算环境中进行多用途部署而设计。从边缘设备到高并发生产系统,这些模型借助先进的量化支持和超长上下文能力,都能实现最佳性能。
mlx-community
基于腾讯混元A13B大模型转换的5bit量化版本,适用于苹果芯片的MLX框架
腾讯混元A13B大语言模型的4bit量化版本,适用于指令跟随任务
混元3D-2是一款支持图像到3D、文本到3D转换的工具,为3D内容生成提供了强大的解决方案。
一个基于Replicate平台的Hunyuan Image图像生成MCP服务器,提供高质量的文本到图像转换功能,支持多种尺寸和参数调节