騰訊將海外大模型品牌“混元”簡化爲“Tencent HY”,以優化國際品牌標識。此舉與新版發佈同步,12月5日推出的Tencent HY2.0已率先應用於騰訊AI應用如元寶和im。
騰訊混元開源10億參數OCR模型HunyuanOCR,基於多模態架構,在多項任務中實現領先性能,支持多場景文字識別應用。
騰訊發佈1B參數開源模型HunyuanOCR,基於混元多模態架構,在OCR應用中達到SOTA水平。模型採用端到端設計,一次推理即可獲得最優結果,包含原生分辨率視頻編碼器、自適應視覺適配和輕量化混元語言三大核心組件。
騰訊混元開源10億參數OCR模型HunyuanOCR,採用端到端設計,集成視頻編碼器、視覺適配器和輕量化語言模型,在多項榜單獲SOTA成績,以體積小、部署便捷爲核心優勢,提供高效OCR解決方案。
騰訊混元3D驅動的圖片轉3D與STL轉換器,快速生成高精度3D模型
Hunyuan Image 3.0用突破性擴散AI生成高質量圖像,支持多語言。
多模態驅動的定製視頻生成架構。
HunyuanVideo-I2V 是騰訊推出的基於 HunyuanVideo 的圖像到視頻生成框架。
Tencent
$1
輸入tokens/百萬
$4
輸出tokens/百萬
32
上下文長度
-
24
$0.8
$2
$0.5
224
$3
$9
16
4
$8
28
$2.4
$9.6
$1.5
$6
128
250
30
$12
$18
6
256
$3.5
$7
lightx2v
本倉庫包含為HunyuanVideo-1.5優化的4步蒸餾模型,能夠在不使用CFG(無分類器指導)的情況下實現超快速的4步推理,顯著減少生成時間,同時保持高質量的視頻輸出。
jayn7
騰訊混元視頻1.5模型的量化GGUF版本,專門用於文本到視頻生成任務,支持720P高清視頻生成,提供多種量化精度版本以優化使用效率。
本項目提供騰訊混元視頻1.5文本到視頻模型的量化GGUF版本,支持480P視頻生成任務,包含蒸餾模型和完整模型兩個版本,可與ComfyUI-GGUF等工具配合使用。
本項目提供了騰訊HunyuanVideo-1.5-I2V-720p模型的量化GGUF版本,專門用於圖像轉視頻和視頻生成任務。該模型支持將靜態圖像轉換為高質量視頻內容,提供了多種量化版本以優化性能。
騰訊混元視頻1.5模型的量化GGUF版本,專門用於圖像轉視頻和視頻生成任務。提供480P分辨率的蒸餾模型和標準模型,支持多種量化精度,包括Q4_K_S、Q8_0和FP16等。
為HunyuanVideo-1.5優化的量化模型,與LightX2V框架配合使用,在顯著減少內存使用的同時保持高質量視頻生成性能。
tencent
混元視頻-1.5是一款輕量級高性能視頻生成模型,僅用83億參數就能提供頂級的視頻質量,顯著降低了使用門檻。它能在消費級GPU上流暢運行,支持文本到視頻和圖像到視頻生成,讓每個開發者和創作者都能輕鬆使用。
混元OCR是由混元原生多模態架構驅動的端到端OCR專家VLM模型,僅用10億參數的輕量級設計,在多個行業基準測試中取得最先進成績。該模型擅長處理複雜的多語言文檔解析,在文本定位、開放域信息提取、視頻字幕提取和圖片翻譯等實際應用場景中表現出色。
Disty0
本項目是對騰訊混元圖像3.0模型進行4位(UINT4,SVD秩為32)量化的成果,採用了SDNQ量化方法,專門用於文本到圖像的生成任務。
hunyuanvideo-community
HunyuanImage-2.1 圖像精煉器是基於diffusers庫構建的圖像到圖像轉換模型,能夠將輸入圖像轉換為特定風格的圖像,支持高質量圖像生成和風格轉換。
混元圖像2.1是基於diffusers庫的文生圖模型,能夠根據文本描述生成高質量的圖像,支持中英雙語輸入,為用戶提供便捷的圖像生成體驗。
DevQuasar
本項目提供了Huihui-Hunyuan-MT-7B-abliterated模型的量化版本,致力於讓知識為每個人所用。這是一個基於Hunyuan架構的7B參數多語言文本生成模型。
Mungert
Hunyuan-MT-7B是騰訊推出的7B參數翻譯模型,支持33種語言的互譯,包括5種中國少數民族語言。該模型在WMT25比賽中表現出色,在31個語言類別中的30個類別獲得第一名,提出了從預訓練到集成優化的完整翻譯模型訓練框架。
混元翻譯模型是由騰訊開發的先進機器翻譯系統,包含翻譯模型混元-MT-7B和集成模型混元-MT-Chimera。該模型支持33種語言的互譯,包括中文、英語、法語等主流語言以及中國的五種少數民族語言,在WMT25競賽中表現優異。
mradermacher
這是騰訊混元翻譯模型7B的量化版本,支持多種語言的翻譯,能在不同場景下滿足多樣化的翻譯需求。該模型經過GGUF格式量化,提供多種量化級別以適應不同的硬件和性能需求。
基於騰訊 Hunyuan-MT-Chimera-7B 的多語言翻譯模型的量化版本,提供多種量化精度選擇,支持36種語言的翻譯任務,包括主流和小眾語言,為多語言交流提供高效工具。
混元是騰訊開源的高效大語言模型系列,專為在各種計算環境中進行多用途部署而設計。從邊緣設備到高併發生產系統,這些模型藉助先進的量化支持和超長上下文能力,都能實現最佳性能。
mlx-community
基於騰訊混元A13B大模型轉換的5bit量化版本,適用於蘋果芯片的MLX框架
騰訊混元A13B大語言模型的4bit量化版本,適用於指令跟隨任務
混元3D-2是一款支持圖像到3D、文本到3D轉換的工具,為3D內容生成提供了強大的解決方案。
一個基於Replicate平臺的Hunyuan Image圖像生成MCP服務器,提供高質量的文本到圖像轉換功能,支持多種尺寸和參數調節