拓竹科技が「印你」3Dフィギュア生成器を発表。Tencent Hunyuan 3D 3.0モデルを基に、画像をアップロードするだけで高品質な3Dプリント可能モデルを生成。カスタム制作のハードルを下げ、愛好家や初心者に便利な創作ツールを提供。....
腾讯は海外向け大規模AIモデル「混元」のブランド名を「Tencent HY」に簡略化し、国際的ブランドアイデンティティを強化。12月5日リリースの新バージョン「Tencent HY2.0」は、同社のAIアプリ「元宝」と「im」に既に導入済み。....
FLUX.2シリーズがオープンソースで公開され、32Bパラメータの開発版とコードを提供。10枚の参照画像と4MP編集機能をサポートし、開発者は画像生成・編集技術を探求可能。....
腾讯混元が10億パラメータのOCRモデルHunyuanOCRをオープンソース化。マルチモーダルアーキテクチャを基に、複数タスクで最先端の性能を実現し、多様なシーンでの文字認識をサポート。....
Hunyuan Image 3.0は画期的な拡散AIを用いて高品質な画像を生成し、多言語に対応しています。
マルチモーダル駆動のカスタムビデオ生成アーキテクチャ。
HunyuanVideo-I2Vは、テンセントがHunyuanVideoに基づいて開発した、画像から動画を生成するフレームワークです。
これはHunyuanVideoモデルに基づくアダプターであり、キーフレームベースのビデオ生成に使用されます。
Tencent
$1
入力トークン/百万
$4
出力トークン/百万
32
コンテキスト長
-
24
$0.8
$2
$0.5
224
$3
$9
16
$8
28
$2.4
$9.6
$1.5
$6
128
30
250
$12
$18
6
256
$3.5
$7
4
lightx2v
このリポジトリには、HunyuanVideo-1.5用に最適化された4ステップ蒸留モデルが含まれています。このモデルは、CFG(分類器なしガイダンス)を使用せずに、超高速の4ステップ推論を実現し、生成時間を大幅に削減すると同時に、高品質のビデオ出力を維持します。
jayn7
騰訊の混元ビデオ1.5モデルの量子化GGUFバージョンで、テキストから動画生成タスクに特化しており、720P高画質動画生成をサポートし、使用効率を最適化するための複数の量子化精度バージョンを提供します。
このプロジェクトは、テンセントの混元ビデオ1.5のテキストから動画へのモデルの量子化GGUFバージョンを提供し、480P動画生成タスクをサポートします。蒸留モデルと完全モデルの2つのバージョンが含まれており、ComfyUI - GGUFなどのツールと連携して使用できます。
このプロジェクトでは、騰訊のHunyuanVideo-1.5-I2V-720pモデルの量子化GGUFバージョンを提供しており、画像を動画に変換するタスクや動画生成タスクに特化しています。このモデルは、静止画像を高品質な動画コンテンツに変換することができ、性能を最適化するための複数の量子化バージョンを提供しています。
騰訊の混元ビデオ1.5モデルの量子化GGUFバージョンで、画像を動画に変換するタスクや動画生成タスクに特化しています。480P解像度の蒸留モデルと標準モデルを提供し、Q4_K_S、Q8_0、FP16などの複数の量子化精度をサポートします。
HunyuanVideo-1.5用に最適化された量子化モデルで、LightX2Vフレームワークと組み合わせて使用することで、メモリ使用量を大幅に削減しながら、高品質のビデオ生成性能を維持します。
tencent
混元ビデオ - 1.5は軽量級で高性能なビデオ生成モデルで、わずか83億のパラメータでトップレベルのビデオ品質を提供し、使用の敷居を大幅に下げます。消費者向けGPUでスムーズに動作し、テキストからビデオ、画像からビデオの生成をサポートし、すべての開発者やクリエイターが簡単に使用できます。
混元OCRは、混元の独自のマルチモーダルアーキテクチャによって駆動されるエンドツーエンドOCRの専門的なVLMモデルです。わずか10億パラメータの軽量設計で、複数の業界ベンチマークテストで最先端の成績を収めています。このモデルは、複雑な多言語ドキュメント解析に長けており、テキストの位置特定、オープンドメインの情報抽出、ビデオ字幕の抽出、画像の翻訳などの実際のアプリケーションシーンで優れた性能を発揮します。
Disty0
このプロジェクトは、騰訊の混元画像3.0モデルを4ビット(UINT4、SVDランク32)で量子化した成果で、SDNQ量子化方法を採用し、テキストから画像の生成タスクに特化しています。
hunyuanvideo-community
HunyuanImage-2.1 画像リファイナーは、diffusersライブラリに基づいて構築された画像から画像への変換モデルで、入力画像を特定のスタイルの画像に変換することができ、高品質な画像生成とスタイル変換をサポートします。
混元画像2.1はdiffusersライブラリに基づくテキストから画像生成モデルで、テキスト記述に基づいて高品質な画像を生成でき、中英語の入力をサポートし、ユーザーに便利な画像生成体験を提供します。
DevQuasar
本プロジェクトは、Huihui-Hunyuan-MT-7B-abliteratedモデルの量子化バージョンを提供し、知識を誰もが利用できるようにすることを目指しています。これは、Hunyuanアーキテクチャに基づく7Bパラメータの多言語テキスト生成モデルです。
Mungert
Hunyuan-MT-7Bは、騰訊が開発した7Bパラメータの翻訳モデルで、5種類の中国少数民族語を含む33言語の相互翻訳をサポートしています。このモデルはWMT25の試合で優れた成績を収め、31の言語カテゴリのうち30カテゴリで1位を獲得し、事前学習から統合最適化までの完全な翻訳モデル学習フレームワークを提案しました。
混元翻訳モデルは、騰訊が開発した先進的な機械翻訳システムで、翻訳モデルの混元-MT-7Bと統合モデルの混元-MT-Chimeraを含んでいます。このモデルは、中国語、英語、フランス語などの主要言語や中国の5つの少数民族語を含む33言語の相互翻訳をサポートし、WMT25競技で優れた成績を収めています。
mradermacher
これは騰訊混元翻訳モデル7Bの量子化バージョンで、複数の言語の翻訳をサポートし、さまざまなシチュエーションで多様な翻訳ニーズを満たすことができます。このモデルはGGUF形式で量子化され、さまざまなハードウェアとパフォーマンスの要件に合わせた複数の量子化レベルを提供します。
テンセントの混元-MT-奇美拉-7Bに基づく多言語翻訳モデルの量子化バージョンで、複数の量子化精度を選択でき、36種類の言語の翻訳タスクをサポートします。主流言語とマイナー言語を含み、多言語交流に効率的なツールを提供します。
混元は騰訊がオープンソースした効率的な大規模言語モデルシリーズで、様々な計算環境での多目的デプロイに特化して設計されています。エッジデバイスから高並発生産システムまで、これらのモデルは高度な量子化サポートと超長文脈能力を活用して、最高のパフォーマンスを実現します。
mlx-community
騰訊混元A13B大規模モデルを変換した5ビット量子化バージョンで、AppleチップのMLXフレームワークに適しています。
騰訊混元A13B大規模言語モデルの4ビット量子化バージョンで、命令追従タスクに適しています。
混元3D - 2は、画像から3D、テキストから3Dへの変換をサポートするツールで、3Dコンテンツ生成に強力な解決策を提供します。
Replicateプラットフォームに基づくHunyuan Image画像生成MCPサーバーで、高品質のテキストから画像への変換機能を提供し、複数のサイズとパラメータ調整をサポートします。