元宝が「一言で動画生成」機能をリリース。テキストや画像入力だけで簡単に動画を作成可能。TencentのHunyuanVideo1.5を基に、初心者でも動画制作が容易に。....
Tencentの翻訳大モデルHunyuan-MT-7BがWMT2025で31言語対応、30言語で1位を獲得。....
TencentのHunyuanVideo-Foleyは、動画とテキスト入力で映画級の音響効果を生成するオープンソースモデル。AI動画の無音問題を解決し、既存技術の課題を突破。....
TencentのHunyuan-GameCraftフレームワークを紹介。HunyuanVideoベースで、簡単な入力から高品質なゲーム動画を生成可能。開発者のAI技術活用を支援。....
業界をリードするオープンソースの大規模混合専門家モデル
Bytedance
-
入力トークン/百万
出力トークン/百万
コンテキスト長
Tencent
$1
$4
32
Alibaba
24
$0.7
$1.95
16
$0.8
$2
Google
$0.5
224
$3
$9
4
$0.3
$0.6
$8
28
$2.4
$9.6
$1.5
$6
128
tencent
混元ビデオ - 1.5は軽量級で高性能なビデオ生成モデルで、わずか83億のパラメータでトップレベルのビデオ品質を提供し、使用の敷居を大幅に下げます。消費者向けGPUでスムーズに動作し、テキストからビデオ、画像からビデオの生成をサポートし、すべての開発者やクリエイターが簡単に使用できます。
混元OCRは、混元の独自のマルチモーダルアーキテクチャによって駆動されるエンドツーエンドOCRの専門的なVLMモデルです。わずか10億パラメータの軽量設計で、複数の業界ベンチマークテストで最先端の成績を収めています。このモデルは、複雑な多言語ドキュメント解析に長けており、テキストの位置特定、オープンドメインの情報抽出、ビデオ字幕の抽出、画像の翻訳などの実際のアプリケーションシーンで優れた性能を発揮します。
混元は騰訊がオープンソースした効率的な大規模言語モデルシリーズで、様々な計算環境での多目的デプロイに特化して設計されています。エッジデバイスから高並発生産システムまで、これらのモデルは高度な量子化サポートと超長文脈能力を活用して、最高のパフォーマンスを実現します。
混元3D - 2は、画像から3D、テキストから3Dへの変換をサポートするツールで、3Dコンテンツ生成に強力な解決策を提供します。
hunyuanvideo-community
TencentのHunyuanVideo-I2Vは、Diffusersベースの画像から動画への変換モデルで、静止画像を動画に変換できます。
混元3D - 2多視点版は、混元3D - 2を微調整したバージョンで、多視点で形状生成を制御できる高解像度テクスチャの3Dアセット生成モデルです。
Tencent Hunyuan3D 2miniは、軽量で効率的な画像から3Dモデルを生成するモデルで、パラメータ規模は6億、中国語と英語の入力をサポートしています。
混元ビデオ - I2Vは、全く新しい画像から動画への生成フレームワークで、騰訊の混元ビデオモデルを拡張したもので、静止画像から高品質の動画コンテンツを生成することができます。
jbilcke-hf
SkyReels-V1-Hunyuan-I2Vは、Tencent SkyworkAIによって開発されたテキストから動画を生成するモデルで、Hunyuanアーキテクチャに基づいており、テキスト入力から動画コンテンツを生成することができます。
混元-7Bは騰訊が公開したオープンソースの大規模言語モデルで、256Kの長テキスト処理能力とグループ化クエリ注意力メカニズム(GQA)を持ち、中国語7Bの稠密モデルで優れた性能を発揮します。
混元-7B-Instructはテンセントがリリースした中英バイリンガル大規模言語モデルで、強力なテキスト生成と理解能力を備えており、現在最も優れた中国語7B Denseモデルの一つです。
混元7BはTencentがオープンソース化した中英バイリンガル大規模言語モデルで、より優れたデータ比率とトレーニング方法を採用し、強力な性能を発揮し、現在最も優れた中国語7B Denseモデルの一つです。
テンセントが提供する先進的な3D合成システムで、画像やテキストから高解像度のテクスチャ付き3Dアセットを生成可能
calcuis
Tencent Hunyuanビデオモデルを基にしたアニメスタイルアダプターで、高品質なテキストからビデオ生成能力を提供し、特にアニメスタイルのコンテンツ生成に最適化されています。
FastVideo
Hunyuan動画はテキストから動画を生成するモデルで、Tencentによって開発されました。
テンセントがオープンソース化した大規模動画生成モデルで、テキストから動画を生成可能、主要なクローズドソースモデルに匹敵する性能を実現。
テンセント混元3D-1.0は、テキストから3Dおよび画像から3D生成をサポートする統一フレームワークで、2段階の方法により効率的かつ迅速な3Dアセット生成を実現します。