テンセントは明日、混元3D AIエンジン2.5(Hunyuan3D AI Engine 2.5)を発表し、AI駆動による3Dコンテンツ制作の革新をさらに推進すると発表しました。AIbaseの情報によると、混元3D 2.0のアップグレード版である2.5は、ジオメトリ生成、テクスチャ合成、生成速度において大幅なブレークスルーを実現し、ゲーム開発、仮想現実、クリエイティブデザインなどの分野により効率的なソリューションを提供すると予想されます。テンセント公式の予告は、世界中の開発者やクリエイターから熱い期待を集めており、詳細については明日の発表会で公開されます。AIbaseは最新の予測レポートをお届けします。

image.png

主要なアップグレード:高品質と高速生成

混元3D 2.0の成功を基に、混元3D AIエンジン2.5は、その2段階生成パイプライン(ジオメトリ生成+テクスチャ合成)をさらに最適化します。AIbaseの分析によると、予想されるアップグレードは以下の通りです:

ジオメトリ精度の向上:最適化されたHunyuan3D-DiT(Diffusion Transformer)モデルにより、2.5はより精細な3Dメッシュを生成し、人物の顔や機械部品など、複雑な構造のエッジとディテールの表現を改善します。

テクスチャ合成の強化:Hunyuan3D-Paintモデルは、より高解像度のテクスチャ出力をサポートし、多視点の一貫性を最適化することで、360°視点での視覚的なリアリティを確保します。

生成速度の向上:2.0の10~25秒の生成時間に対し、2.5は5~15秒に短縮される可能性があり、特に軽量モデル(Hunyuan3D-2mini-Turboなど)では顕著な効果が期待されます。

マルチモーダル入力の最適化:より複雑なテキストと画像の混合入力をサポートし、ユーザーは自然言語による記述や参照画像を使用して、高度にカスタマイズされた3Dアセットを生成できます。

コミュニティでは、2.5は最新のRomanTexテクスチャ生成モデルとMaterialMVP PBRマテリアル生成技術(4月1日リリース予定)を統合し、リアルタイムレンダリングと高忠実度アプリケーションをサポートする可能性があると推測されています。AIbaseは、混元3D 2.0がVBench評価でオープンソースとクローズドソースの競合製品を上回っていることに注目しており、2.5のパフォーマンスに期待が高まっています。

技術アーキテクチャ:継続と革新の共存

混元3D AIエンジン2.5は、2.0の2段階生成アーキテクチャを継承しており、主要なコンポーネントは以下の通りです:

Hunyuan3D-DiT:ストリーミング拡散トランスフォーマーに基づき、高精度な3Dジオメトリ構造の生成を担当し、多視点の一貫性と条件付き画像のアライメントをサポートします。

Hunyuan3D-Paint:ジオメトリプリオリと拡散モデルを利用して高解像度のテクスチャを生成し、手描きと生成メッシュの柔軟な着色をサポートします。

Hunyuan3D-Studio:ワンストップ制作プラットフォームであり、2.5ではアニメーション編集とリアルタイムプレビュー機能が追加され、プロフェッショナルユーザーとアマチュアユーザーのワークフローが簡素化されると予想されます。

AIbaseの情報によると、2.5はAdaptive Classifier-Free Guidance 2.0を導入し、生成結果と入力条件のアライメントをさらに向上させる可能性があります。さらに、コミュニティからのフィードバックに基づき、トポロジー最適化の問題(骨格アニメーションのサポートなど)が2.5で改善され、ゲーム開発における実用性が向上する可能性があります。

適用事例:ゲームからeコマースまで、幅広い分野への活用

混元3D AIエンジン2.5の発表により、AIによる3Dコンテンツ制作の応用範囲がさらに広がります。AIbaseは、主要な適用事例を以下にまとめました:

ゲーム開発:低ポリゴンアセットと高忠実度キャラクターモデルを迅速に生成し、レベルデザインとプロトタイプテストを加速させます。テンセントマップは既に混元3Dを使用してナビゲーションアイコンの生成効率を91%向上させています。

仮想現実とメタバース:没入型の3D環境とダイナミックなキャラクターを生成し、VR/ARコンテンツ制作をサポートし、ユーザーエクスペリエンスを向上させます。

電子商取引:製品に対してインタラクティブな3Dモデルを生成し、360°表示とリアルタイムマテリアル調整をサポートし、消費者の購買体験を向上させます。

映画とアニメーション:高品質なプリビジュアライゼーションアセットとアニメーションシーケンスを生成し、VFXとポストプロダクションのコストを削減します。

AIbaseの観察によると、混元3D 2.0はUGC制作と製品マテリアル合成において大きな可能性を示しており、2.5のアップグレードはこれらの分野の商業化をさらに推進すると予想されます。

使用方法:オープンソースとユーザーフレンドリーな設計

混元3D AIエンジン2.5は、オープンソース戦略を継続すると予想され、コードとモデルはHugging FaceとGitHubで公開される予定です。AIbaseは、初期の使用方法を以下にまとめました:

Hunyuan3D Studioのウェブサイト(3d.hunyuan.tencent.com)またはHugging Faceのスペースにアクセスし、2.5モデルと推論コードをダウンロードします。

環境(Python 3.9+、NVIDIA A100/RTX 3090+、32GB RAM推奨)をインストールし、env_install.shスクリプトを実行します。

Gradio AppまたはAPIを使用してモデルを読み込み、「サイバーパンク都市」などのテキストまたは画像を入力して3Dアセットを生成します。

Hunyuan3D-Studioでテクスチャ、アニメーションを編集するか、glb/obj形式でエクスポートします。

コミュニティが提供するComfyUI-Hunyuan3DWrapperとBlenderプラグインは2.5を引き続きサポートし、導入のハードルを下げます。AIbaseは、最新のWindows互換性アップデートと6GB vRAM最適化モジュール(Hunyuan3D-2GPなど)を入手するために、明日の発表会に注目することをお勧めします。

コミュニティの反応と将来展望

混元3D 2.0のリリース以来、その高いCLIPスコア(0.809)と高速な生成能力はコミュニティから高く評価されていますが、トポロジーの問題と複雑なシーンのサポートについては改善が必要です。AIbaseの観察によると、開発者は2.5で骨格アニメーションの互換性と多言語プロンプト処理の最適化を期待しており、一部のユーザーは画像からビデオ(I2V)機能の追加を希望しています。テンセントは、2.5で一部の問題を解決し、2025年に混元ビデオモデルをリリースして、Runway Gen-3とLuma 1.6に挑戦する計画であると回答しています。AIbaseは、混元3Dエコシステムの拡大に伴い、テンセントがMCPマーケットを立ち上げ、Blender、Unityなどのツールを統合し、統一されたAI制作フレームワークを構築すると予測しています。