火山エンジンがGartner「AIアプリケーションプラットフォーム魔力象限」で中国地域「実装能力」首位、世界5位を獲得。豆包大モデルと火山方舟プラットフォームにより「挑戦者」象限のトップに選出。....
Meta AIがSAM3Dを発表。単一の2D画像からテクスチャ・材質・幾何学的一貫性を持つ3Dアセットを生成可能。物体用と人体用の2種の重みを備え、物理的正確性を実現。AR/VR・ロボティクス・映像制作などへの応用が期待される。....
DeepMindがSIMA2を発表。Geminiモデルを採用し、目標理解・計画説明・自己学習が可能に。複雑な3Dゲームで継続的に進化。前身SIMA1(2024年)は画像と仮想デバイス制御で600以上の言語指令を理解、タスク達成率は約31%で人間未満。....
アリグループが全モーダルAIアシスタント「霊光」を発表。自然言語で30秒以内に編集・共有可能なモバイルアプリを生成。業界初のコード生成型多モーダルAIとして、3D・音声・動画機能を搭載し、対話の効率と臨場感を向上。AndroidとiOSで利用可能。....
無料でオンラインでPNGをSTLに変換し、3D印刷や3D編集ソフトウェアに対応します。
AI室内設計ツールで、3Dモデルから迅速にリアルなレンダリング画像を作成し、時間を節約できます。
AIデザインエージェントを通じて、プロフェッショナルな画像、動画、3Dモデルを迅速に生成できます。
マーブルは、ユーザーが簡単な指示で高品質の3D世界を作成、編集、共有することができます。
tencent
$18
入力トークン/百万
出力トークン/百万
32k
コンテキスト長
GatorBarbarian
TRELLIS Text XLは大型の3D生成モデルで、TRELLISのテキスト条件付きバージョンで、モデルサイズはXLです。このモデルは論文「Structured 3D Latents for Scalable and Versatile 3D Generation」に基づいて提案され、テキスト記述に基づいて高品質の3Dコンテンツを生成することができます。
Ashmotv
animat3d_style_wan-loraは、OstrisによるAIツールキットを基にトレーニングされたLoRAモデルで、テキストからビデオへの生成に特化しており、画像生成に独特な3Dアニメーションスタイルの効果をもたらします。このモデルはWan2.2 - T2V - A14Bベースモデルを基に微調整されており、複数の主流のAIプラットフォームで使用できます。
facebook
MapAnythingはエンドツーエンドでトレーニングされたTransformerモデルで、複数のモードを入力として受け取り、シーンの分解測度3D幾何構造を直接回帰することができます。このモデルは、多画像SfM、多視点立体視、単眼測度深度推定など、12種類以上の異なる3D再構築タスクをサポートしています。
manycore-research
FLUX.1-Layout-ControlNetはSpatialGenフレームワークの重要なコンポーネントで、セマンティック画像条件付きのControlNetモデルです。これはテキスト記述に基づいて2D画像を生成することができ、同時に入力されたセマンティック画像のレイアウト制約を厳密に遵守し、主に3D室内シーン合成に使用されます。
yslan
STream3Rは、因果Transformerに基づく拡張可能なシーケンス3D再構築モデルであり、点群図予測をデコーダのみのTransformer問題として再定義します。ストリーミング処理フレームワークを導入し、因果アテンションを利用して画像シーケンスを効率的に処理し、従来の方法がしばしば失敗する動的シーンを含む、様々な挑戦的なシーンにうまく汎化できます。
nvidia
ESM - 2はNVIDIAがTransformerEngineを基に最適化したタンパク質言語モデルで、アミノ酸配列からタンパク質の3D構造を予測できます。このモデルはマスク言語モデリングの目標で訓練され、NVIDIA GPU上でより高速な訓練と推論速度を持ちます。
ilkerzgi
これはLoRAモデルで、通常の画像を黒色背景と3D視点の金属スタイルの画像に変換できます。
lhjiang
AnySplatは、高度な3Dガウス散点レンダリングモデルで、異なる視点の画像から効率的に高品質の3Dシーンを生成することができます。このモデルは、高速推論能力と良好な汎化性能を持ち、3D再構築とレンダリングに革新的な解決策を提供します。
混元3D - 2は、画像から3D、テキストから3Dへの変換をサポートするツールで、3Dコンテンツ生成に強力な解決策を提供します。
shakamone
TRELLISは画像条件に基づく大規模3D生成モデルで、構造化された3D潜在変数を使用してスケーラブルで多機能な3D生成を実現します。
davidleiva4999
TRELLISのテキスト条件付きバージョンで、XL大規模モデルを採用した強力な3D生成モデルです。
unsloth
InternVL3-78B-Instructは、マルチモーダル知覚、推論、言語処理などの分野で優れた性能を発揮する先進的なマルチモーダル大規模言語モデルです。このモデルは、ネイティブマルチモーダル事前学習手法を用いて、視覚と言語の学習を統一した学習段階に統合し、ツールの使用、GUIエージェント、産業用画像分析、3D視覚知覚などの多くの分野で卓越した能力を発揮します。
ImrozeAslam
混元3D 2.0は、高解像度のテクスチャ付き3Dアセットを生成するための先進的な大規模3D合成システムです。
InternVL3-14B-Instructは先進的なマルチモーダル大規模言語モデル(MLLM)で、優れたマルチモーダル知覚と推論能力を示し、ツール使用、GUIエージェント、産業画像分析、3D視覚知覚など様々なタスクをサポートします。
ImrozeAslamMalik
LGMはマルチビュー拡散モデルを統合した画像から3Dへのワークフローで、単一画像から高品質な3Dコンテンツを生成できます。
InternVL3 - 78Bは、高度なマルチモーダル大規模言語モデルで、卓越したマルチモーダル認知と推論能力を備え、ツール使用、GUIエージェント、産業用画像分析、3D視覚認知などの分野で優れた性能を発揮し、全体的なテキスト性能も非常に高い。
InternVL3-14Bは、先進的なマルチモーダル大規模言語モデルで、InternVL 2.5をベースにマルチモーダル感知と推論能力を大幅に向上させ、ツール使用、GUIエージェント、工業画像分析、3D視覚感知などの分野での応用を拡大しています。
Surn
TRELLIS画像条件バージョンは、画像から3Dコンテンツを生成できる大規模3D生成モデルです。
larsquaedvlieg
TRELLISはテキスト条件付きの大規模3D生成モデルで、構造化された3D潜在変数を使用してスケーラブルで多機能な3Dコンテンツ生成を実現します。
TRELLISは構造化3D潜在変数を用いて、スケーラブルで多機能な3Dコンテンツ生成を実現する大規模3D生成モデルです。
BlenderMCPはMCPプロトコルを通じてBlenderとClaude AIを接続し、AIによる3Dモデリングとシーン制御を実現します
Blender MCP VXAIは強力な統合ツールで、ユーザーが自然言語でBlenderを制御し、3Dモデリング、アニメーション、シーンの作成と修正を実現できます。複雑な操作を簡素化し、リアルタイムでプロジェクトにエクスポートすることをサポートします。
Tripo MCPサーバーは、AIアシスタントとTripo AIをつなぐインターフェースプロジェクトで、自然言語で3Dアセットを生成し、Blenderにインポートできます。
RhinoMCPは、Model Context Protocolを通じてRhino 3DモデリングソフトウェアとAIエージェントを接続するツールで、双方向のやり取りを実現し、3Dオブジェクト操作、ドキュメント検査、およびスクリプト実行をサポートします。
Tripo MCP ServerはAIアシスタントとTripo AIを接続するインターフェースツールで、自然言語を通じて3Dアセットを生成し、Blenderにインポートすることをサポートします。
FreeCAD MCPはClaude DesktopでFreeCADを制御するプラグインで、2D図面から3Dモデルを作成するなど、さまざまな設計機能をサポートしています。
PythonベースのMCPサーバーで、PubChemデータベースから化学化合物データをクエリし、化合物の属性、2D/3D構造などの情報検索機能を提供します。
Trellis MCPはAIアシスタントとTrellis 3D生成モデルをつなぐインターフェースサービスで、自然言語で迅速に3Dアセットを生成してBlenderにインポートできます。このプロジェクトはオープンソースモデルに基づいており、APIバックエンドを自分でデプロイする必要があり、高速で無料という特徴がありますが、安定性のリスクがあります。
MCP STL 3Dレリーフ生成器は、2D画像を3Dレリーフモデルに変換するツールで、モデルのサイズ制御、ベースの追加、深度反転などの機能に対応し、3D印刷やレンダリングに適しています。
SketchupMCPは、モデルコンテキストプロトコル(MCP)を通じてSketchupとClaude AIを接続し、双方向通信と3Dモデリング制御を実現します。
VGGT - MPSは、Appleチップ向けに最適化された3Dビジョン再構築ツールで、Metal Performance Shadersを使用して加速され、単一または複数の画像から深度マップ、カメラ姿勢、3D点群を生成し、疎注意力をサポートして都市レベルの再構築を実現します。
Spline MCPサーバーは、Spline 3DデザインツールのAPIにインターフェースを提供するミドルウェアサービスです
OpenSCAD MCPサーバーは、テキストまたは画像からパラメトリック3Dモデルを生成するツールで、多視点再構築とリモート処理をサポートします。
3D - MCPは、3Dソフトウェア用に設計された汎用モデルコンテキストプロトコルの実装で、統一されたTypeScriptインターフェイスを通じて、LLMがBlender、Maya、Unrealなどの複数のプラットフォーム間でやり取りできるようになります。
Rhino MCPサーバープロジェクトは、Claude AIとRhino 3Dの相互作用を実現し、3Dオブジェクトの作成と操作をサポートします。
MCP 3Dプリンターサーバーは、Claudeと複数の3Dプリンター管理システムを接続するミドルウェアで、OctoPrint、Klipper、Duetなどの主流のプラットフォームをサポートし、プリンター制御、ファイル管理、および高度なSTLモデル処理機能を提供します。
ゲームアセット生成ツールはAIモデルとMCPプロトコルを利用し、テキストプロンプトによって迅速に2Dおよび3Dゲームリソースを生成します。
GH_mcp_serverはLLMを通じて直接RhinoとGrasshopperと対話できるツールで、3DMファイルの分析、3Dモデリング、GrasshopperのGHPythonコードの自動生成をサポートします。
RhinoMCPは、Rhino3DとClaude AIを接続する統合プロジェクトであり、Model Context Protocolを通じてAI支援の3Dモデリング、分析、および設計ワークフローを実現します。
このプロジェクトは、Claude AIとUnreal Engine 5を接続するPythonサーバーで、自然言語命令を通じてUE5シーン内の3Dオブジェクトとブループリントアクターの作成、修正、および制御を実現します。