テキストから3Dモデル生成 CSM - テキスト、画像、動画から3Dモデル作成

站长之家
この記事はAIbaseデイリーからのものです
【AIデイリー】へようこそ!ここは、毎日人工知能の世界を探求するためのガイドです。毎日、開発者に焦点を当て、技術トレンドを洞察し、革新的なAI製品アプリケーションを理解するのに役立つ、AI分野のホットなコンテンツをお届けします。
【AIデイリー】へようこそ!ここは、毎日人工知能の世界を探求するためのガイドです。毎日、開発者に焦点を当て、技術トレンドを洞察し、革新的なAI製品アプリケーションを理解するのに役立つ、AI分野のホットなコンテンツをお届けします。
3Dモデリング技術に革命が起こりました!北京大学、字節跳動、およびカーネギーメロン大学が共同で開発したPartCrafterプロジェクトが正式に公開されました。このプロジェクトは、単一のRGB画像から高精度で構造化された3Dモデルを作成できるもので、「まず分割してから再構築する」という従来の複雑な工程を根本的に変革します。この技術は作成効率を向上させるだけでなく、見えない構造物の3D幾何学を推定する能力も持っています。これにより、AIが3D生成分野でいかなる可能性を秘めているかが明らかになりました。AIbase編集チームが最新情報をまとめ、PartCrafterの詳細な解説をお届けします。
先ごろ、グーグル ディープマインドのチームとブラウン大学は、『力プロンプティング』と呼ばれる新しい技術を開発しました。この技術は、3Dモデルや物理エンジンがなくても本物そっくりの動きを再現できるものであり、人工知能によるビデオ生成分野における大きな進展を示しています。この技術を使用すると、ユーザーは力の方向と強度を指定するだけで、AIによって生成されたビデオコンテンツを制御できます。力プロンプティング技術は、全体的な力(例:全体風力)や局所的な力を適用することができます。
Hugging Faceは先日、2025年4月第2週の人気モデルランキングを発表しました。テキスト生成、画像生成、動画生成など、マルチモーダル領域を網羅し、AI技術の急速な進化と多様な応用を示しています。AIbaseの調べによると、今回のランキングのモデルは、オープンソースコミュニティの革新性を示すだけでなく、低精度トレーニングからマルチモーダル生成までの技術トレンドを反映しています。以下はランキングのハイライト分析です。AIbase編集チームによる専門的な解説をお届けします。テキスト生成モデル:効率性と専門性の両立
UAEは最近、法律作成にAI技術を活用する世界初の取り組みを発表しました。これは、法律制定の効率を大幅に向上させることを目的としています。この革新的な取り組みによって、法律案の作成時間を最大70%短縮できると予想されています。UAEの法的枠組みの中で、政府はAIの強力な分析能力を活用し、現代社会のニーズに応える法律テキストを迅速に作成することを目指しています。画像の出典:AI生成画像、画像ライセンスプロバイダーMidjourneyUAE当局によると、この技術は立法プロセスを加速させるだけでなく、法律の質の向上にも貢献するとのことです。
人工知能分野に新たな輝く星が加わりました!このほど、ファーウェイ諾亞方舟研究所と香港大学自然言語処理グループ(HKU NLP Group)は、Dream7Bと呼ばれる新しい言語モデルを共同で発表しました。このモデルは、これまでで最も強力なオープンソース拡散大規模言語モデルと称賛されています。Dream7Bの登場は、既存の拡散言語モデルを性能面で凌駕するだけでなく、汎用能力、数学、コード、計画能力においても、同規模の最先端の自己回帰(AR)言語モデルに匹敵、あるいはそれを上回っています。
近年、AIクリエイティブプラットフォームのKreaは、Google Geminiのテキスト生成画像(Text-to-Image)と画像編集機能の統合を発表し、プラットフォームの生成能力とユーザーエクスペリエンスを大幅に向上させました。このアップデートにより、Kreaチャットインターフェースの実用性が大幅に向上し、単なる会話ツールから画像生成と編集を一体化した包括的な創作プラットフォームへと進化しました。この進歩は、AI駆動のクリエイティブデザイン分野におけるKreaの重要な一歩と見なされています。