ミシガン大学研究チームが発表したAI拡散モデルが、ソーシャルメディアで大きな話題になっています。
マリリン・モンローがアインシュタインに変身する錯視効果は圧巻です。このモデルはノイズ平均化の原理を利用し、画像に拡散モデル処理を施すことで新たなノイズ画像を生成し、様々な角度からの画像表現を実現しています。
無料版のColabで試用可能です。作者による使用テクニックも公開されていますが、プロンプト(指示文)には高度な要求が求められます。
ミシガン大学研究チームが発表したAI拡散モデルが、ソーシャルメディアで大きな話題になっています。
マリリン・モンローがアインシュタインに変身する錯視効果は圧巻です。このモデルはノイズ平均化の原理を利用し、画像に拡散モデル処理を施すことで新たなノイズ画像を生成し、様々な角度からの画像表現を実現しています。
無料版のColabで試用可能です。作者による使用テクニックも公開されていますが、プロンプト(指示文)には高度な要求が求められます。
【AIデイリー】へようこそ!ここは、毎日人工知能の世界を探求するためのガイドです。毎日、開発者に焦点を当て、技術トレンドを洞察し、革新的なAI製品アプリケーションを理解するのに役立つ、AI分野のホットなコンテンツをお届けします。
拡散モデルを用いたテクスチャ3D誘導による動画試着を実現する革新技術「3DV-TON(Textured3D-Guided Consistent Video Try-on via Diffusion Models)」が正式に発表されました。AIbaseの情報によると、3DV-TONは高度な3D幾何学とテクスチャモデリングを動画拡散モデルと組み合わせることで、動画における衣服の一貫性と現実感を確保し、eコマース、ファッション、仮想現実分野に新たな可能性をもたらします。
Ostrisチームは、ComfyUIワークフローへの統合を目的とした、8億パラメーターのテキストツーイメージ拡散モデルであるFlex.2-previewを発表しました。AIbaseによると、このモデルは、線、ポーズ、深さに関する制御された生成能力に優れており、汎用的な制御と画像修復機能をサポートしています。Flux.1SchnellからOpenFlux.1、Flex.1-alphaまでの微調整進化の道を継承しています。Flex.2-previewはHu…
2025年4月21日、Sand AIはオープンソースのビデオ生成モデルMAGI-1を発表しました。革新的な自己回帰拡散アーキテクチャと卓越した性能により、生成AI分野の注目を集めています。このモデルはApache 2.0ライセンスで提供され、コード、ウェイト、推論ツールはGitHubとHugging Faceで公開されており、世界中の開発者に強力な創作ツールを提供します。MAGI-1は拡散トランスフォーマーアーキテクチャに基づいており、ブロック因果関係注意機構と並列注意機構を導入しています。
Ghiblio.artは、写真をジブリ風の芸術作品に変換することに特化したオンラインAIツールです。スタジオジブリは、『千と千尋の神隠し』や『となりのトトロ』などの名作で知られる、手描き風の柔らかい色調と幻想的な雰囲気のシーンが特徴的なスタジオです。Ghiblio.artは高度なAIアルゴリズムを使用して、ユーザーがアップロードした写真を自動的にジブリ風のイラストに変換し、通常の画像に夢のようなアニメーションの質感を与えます。AIbaseの情報によると、ユーザーは写真をアップロードして、オプションを選択するだけで…
最近のTEDインタビューで、OpenAIのCEOであるSam Altman氏は、AIシステムがアーティストの独特のスタイルを使用する場合の補償問題に関して見解を示しましたが、具体的な解決策は提示しませんでした。OpenAIは現在、存命のアーティストのスタイルを模倣した画像の生成を禁止していますが、Altman氏は、将来的にはアーティストが参加を選択し、報酬を得られるようなモデルを採用する可能性を示唆しました。新しいモデルを見つけるのは素晴らしいことだと思います。もしあなたが「このアーティストのスタイルで作品を作りたい」と言い、彼らが参加を選択すれば、それは可能になるでしょう。
人工知能分野に新たな輝く星が加わりました!このほど、ファーウェイ諾亞方舟研究所と香港大学自然言語処理グループ(HKU NLP Group)は、Dream7Bと呼ばれる新しい言語モデルを共同で発表しました。このモデルは、これまでで最も強力なオープンソース拡散大規模言語モデルと称賛されています。Dream7Bの登場は、既存の拡散言語モデルを性能面で凌駕するだけでなく、汎用能力、数学、コード、計画能力においても、同規模の最先端の自己回帰(AR)言語モデルに匹敵、あるいはそれを上回っています。
近年、ジブリスタジオ風のAIアート作品がソーシャルメディアで急速に拡散。多くのユーザーがAIツールを利用して、新たな画像の生成や既存写真の再現を行い、この日本のアニメーションスタジオ特有のスタイルを表現しています。しかし、このブームは、鑑賞と剽窃の境界線はどこにあるのかという疑問を投げかけています。3月31日、OpenAIがChatGPTに新たな機能を追加し、より詳細な画像生成を可能にしたことで、AIアートのブームに拍車がかかりました。ASUのサンデビルフィットネスセンターなどもその例です。
コードの力と芸術的インスピレーションが出会う時、次世代の人工知能は創造の世界の境界を静かに変えつつあります。最近、国産オープンソース画像生成モデルHiDream-I1が衝撃的な発表をしました。17億パラメーターという技術的基盤を誇るこのAIペインターは、HiDream-aiチームが力を注いで開発したもので、急速にテクノロジー界の寵児となっています。この拡散モデル技術に基づいたオープンソース画像生成ツールは、テキストの説明を高品質な画像に変換でき、ディテール描写と画像の一貫性において注目すべき能力を示しています。初期テストの結果、Hi