上海交通大学博士、AI絵師が描く「コップに入ったアイスコーラ」に重大なバグを発見!
AI絵師が「コップに入ったアイスコーラ」のような特定のシーンを生成する際に困難に直面しており、テキストと画像の不一致の問題が明らかになりました。上海交通大学博士の趙峻図氏とそのチームは、最先端のAIモデルでさえ、透明なガラスのコップと従来の茶碗の違いなど、テキストの説明にある複雑な概念を正確に理解し、表現することが難しいことを発見しました。この問題を解決するために、彼らはMixture of Concept Experts(MoCE)という手法を提案し、大規模言語モデルを用いてAIが隠れた概念を理解し、テキストをより正確に制御できるようにしました。