アップル社の機械学習研究チームは最近、「STARFlow」という新しいAI画像生成システムを開発しました。この技術は現在主流の拡散モデルに挑戦する可能性があり、DALL-E や Midjourney などの人気のある画像生成器の中心となるものです。この画期的な進展は先週掲載された研究論文で詳しく説明されており、研究チームは開発過程で複数の学術機関と協力しました。

image.png

STARFlow の核心的なイノベーションは、正則化フローと自己回帰変換器を組み合わせることです。研究チームによると、この方法は高解像度画像生成において競争力のある性能を実現しています。研究チームのメンバーが指摘したように、STARFlow が高解像度画像生成に成功したことは、この分野における重要な進歩を示しています。

アップルは人工知能分野でますます競争圧力を受けている状況です。月曜日に開催された世界開発者会議でアップルはいくつかのアップデートを発表しましたが、外部からはそれほど大きな変化とは見なされていません。一方で、グーグルやOpenAIが生成型AIにおいて進展を見せたことでより注目を集めています。

技術的な詳細について、STARFlow は「深さと浅さの設計」を採用して、既存の正則化フロー手法の制限を克服しています。この設計では、大部分のモデルのパフォーマンスを捉えるために深い変換器ブロックを使用し、同時に計算効率の高い少量の浅い変換器ブロックも使用します。さらに、STARFlow は予訓練された自己符号化器の潜在空間で動作し、画像の圧縮表現を処理することで効率を向上させています。

従来の拡散モデルとは異なり、STARFlow は正則化フローの数学的特性を保持しており、連続空間内で「正確な最大尤度トレーニング」を実現でき、離散化処理を必要としません。この特徴は、生成内容を正確に制御する必要があるアプリケーションにおいて非常に重要であり、特に企業応用やデバイス内でのAI機能開発において重要です。

アップルは、AI能力の向上を推進するために、リーディングな学術機関と協力し続けています。この研究の共著者の一人であるジョージアテクノロジー大学の博士課程生Tianrong Chenは、この分野で豊富な専門知識を持っています。研究チームは、彼らのモデルが、性能を向上させるために数学的可操作性を犠牲にする混合手法とは異なるエンドツーエンドの正則化フローであることを強調しています。

この技術研究は学術的に顕著な進展を遂げましたが、アップルがこれらの研究成果を実際に消費者向け機能として転換できるかどうかは依然として疑問です。iPhoneなどの製品でトレンドをリードした企業にとって、革新のスピードは特に重要です。

論文:https://arxiv.org/pdf/2506.06276

ポイント:

🌟 STARFlow はアップルが新たに開発したAI画像生成システムで、DALL-E や Midjourney などの主流モデルと競争できます。

💡 このシステムは正則化フローと自己回帰変換器を組み合わせており、深さと浅さの設計および潜在空間の操作によって生成効率を向上させています。

📈 アップルは学術機関と協力しながらAI技術の進歩を推進しており、今後の実際の応用での成果が期待されています。