11月7日、OpenAIは初の開発者会議を開催し、数々の重要な製品を発表しました。その中には、新しいデコーダーであるConsistencyDecoderと、最新の言語認識モデルであるWhisper v3の2つのオープンソース製品も含まれています。これらの製品は、Stable Diffusionのパフォーマンスを大幅に向上させました。
ConsistencyDecoderは、Stable Diffusion VAEデコーダーに代わるもので、テキスト、顔、直線などの画像において大幅な改善が見られます。Whisper large-v3は、様々な言語における性能を向上させています。
Consistency Modelsは、ノイズをデータ分布に直接マッピングするため、反復処理なしで高品質な画像を生成できます。



