Em 7 de novembro, a OpenAI realizou sua primeira conferência para desenvolvedores, lançando uma série de produtos importantes e abrindo o código-fonte de dois deles: o novo decodificador ConsistencyDecoder e o modelo de reconhecimento de voz Whisper v3. Esses produtos melhoraram significativamente o desempenho do Stable Diffusion.
O ConsistencyDecoder pode substituir o decodificador VAE do Stable Diffusion, proporcionando melhorias significativas em imagens de texto, rostos e linhas retas. O Whisper large-v3 melhorou o desempenho em diversas línguas. Os modelos de Consistência, por sua vez, mapeiam diretamente o ruído para a distribuição de dados, gerando imagens de alta qualidade sem a necessidade de um processo iterativo.





