El Instituto de Investigación de Inteligencia Artificial de Beijing (BAAI) anunció recientemente el lanzamiento de OmniGen, un nuevo modelo de generación de imágenes con capacidades completas, que representa un gran avance en el campo de la generación de imágenes. OmniGen se caracteriza por su uniformidad, simplicidad y capacidad de transferencia de conocimiento entre tareas, pudiendo manejar diversas tareas de generación de imágenes en un solo marco, incluyendo texto a imagen, edición de imágenes, generación dirigida por temas y generación condicionada visualmente.

La principal ventaja de OmniGen radica en su arquitectura simplificada y su facilidad de uso. Los usuarios pueden realizar tareas complejas de generación de imágenes con instrucciones sencillas, sin necesidad de plugins adicionales o pasos de procesamiento complejos. Este aprendizaje en formato unificado permite a OmniGen transferir eficazmente el conocimiento entre diferentes tareas, abordar tareas y campos desconocidos y mostrar nuevas funcionalidades.
Las capacidades de OmniGen no se limitan a lo anterior, sino que también incluyen capacidades básicas de procesamiento de imágenes como la eliminación de ruido y la extracción de bordes. Los pesos y el código del modelo se han publicado como código abierto para que los usuarios puedan explorar las capacidades de OmniGen y ajustarlo según sus necesidades. El Instituto de Investigación de Beijing ha creado X2I, un conjunto de datos de generación de imágenes unificado, a gran escala y diverso, que contiene aproximadamente 100 millones de imágenes y que se publicará como código abierto en el futuro para impulsar el desarrollo del campo de la generación de imágenes universales.
Enlaces relacionados:
Artículo: https://arxiv.org/pdf/2409.11340
Código: https://github.com/VectorSpaceLab/OmniGen
Demo: https://huggingface.co/spaces/Shitao/OmniGen





