Noticias de IA

No te pierdas ningún momento de la innovación global en IA

IA Diario

Tendencias diarias de la industria de la IA en tres minutos

Cronología de la IA

Hitos de la industria de la IA

Al hardware

lista todos los productos de hardware AI.

Guía de Monetización de la IA

Últimos Casos

Compartiendo casos de monetización de IA

Colección de Imágenes

Casos de monetización de creación de imágenes con IA

Colección de Videos

Casos de monetización de creación de videos con IA

Colección de Audio

Casos de monetización de creación de audio con IA

Colección de Contenido

Casos de monetización de redacción de contenido con IA

Tutoriales de IA

Últimos Tutoriales

Compartiendo gratuitamente los últimos tutoriales de IA

Rankings de Productos de IA

Ranking de Productos de IA

Muestra el ranking de visitas totales de sitios web de IA

Ranking de Crecimiento de Tráfico de IA

Rastrea los sitios web de IA de más rápido crecimiento por tráfico

Ranking de Descenso de Tráfico de IA

Se centra en los sitios web de IA con descensos de tráfico significativos

Ranking Semanal de IA

Muestra el ranking semanal de visitas de sitios web de IA

Rankings de Países Populares

Estados Unidos

Sitios web de IA más populares entre los usuarios estadounidenses

China

Sitios web de IA más populares entre los usuarios chinos

India

Sitios web de IA más populares entre los usuarios indios

Brasil

Sitios web de IA más populares entre los usuarios brasileños

Rankings de Categorías Populares

Generación de Imágenes

Ranking total de visitas de sitios web de generación de imágenes con IA

Asistente Personal

Ranking total de visitas de sitios web de asistentes personales con IA

Generación de Personajes

Ranking total de visitas de sitios web de generación de personajes con IA

Generación de Videos

Ranking total de visitas de sitios web de generación de videos con IA

Rankings de Datos de Código Abierto Populares

Ranking de Proyectos de IA

Proyectos de IA populares en GitHub por estrellas totales

Ranking de Crecimiento de Proyectos de IA

Proyectos de IA populares en GitHub por tasa de crecimiento

Ranking de Desarrolladores de IA

Ranking de desarrolladores de IA populares en GitHub

Ranking de Organizaciones de IA

Ranking de organizaciones de IA populares en GitHub

Categorías de Código Abierto Populares

Deepseek

Proyectos de código abierto de Deepseek populares en GitHub

TTS

Proyectos de código abierto de TTS populares en GitHub

LLM

Proyectos de código abierto de LLM populares en GitHub

ChatGPT

Proyectos de código abierto de ChatGPT populares en GitHub

Biblioteca de Proyectos de Código Abierto de IA

Visión General

Visión general de los proyectos de código abierto de IA populares en GitHub

Biblioteca de productos Navegación de herramientas MCP

Análisis del flujo de trabajo de ComfyUI: Conversión de fotos a avatares retro

站长素材

Publicado elNoticias de IA · 9 minutos de lectura · Jul 18, 2024

242

Este caso integra todo lo que hemos aprendido anteriormente, por lo que es perfecto para repasar y profundizar en la comprensión.

Si no has visto los tutoriales anteriores, puedes visitar el sitio web de tutoriales de IA de Estación de Material para verlos.

Enlace del sitio web: https://aisc.chinaz.com/jiaocheng/

_x0000_i1026

Este flujo de trabajo utiliza ComfyUI para convertir fotos en imágenes de estilo anime retro. A continuación, se ofrece un análisis detallado de cada nodo en este flujo de trabajo y sus funciones:

Análisis de nodos

1. Carga y preprocesamiento de imágenes:

LoadImage (id: 13): Carga la imagen de entrada de la URL especificada.

DF_Get_image_size (id: 15): Obtiene el ancho y la altura de la imagen cargada.

EmptyLatentImage (id: 5): Crea una imagen latente vacía con las dimensiones extraídas.

2. Cargador y preprocesador de ControlNet:

ControlNetLoader (id: 28): Carga el modelo ControlNet para líneas (control_v11p_sd15_lineart.pth).

ControlNetLoader (id: 30): Carga el modelo ControlNet para detección de postura (control_v11p_sd15_openpose.pth).

ControlNetLoader (id: 27): Carga el modelo ControlNet para detección de profundidad (control_v11f1p_sd15_depth.pth).

Zoe_DepthAnythingPreprocessor (id: 40): Procesa la imagen para generar información de profundidad.

Inference_Core_LineArtPreprocessor (id: 42): Procesa la imagen para generar información de líneas.

OpenposePreprocessor (id: 39): Procesa la imagen para generar puntos clave de postura.

3. Aplicación y combinación de condiciones:

ControlNetApply (id: 26, 29, 31): Aplica las condiciones de ControlNet a la imagen, combinando información de profundidad, líneas y postura.

ConditioningCombine (id: 37): Combina diferentes informaciones de condiciones.

4. Codificación de texto:

CLIPTextEncode (id: 6): Codifica el texto descriptivo positivo, por ejemplo, "hermoso paisaje natural botella de vidrio paisaje, botella de galaxia morada".

CLIPTextEncode (id: 7): Codifica el texto descriptivo negativo, por ejemplo, "Negativo fácil, peor calidad, baja calidad", etc.

CLIPTextEncode (id: 34): Codifica el texto descriptivo adicional, por ejemplo, "arte oficial, arte contextual, anime retro, fondo complejo, fondo borroso, profundidad de campo".

5. Carga y muestreo del modelo:

CheckpointLoaderSimple (id: 4): Carga el modelo de generación principal (AWPainting(1.4)).

LoraLoader (id: 10, 16): Carga los modelos Lora para ajustes de estilo específico (por ejemplo, "80'sFusion(V2.0)" y "Retro Anime(1.0)").

KSampler (id: 3): Utiliza KSampler para el muestreo de imágenes latentes, combinando el modelo, las condiciones positivas y negativas y la imagen latente.

VAEDecode (id: 8): Decodifica la imagen latente muestreada en la imagen final.

6. Guardar imagen:

SaveImage (id: 9): Guarda la imagen generada.

Instrucciones de uso

Como el flujo de trabajo de ComfyUI es bastante complejo, aquí proporciono el flujo de trabajo directamente y explico los puntos clave para ayudarles a organizar la lógica. Si necesitan este flujo de trabajo, pueden escanear el código QR al final para unirse al grupo y obtenerlo. Si tienen alguna duda, también pueden unirse al grupo para intercambiar ideas.

La primera vez que utilicen el flujo de trabajo, es posible que aparezca un error que indique que faltan nodos. En el administrador, instalen los nodos que faltan.

Cargar Lora

El modelo grande enlaza dos Lora.

Palabras clave inversas

Si no tienen WD14 para la inferencia de palabras clave, pueden buscar e instalar WD en el administrador. La codificación de texto de clip debe cambiarse a entrada de texto para poder conectarse con las palabras clave inferidas por WD.

Control de ControlNet

Aquí se utilizan tres ControlNet en serie: mapa de profundidad, líneas y control de postura.

Obtener el ancho y alto de la imagen

Combinar palabras clave

Como nuestros modelos Lora necesitan algunas palabras clave de activación, pero el codificador de texto anterior ya está conectado con WD, solo podemos copiar otro codificador de texto y combinar el codificador de texto de las palabras clave de WD. Finalmente, conectamos la condición combinada a la primera aplicación de ControlNet.

Efecto del flujo de trabajo

Los pasos principales de este flujo de trabajo son cargar y preprocesar imágenes, aplicar diferentes modelos ControlNet para generar información auxiliar (como profundidad, líneas y postura), y luego combinar esta información con descripciones de texto para generar imágenes. Finalmente, se decodifica y guarda la imagen generada en estilo anime retro. Si necesitan este flujo de trabajo, pueden escanear el código QR al final para unirse al grupo y obtenerlo.

------------------------------------------------------------------------------------------

Tutoriales de IA de Estación de Material es una plataforma de tutoriales de dibujo de IA de Estación de Material.

Gran cantidad de tutoriales de IA gratuitos, con contenido práctico actualizado continuamente.

Para aprender más tutoriales de dibujo de IA, visite el sitio web de tutoriales de IA de Estación de Material:

https://aisc.chinaz.com/jiaocheng/

ComfyUI Flujo de trabajo ComfyUI Tutorial para miembros AI

Este artículo proviene de AIbase Daily

¡Bienvenido a la columna [AI Diario]! Aquí está tu guía diaria para explorar el mundo de la inteligencia artificial. Todos los días te presentamos el contenido más destacado en el campo de la IA, centrándonos en los desarrolladores para ayudarte a comprender las tendencias tecnológicas y conocer las aplicaciones innovadoras de productos de IA.

—— Creado por el grupo AIbase Daily

Noticias de IA relacionadas recomendadas

Qwen VLo, el modelo de comprensión y generación multimodal unificado de Tongyi Qianwen

Recientemente, se lanzó oficialmente el modelo de gran dimensión multimodal Qwen VLo, logrando avances significativos en la comprensión y generación de contenido visual, brindando a los usuarios una nueva experiencia de creación visual. Según información proporcionada, Qwen VLo ha sido completamente actualizado basándose en las ventajas de la serie de modelos Qwen-VL anteriores. Este modelo no solo puede comprender 'el mundo' con precisión, sino que también puede realizar una recreación de alta calidad basada en esa comprensión, logrando así una transición real de la percepción a la generación. Los usuarios ahora pueden utilizar Qwen Chat (chat.qwen.ai)

Jun 28, 2025

¡Noticia importante! El primer gran modelo de código abierto en el mar de China, Cangyuan, ha aparecido, impulsando la era de la inteligencia oceánica

El primer modelo grande de código abierto en el ámbito marino de China, OceanGPT (Cangyuan), fue oficialmente lanzado en Hangzhou, Zhejiang. Este logro innovador fue desarrollado liderado por el Laboratorio Nacional de Tecnología de Percepción Oceánica Precisa de la Universidad de Zhejiang, marcando un importante paso adelante en el campo de la tecnología oceánica de China. OceanGPT tiene la capacidad básica de responder preguntas sobre conocimientos oceánicos, y puede interpretar datos multimodales como imágenes de sonar y mapas de observación oceánica mediante lenguaje natural. Esta habilidad permite que OceanGPT se desempeñe bien al manejar datos oceánicos complejos. Este modelo también utiliza

Jun 27, 2025

470

¡El futuro ya ha llegado! Hengbot presenta el robot perro Sirius, que puede bailar, jugar al fútbol y tener conversaciones inteligentes con AI

La empresa Hengbot presentó oficialmente su nuevo robot perro Sirius, que no solo destaca en movimientos ágiles, sino que también integra un modelo de lenguaje de gran tamaño de OpenAI, permitiéndole realizar conversaciones de voz, incluso bailar y jugar al fútbol, ¡es verdaderamente un «animal doméstico» talentoso! Según la presentación de Hengbot, el robot perro Sirius tiene la capacidad de moverse rápidamente, puede bailar al ritmo de la música y saludar a su dueño con un apretón de manos. Dentro de sus piernas y cabeza hay 14 ejes de movimiento, así como

Jun 27, 2025

740

Suno adquiere WavTool para fortalecer sus herramientas de edición de música con IA en medio de controversias sobre derechos de autor musicales

La empresa de música con inteligencia artificial Suno anunció el jueves que adquirió WavTool, una estación de trabajo digital basada en navegador (DAW) con inteligencia artificial. El objetivo es mejorar las capacidades de edición de Suno en la creación y producción de canciones. WavTool fue lanzado en 2023 y ofrece diversas funciones, incluida la separación de audio, generación de audio con IA y asistentes de música con IA. Se espera que se integre con la nueva interfaz de edición de Suno. Aunque los términos exactos de la adquisición no han sido revelados, un portavoz de la empresa comentó

Jun 27, 2025

410

Diario de IA del 27 de junio: Tencent libera como código abierto el modelo Huyuan-A13B ligero; Keling AI lanzará una función de efectos de sonido para videos

¡Bienvenido a la sección 【Diario de IA】 de AIbase! Tres minutos al día para conocer las principales noticias del día sobre IA, ayuda a comprender las tendencias del sector de la IA y las aplicaciones innovadoras de productos de IA. Más información sobre IA en: https://www.aibase.com/zh1. El modelo Huyuan-A13B ligero de Tencent se libera como código abierto, se puede implementar con una sola tarjeta de GPU de gama media o baja. Tencent ha lanzado un nuevo miembro de la familia de modelos de gran tamaño Huyuan, el modelo Huyuan-A13B, que utiliza una arquitectura de mezcla de expertos (MoE), con un tamaño total de parámetros de 80 mil millones y 13 mil millones de parámetros activados, grandes

Jun 27, 2025

Se revela la lista de unicornios globales! SpaceX, ByteDance y OpenAI se llevan los primeros puestos

Jun 27, 2025

Tencent libera un modelo ligero de HuanYuan-A13B, se puede implementar con una sola tarjeta GPU de gama media-baja

Tencent presenta oficialmente y libera un nuevo miembro de la familia de modelos grandes HuanYuan: el modelo HuanYuan-A13B. Este modelo utiliza una arquitectura basada en expertos mezclados (MoE), con un tamaño total de parámetros de 80 mil millones y parámetros activados de 13 mil millones. Mantiene el rendimiento de los modelos de código abierto de vanguardia, pero reduce significativamente el retraso de razonamiento y los costos computacionales, ofreciendo una solución de IA más rentable para desarrolladores individuales y pequeñas y medianas empresas.

Jun 27, 2025

Ling AI introduce una función de efectos de sonido para video, ofreciendo una experiencia inmersiva de ver y escuchar

Jun 27, 2025

¡Sorpresa total! Anthropic destruyó millones de libros para entrenar a la IA, ¡la disputa por derechos de autor se agrava!

Jun 27, 2025

OpenAI anuncia que el evento para desarrolladores de 2025 se celebrará en San Francisco y se espera que atraiga a más de 1500 desarrolladores

OpenAI ha anunciado oficialmente la fecha y lugar de su próxima convención para desarrolladores (DevDay), que tendrá lugar el 6 de octubre de 2025 en San Francisco. Este evento se espera que atraiga a más de 1500 desarrolladores y será el más grande hasta ahora. La agenda del DevDay incluirá múltiples actividades importantes. Habrá discursos temáticos en vivo, donde se compartirán las últimas actualizaciones y visión futura de OpenAI en el campo de la inteligencia artificial. Además, los participantes podrán

Jun 27, 2025