ComfyUI > Flujos de trabajo > ComfyUI PhotoMakerV2 | Crear Fotos Realistas

ComfyUI PhotoMakerV2 | Crear Fotos Realistas

ComfyUI PhotoMakerV2 es una poderosa herramienta de generación de texto a imagen que permite a los usuarios crear fotos personalizadas realistas de manera eficiente. Al ingresar imágenes de identidad y una indicación de texto, PhotoMakerV2 preserva la semejanza de los individuos mientras permite un control flexible sobre el contexto, estilo y atributos. Esta última versión ofrece una mejor fidelidad de identidad en comparación con su predecesor. Descubre las posibilidades creativas de generar imágenes fotorrealistas en diferentes entornos, estilizar apariencias e incluso fusionar identidades.

ComfyUI PhotoMakerV2 Flujo de trabajo

¿Quiere ejecutar este flujo de trabajo?

Flujos de trabajo completamente operativos
Sin nodos ni modelos faltantes
No se requiere configuración manual
Presenta visuales impresionantes

ComfyUI PhotoMakerV2 Ejemplos

comfyui-photomakerv2-create-realistic-photos-1109

ComfyUI PhotoMakerV2 Descripción

¿Qué es PhotoMakerV2

PhotoMakerV2, una actualización de PhotoMaker, ofrece un método eficiente para la generación de texto a imagen personalizada. Sintetiza fotos realistas de individuos usando unas pocas imágenes de identidad de entrada y una indicación de texto.

Algunas características clave de PhotoMakerV2 incluyen:

Alta eficiencia: Genera fotos personalizadas rápidamente.
Excelente preservación de identidad: Mantiene la semejanza de las identidades de entrada.
Control de texto flexible: Permite especificar el contexto, estilo, atributos, etc., en la indicación.
Mejor fidelidad de identidad: Mejorada en comparación con PhotoMaker V1. PhotoMakerV2 genera imágenes fotorrealistas de una persona en varios contextos, estiliza apariencias, cambia atributos como edad y género, fusiona identidades y moderniza personas de fotos antiguas o obras de arte. Desbloquea numerosas posibilidades creativas.

Cómo funciona PhotoMakerV2

PhotoMakerV2 codifica una o más imágenes de identidad de entrada en una "stacked ID embedding", que sirve como una representación unificada que encapsula la información de identidad.

Esta embedding, combinada con una indicación de texto, se alimenta a un modelo de difusión de texto a imagen. El modelo luego produce una imagen que muestra la identidad embebida en el contexto descrito por la indicación.

Algunos aspectos clave de cómo funciona internamente:

Utiliza un codificador de identidad para extraer información de identidad de las imágenes faciales de entrada
Mejora la preservación de identidad aprovechando un modelo externo de reconocimiento facial (InsightFace)
Codifica múltiples imágenes de identidad en una embedding apilada para capturar la identidad de manera integral
Alimenta la embedding de ID apilada en las capas de atención cruzada del modelo de difusión
Guía la generación con la indicación de texto mientras fusiona adaptativamente la información de identidad
Entrenado con un conjunto de datos orientado a la identidad para mejorar las capacidades de identificación

Cómo usar ComfyUI PhotoMakerV2

Para usar PhotoMakerV2 en ComfyUI, interactúa principalmente con el nodo PhotoMakerEncodePlus. Un flujo de trabajo típico implica:

Carga el modelo PhotoMakerV2 usando el nodo "PhotoMaker Loader Plus".
Carga una o más imágenes de identidad usando el nodo "Prepare Images For CLIP Vision".
Carga el modelo InsightFace requerido por PhotoMakerV2 usando el nodo "PhotoMaker InsightFace Loader".
Conecta las salidas de estos nodos a las entradas correspondientes del nodo "PhotoMaker Encode Plus".
En el nodo "PhotoMaker Encode Plus", especifica la indicación que describe la imagen deseada. Usa la palabra desencadenante especial en la indicación donde debería aparecer la identidad.
Conecta la salida de acondicionamiento de "PhotoMaker Encode Plus" a un nodo "KSampler" para generar la imagen.

Para más información, por favor visita y . Todo el crédito va a sus contribuciones.

¿Quiere más flujos de trabajo de ComfyUI?

CogVideoX-5B | Modelo Avanzado de Texto a Video

CogVideoX-5B: Modelo avanzado de texto a video para la generación de videos de alta calidad.

Animatediff V2 y V3 | Texto a Video

Explora AnimateDiff V3, AnimateDiff SDXL y AnimateDiff V2, y usa Upscale para resultados de alta resolución.

BRIA AI RMBG 1.4 vs Segment Anything | Eliminación de fondo

Elimina fondos de manera eficiente al comparar RMBG 1.4 de BRIA AI con Segment Anything.

AnimateDiff + ControlNet TimeStep KeyFrame | Animación de transformación

Establezca KeyFrames de tiempo de ControlNet, como el primer y último cuadro, para crear animaciones de transformación.

AnimateDiff + Programación de indicaciones por lotes | Texto a video

La programación de indicaciones por lotes con AnimateDiff ofrece un control preciso sobre la narrativa y los elementos visuales en la creación de animaciones.

Entrenamiento FLUX LoRA

Guíelo a través de todo el proceso de entrenamiento de modelos FLUX LoRA utilizando sus conjuntos de datos personalizados.

InstantID | De Rostro a Sticker

Utiliza Instant ID e IPAdapter para crear increíbles stickers de rostros personalizables.

SDXL Turbo | De Texto a Imagen Rápidamente

Experimenta una síntesis rápida de texto a imagen con SDXL Turbo.