ComfyUI > Flujos de trabajo > CogVideoX Tora | Modelo de Imagen a Video

CogVideoX Tora | Modelo de Imagen a Video

CogVideoX Tora combina las fortalezas de los modelos de difusión y transformadores al modelar explícitamente las trayectorias de movimiento, lo que permite un control preciso sobre los movimientos y dinámicas de los objetos en la generación de video. Este enfoque orientado a la trayectoria mejora la consistencia temporal y la fidelidad visual, haciendo de Tora un avance significativo para tareas como edición de video, síntesis y animación. Utilice el flujo de trabajo de CogVideoX Tora para crear videos dinámicos y lograr transiciones y movimientos fluidos en escenas animadas.

Los nodos ComfyUI-CogVideoXWrapper y su flujo de trabajo asociado están completamente desarrollados por Kijai. Damos todo el crédito a Kijai por este trabajo innovador. En la plataforma RunComfy, simplemente estamos presentando las contribuciones de Kijai a la comunidad. Es importante señalar que actualmente no existe una conexión formal o asociación entre RunComfy y Kijai. ¡Apreciamos profundamente el trabajo de Kijai!

ComfyUI CogVideoX Tora Flujo de trabajo

¿Quiere ejecutar este flujo de trabajo?

Flujos de trabajo completamente operativos
Sin nodos ni modelos faltantes
No se requiere configuración manual
Presenta visuales impresionantes

ComfyUI CogVideoX Tora Ejemplos

ComfyUI CogVideoX Tora Descripción

Los nodos y su flujo de trabajo asociado están completamente desarrollados por Kijai. Damos todo el crédito a Kijai por este trabajo innovador. En la plataforma RunComfy, simplemente estamos presentando las contribuciones de Kijai a la comunidad. Es importante señalar que actualmente no existe una conexión formal o asociación entre RunComfy y Kijai. ¡Apreciamos profundamente el trabajo de Kijai!

CogVideoX Tora

Tora introduce un marco novedoso para generar videos de alta calidad al aprovechar la guía basada en trayectoria en un modelo de transformador de difusión. Al centrarse en las trayectorias de movimiento, Tora logra una síntesis de video más realista y temporalmente coherente. Este enfoque cierra la brecha entre el modelado espacial-temporal y los marcos de difusión generativa.

Tenga en cuenta que esta versión de Tora se basa en el modelo CogVideoX-5B y está destinada únicamente para fines de investigación académica. Para detalles de licencia, consulte .

1.1 ¿Cómo usar el flujo de trabajo de CogVideoX Tora?

Tora

Este es el flujo de trabajo de CogVideoX Tora, los nodos del lado izquierdo son entradas, los del medio son nodos de procesamiento tora, y los de la derecha son el nodo de salidas.

Arrastra y suelta tu imagen horizontal en el nodo de entrada.
Escribe tus indicaciones de acción
Crea una ruta de trayectoria

1.2 Cargar Imagen de Entrada

Tora

Sube, arrastra y suelta o copia y pega (Ctrl+V) tu imagen en el nodo de carga de imagen

[!CAUTION] Solo funcionarán las imágenes en formato horizontal de dimensiones 720*480. Otras dimensiones darán error.

1.3 Agrega tus Indicaciones Positivas y Negativas

Tora

Positivo: Ingresa las acciones que ocurren con el Sujeto basado en la Trayectoria definida en el nodo de trayectoria (moviendo, fluyendo....etc).
Negativo: Ingresa lo que no deseas que suceda (manos distorsionadas, borroso...etc)

1.4 Crea Trayectoria para el movimiento

Tora

Aquí estableces la ruta de Trayectoria del movimiento del sujeto en la foto cargada.

points_to_sample: Esto establece el número de fotogramas para la renderización, o la duración de tu video en fotogramas.
mask_width: El valor predeterminado es 720. ¡NO CAMBIAR!
mask_height: El valor predeterminado es 480. ¡NO CAMBIAR!

Guía de Nodo:

Shift + clic para agregar un punto de control al final. Ctrl + clic para agregar un punto de control (subdividir) entre dos puntos.
Clic derecho en un punto para eliminarlo.
Nota que no puedes eliminar desde el inicio/final.
Clic derecho en el lienzo para el menú contextual:
Estas son opciones puramente visuales, no afectan la salida:

Alternar visibilidad de los manejadores

Mostrar puntos de muestra: mostrar los puntos que se devolverán.
El valor de points_to_sample establece el número de muestras
devuelto desde la propia spline dibujada, esto es independiente de los
puntos de control reales, por lo que el tipo de interpolación importa.

Método_de_muestreo:

tiempo: muestras a lo largo del eje de tiempo, usado para horarios
ruta: muestras a lo largo de la propia ruta, útil para coordenadas

1.5 Cargar Modelos de CogVideoX & Tora

Tora

Estos son los nodos de descarga de modelos, descargará automáticamente los modelos en tu comfyui en 2-3 minutos.

1.6 Muestrador de CogVideo

Tora

Pasos: Este valor decide la calidad de tu render. Mantén entre 25 - 35 para el mejor y más eficiente valor.
cfg: El valor predeterminado es 6.0 para el muestreo de CogVideo.
fuerza de desruido y Programador: No cambies esto.

1.7 Pesos y Fuerza de Trayectoria

Tora

Este nodo establecerá la fuerza de tu trayectoria de movimiento.

fuerza: Un valor alto dará una figura distorsionada o un punto volador. Usar entre 0.5 - 0.9.
start_percent: Usa este valor para suavizar el efecto de la fuerza de movimiento.
end_percent: - Un valor alto dará una figura distorsionada o un punto volador. Usar entre 0.3 - 0.7

1.8 Salidas

Tora

Estos nodos te darán 3 salidas.

Video Renderizado de Salida
Ruta de trayectoria sobrepuesta en el video renderizado
Video de Trayectoria en fondo negro

"CogVideoX Tora: Transformador de Difusión Orientado a la Trayectoria para Generación de Video" presenta un enfoque innovador para la generación de video al introducir una guía basada en trayectoria dentro de un marco de transformador de difusión. A diferencia de los modelos tradicionales de síntesis de video que luchan por mantener la consistencia temporal y el movimiento realista, CogVideoX Tora se enfoca explícitamente en modelar trayectorias de movimiento. Esto permite al sistema generar videos coherentes y visualmente convincentes al comprender cómo los objetos y elementos evolucionan con el tiempo. Al combinar el poder de los modelos de difusión, conocidos por la generación de imágenes de alta calidad, con las capacidades de razonamiento temporal de los transformadores, CogVideoX Tora cierra la brecha entre el modelado espacial y temporal.

El mecanismo orientado a la trayectoria de CogVideoX Tora proporciona un control de grano fino sobre los movimientos de los objetos e interacciones dinámicas, haciéndolo particularmente adecuado para aplicaciones que requieren una guía de movimiento precisa, como edición de video, animación y generación de efectos especiales. La capacidad del modelo para mantener la consistencia temporal y transiciones realistas mejora su aplicabilidad en la creación de contenido de video suave y coherente. Al integrar priors de trayectoria, CogVideoX Tora no solo mejora la dinámica del movimiento sino que también reduce los artefactos que a menudo se ven en la generación basada en fotogramas. Este avance establece un nuevo punto de referencia para la síntesis de video, ofreciendo una herramienta poderosa para creadores y desarrolladores en campos como la cinematografía, realidad virtual e IA basada en video.

¿Quiere más flujos de trabajo de ComfyUI?

CogVideoX-5B | Modelo Avanzado de Texto a Video

CogVideoX-5B: Modelo avanzado de texto a video para la generación de videos de alta calidad.

AnimateDiff + ControlNet | Estilo de dibujos animados

Dale a tus videos un toque divertido transformándolos en dibujos animados llenos de vida.

IPAdapter Plus (V2) + AnimateLCM | Morph de ipiv

Usa IPAdapter Plus, ControlNet QRCode, y AnimateLCM para crear videos de morphing rápidamente.

Video de Reiluminación de Producto | Vid2Vid

Ingrese un video y máscaras de luz para generar un video de reiluminación

Retrato en Vivo Avanzado | Control de Parámetros

Usa parámetros personalizables para controlar cada característica, desde parpadeos hasta movimientos de cabeza, para obtener resultados naturales.

ComfyUI Img2Vid | Animación de Morphing

Animación de morphing con los módulos AnimateDiff LCM, IPAdapter, QRCode ControlNet y Custom Mask.

Flux Consistent Characters | Input Image

Crea personajes consistentes y asegúrate de que se vean uniformes utilizando tus imágenes.

SVD + IPAdapter V1 | Imagen a video

Utilice IPAdapters para la generación de imágenes estáticas y Stable Video Diffusion para la generación dinámica de video.