Los nodos y su flujo de trabajo asociado están completamente desarrollados por Kijai. Damos todo el crédito a Kijai por este trabajo innovador. En la plataforma RunComfy, simplemente estamos presentando las contribuciones de Kijai a la comunidad. Es importante señalar que actualmente no existe una conexión formal o asociación entre RunComfy y Kijai. ¡Apreciamos profundamente el trabajo de Kijai!
Tora introduce un marco novedoso para generar videos de alta calidad al aprovechar la guía basada en trayectoria en un modelo de transformador de difusión. Al centrarse en las trayectorias de movimiento, Tora logra una síntesis de video más realista y temporalmente coherente. Este enfoque cierra la brecha entre el modelado espacial-temporal y los marcos de difusión generativa.
Tenga en cuenta que esta versión de Tora se basa en el modelo CogVideoX-5B y está destinada únicamente para fines de investigación académica. Para detalles de licencia, consulte .
Este es el flujo de trabajo de CogVideoX Tora, los nodos del lado izquierdo son entradas, los del medio son nodos de procesamiento tora, y los de la derecha son el nodo de salidas.
[!CAUTION] Solo funcionarán las imágenes en formato horizontal de dimensiones 720*480. Otras dimensiones darán error.
Positivo
: Ingresa las acciones que ocurren con el Sujeto basado en la Trayectoria definida en el nodo de trayectoria (moviendo, fluyendo....etc).Negativo
: Ingresa lo que no deseas que suceda (manos distorsionadas, borroso...etc)Aquí estableces la ruta de Trayectoria del movimiento del sujeto en la foto cargada.
points_to_sample
: Esto establece el número de fotogramas para la renderización, o la duración de tu video en fotogramas.mask_width
: El valor predeterminado es 720. ¡NO CAMBIAR!mask_height
: El valor predeterminado es 480. ¡NO CAMBIAR!Guía de Nodo:
Alternar visibilidad de los manejadores
Método_de_muestreo:
Estos son los nodos de descarga de modelos, descargará automáticamente los modelos en tu comfyui en 2-3 minutos.
Pasos
: Este valor decide la calidad de tu render. Mantén entre 25 - 35 para el mejor y más eficiente valor.cfg
: El valor predeterminado es 6.0 para el muestreo de CogVideo.fuerza de desruido
y Programador
: No cambies esto.Este nodo establecerá la fuerza de tu trayectoria de movimiento.
fuerza
: Un valor alto dará una figura distorsionada o un punto volador. Usar entre 0.5 - 0.9.start_percent
: Usa este valor para suavizar el efecto de la fuerza de movimiento.end_percent
: - Un valor alto dará una figura distorsionada o un punto volador. Usar entre 0.3 - 0.7Estos nodos te darán 3 salidas.
"CogVideoX Tora: Transformador de Difusión Orientado a la Trayectoria para Generación de Video" presenta un enfoque innovador para la generación de video al introducir una guía basada en trayectoria dentro de un marco de transformador de difusión. A diferencia de los modelos tradicionales de síntesis de video que luchan por mantener la consistencia temporal y el movimiento realista, CogVideoX Tora se enfoca explícitamente en modelar trayectorias de movimiento. Esto permite al sistema generar videos coherentes y visualmente convincentes al comprender cómo los objetos y elementos evolucionan con el tiempo. Al combinar el poder de los modelos de difusión, conocidos por la generación de imágenes de alta calidad, con las capacidades de razonamiento temporal de los transformadores, CogVideoX Tora cierra la brecha entre el modelado espacial y temporal.
El mecanismo orientado a la trayectoria de CogVideoX Tora proporciona un control de grano fino sobre los movimientos de los objetos e interacciones dinámicas, haciéndolo particularmente adecuado para aplicaciones que requieren una guía de movimiento precisa, como edición de video, animación y generación de efectos especiales. La capacidad del modelo para mantener la consistencia temporal y transiciones realistas mejora su aplicabilidad en la creación de contenido de video suave y coherente. Al integrar priors de trayectoria, CogVideoX Tora no solo mejora la dinámica del movimiento sino que también reduce los artefactos que a menudo se ven en la generación basada en fotogramas. Este avance establece un nuevo punto de referencia para la síntesis de video, ofreciendo una herramienta poderosa para creadores y desarrolladores en campos como la cinematografía, realidad virtual e IA basada en video.
© Derechos de autor 2024 RunComfy. Todos los derechos reservados.