ComfyUI > Fluxos de Trabalho > Transformação de Vídeo de Dança | Personalização de Cenário & Troca de Rosto

Transformação de Vídeo de Dança | Personalização de Cenário & Troca de Rosto

Este fluxo de trabalho Transformação de Vídeo de Dança combina o modelo SD1.5, AnimateDiff, ControlNet e a troca de rosto ReActor para entregar transformações de coreografia de alta qualidade. Ele preserva o movimento do dançarino usando orientação tripla do ControlNet (Edge, Depth e OpenPose), enquanto ReActor e CodeFormer garantem a troca de rosto precisa com fidelidade aprimorada. O fluxo de trabalho suporta controle dinâmico de cenário através de agendamento de prompts em lote, permitindo personalização específica de quadros. Com as opções de contexto do AnimateDiff e escalonamento adaptativo de movimento, garante a preservação suave e natural do movimento ao longo da transformação.

Agradecimentos especiais a JunkBoxAI por desenvolver cuidadosamente este fluxo de trabalho. Para mais visuais incríveis, não deixe de conferir seu Instagram.

ComfyUI Dance Video Transform Fluxo de Trabalho

Dance Video Transform | Scene Customization & Face Swap

Deseja executar este fluxo de trabalho?

Fluxos de trabalho totalmente operacionais
Sem nós ou modelos ausentes
Nenhuma configuração manual necessária
Apresenta visuais impressionantes

ComfyUI Dance Video Transform Exemplos

ComfyUI Dance Video Transform Descrição

O que o Workflow ComfyUI de Transformação de Vídeo de Dança Faz

O Workflow ComfyUI de Transformação de Vídeo de Dança transforma vídeos de dança em novos cenários deslumbrantes com troca de rosto profissional enquanto preserva a coreografia original e garante uma saída de alta qualidade. O processo acontece em etapas, desde a análise de movimento até a substituição de rosto, permitindo verificações de qualidade em cada etapa.

Como o Workflow ComfyUI de Transformação de Vídeo de Dança Funciona

O fluxo de trabalho transforma seu vídeo de dança automatizando essas transformações complexas em várias etapas, exigindo apenas seu vídeo, uma imagem de rosto e descrição do cenário: Análise de Movimento → Transferência de Estilo → Substituição de Rosto

Analisa movimentos de dança e informações espaciais
Transforma o cenário de acordo com sua descrição
Integra novo rosto mantendo as expressões

Principais Recursos do Workflow ComfyUI de Transformação de Vídeo de Dança

Otimizado para formato vertical (proporção 9:16)
Sistema triplo ControlNet para transformações estáveis
Troca de rosto profissional com mistura natural
Modo de teste rápido (processa 50 quadros em minutos)
Suporte para saída de alta resolução (até 896px de altura)
Preservação avançada de movimento usando AnimateDiff
Sistema de saída dupla para verificação de qualidade

Guia de Início Rápido

Passo 1: Configuração Inicial

Nos nós respectivos:

Carregar Vídeo (Upload):
- Carregue vídeo de dança de 10-15 segundos com proporção 9:16
- Se o seu vídeo não estiver em 9:16, você precisará ajustar os parâmetros de Largura e Altura para corresponder ao seu vídeo.
- Limite de Carregamento de Quadros: 50 (renderizar apenas os primeiros 50 quadros para teste rápido)
Carregar Imagem:
- Carregue foto clara de rosto frontal
Agendamento de Prompts em Lote:
- Descreva brevemente o cenário e quaisquer outros aspectos que deseja transformar
"0": "[pessoa] com camisa do KC Chiefs usando jeans azuis e boné de beisebol dançando no vestiário"
- Defina prompt negativo conforme necessário

Passo 2: Teste Rápido

Clique em "Queue Prompt"
Isso processa ~2 segundos de vídeo
Você verá duas saídas:
- Primeira saída: Apenas transformação de cenário
- Segunda saída: Com troca de rosto aplicada

Passo 3: Processamento Completo do Vídeo

Somente após o teste rápido parecer bom:

Retorne ao nó "Carregar Vídeo"
Altere o Limite de Carregamento de Quadros para 0 para vídeo completo
Clique em "Queue Prompt" para processamento completo (Isso levará significativamente mais tempo)

Dicas do para Iniciantes

Siga as Notas: Procure por notas na interface—elas o guiarão passo a passo
Não se Preocupe com Configurações Avançadas: Na maioria das vezes, você não precisa ajustar nada além do que é mencionado aqui
Importância da Proporção: Certifique-se de que a proporção está correta, caso contrário o vídeo pode parecer esticado ou cortado

Referência dos Nós Principais

Configurações do AnimateDiff

Os nós aqui criam preservação de movimento suave ao longo da transformação do vídeo. As Opções de Contexto definem como os quadros devem ser agrupados e processados, alimentando essas configurações para o Carregador AnimateDiff, que então aplica a preservação real do movimento. As configurações de comprimento e sobreposição de contexto afetam diretamente como o Carregador AnimateDiff mantém a consistência do movimento.

Nó de Opções de Contexto (#94): Alcança agrupamento de quadros e controle de processamento temporal para movimento consistente.
- comprimento_do_contexto:
  - Controla quantos quadros são processados juntos
  - Maior = mais suave, mas usa mais VRAM
  - Menor = mais rápido, mas pode perder coerência de movimento
- sobreposição_do_contexto:
  - Lida com a suavidade da transição de quadros
  - Maior = melhor mistura, mas processamento mais lento
  - Menor = mais rápido, mas pode mostrar lacunas de transição
- agendamento_do_contexto:
  - Controla a distribuição de quadros
  - "uniforme" é melhor para movimento de dança
  - Não altere a menos que haja necessidades específicas
- ciclo_fechado:
  - Controla o comportamento de loop de vídeo
  - Verdadeiro apenas para vídeos de loop perfeito
Nó Carregador AnimateDiff (#93): Implementa a preservação do movimento usando o modelo AnimateDiff e aplica consistência temporal.
- escala_de_movimento:
  - Controla a força do movimento
  - Maior: Movimento exagerado
  - Menor: Movimento atenuado
- agendamento_beta: lcm >> sqrt_linear
  - Controla o comportamento de amostragem
  - Otimizado para este fluxo de trabalho
  - Não modifique a menos que necessário

Pilha ControlNet

Os nós aqui mantêm a integridade do vídeo através de um sistema de orientação de três camadas. Os três ControlNets processam os quadros de entrada simultaneamente, cada um focando em diferentes aspectos. Soft Edge fornece estrutura básica, Depth adiciona compreensão espacial e OpenPose garante precisão de movimento. Os resultados se combinam através de empilhadores com força total não excedendo 1.4 para estabilidade.

Soft Edge ControlNet: Extrai e preserva elementos estruturais e formas dos quadros originais.
- Força:
  - Controla a preservação estrutural
  - Maior = adesão mais forte às formas originais
  - Menor = mais liberdade criativa na modificação de formas
- Percentual de Fim:
  - Quando a influência do controle para
  - Maior = influência mais longa ao longo do processo
  - Menor = permite mais desvio nas etapas posteriores
Depth ControlNet: Processa relações espaciais e mantém consistência 3D.
- Força:
  - Controla a consciência espacial
  - Maior = consistência 3D mais forte
  - Menor = mais liberdade artística com o espaço
- Percentual de Fim:
  - Mantém a duração da influência de profundidade
  - Deve coincidir com Soft Edge para consistência
OpenPose ControlNet: Captura e transfere informações de pose para movimento preciso.
- Força:
  - Controla a preservação da pose
  - Maior = seguimento de pose mais rigoroso
  - Menor = interpretação de pose mais flexível
- Percentual de Fim:
  - Mantém a influência da pose
  - Mantém o movimento natural ao longo do processo

Processamento de Rosto

Os nós aqui lidam com a substituição e aprimoramento de rosto para resultados naturais. O processo funciona em duas etapas: FaceRestore primeiro aprimora a qualidade do rosto original, depois ReActor realiza a troca usando o rosto aprimorado como referência. Este processo de duas etapas garante integração natural enquanto preserva as expressões.

Sistema FaceRestore: Aprimora detalhes faciais e prepara para a troca.
- Fidelidade:
  - Controla a preservação de detalhes na restauração
  - Maior = mais detalhado, mas potenciais artefatos
  - Menor = mais suave, mas pode perder detalhes
- Detecção:
  - Escolha do modelo de detecção de rosto
  - Confiável para a maioria dos cenários
  - Não mude a menos que rostos não sejam detectados
ReActor Face Swap: Realiza a substituição e mistura de rosto com preservação de expressões.
- Visibilidade:
  - Controla a visibilidade da troca
  - Maior = efeito de troca de rosto mais forte
  - Menor = mistura mais sutil
- Peso:
  - Equilíbrio de preservação de características faciais
  - Maior = características do rosto fonte mais fortes
  - Menor = melhor mistura com o alvo
- Nível de log do console:
  - Controla informações de depuração
  - Maior = logs mais detalhados

Detalhes Adicionais dos Nós

Entrada & Pré-processamento

Propósito: Carrega vídeo, ajusta dimensões e prepara modelo VAE para processamento.

Carregar Vídeo:
- Limite de Carregamento de Quadros:
  - Controla o número de quadros a serem processados
  - 50 = teste rápido (processa ~2 segundos)
  - 0 = processa vídeo inteiro
  - Afeta o tempo total de processamento
- Pular Primeiros Quadros:
  - Define ponto de início no vídeo
  - Maior = começa mais tarde no vídeo
  - Útil para pular introduções
- Selecionar Cada N-ésimo:
  - Controla a taxa de amostragem de quadros
  - Números maiores pulam quadros
  - 1 = usa todos os quadros
  - 2 = usa cada segundo quadro, etc.
Escala de Imagem:
- Largura: 512
  - Controla a largura do quadro de saída
  - Deve manter proporção 9:16 com altura
- Altura: 896
  - Controla a altura do quadro de saída
  - Deve manter proporção 9:16 com largura
- Método: nearest-exact
  - Melhor para manter a nitidez
  - Alternativas podem borrar o conteúdo
  - Recomendado para vídeos de dança
  - Não mude a menos que haja necessidades específicas
Carregador VAE:
- Modelo: vae-ft-mse-840000-ema-pruned
  - Otimizado para estabilidade e qualidade
  - Lida com codificação/decodificação de imagem
  - Razão de compressão equilibrada
  - Não mude a menos que haja necessidades específicas
- Modo VAE: Não mude
  - Otimizado para o fluxo de trabalho atual
  - Afeta a qualidade de codificação

Processamento Latente

Propósito: Lida com todas as operações e transformações no espaço latente.

Imagem Latente Vazia:
- Largura/Altura: corresponde à entrada
  - Deve coincidir com as dimensões da Escala de Imagem
  - Afeta diretamente o uso de memória
  - Tamanhos maiores precisam de mais VRAM
  - Não pode ser menor que a entrada
- Tamanho do Lote: dos quadros do vídeo
  - Definido automaticamente a partir da contagem de quadros
  - Afeta a velocidade de processamento e VRAM
  - Maior = mais memória necessária
Codificar VAE:
- Modelo VAE: do Carregador VAE
  - Usa configurações do Carregador VAE
  - Mantém consistência
- Decodificar: habilitado
  - Controla a qualidade de decodificação
  - Desabilitar apenas se VRAM for limitada
  - Afeta a qualidade de saída
Mistura Latente:
- Fator de Mistura:
  - Controla a mistura dos espaços latentes
  - 0 = conteúdo fonte completo
  - Maior = mais influência de latente vazio
  - Afeta a força da transferência de estilo
Escalonar Latente Por:
- Método: nearest-exact
  - Melhor para manter a nitidez
  - Métodos alternativos podem borrar
  - Preserva detalhes de movimento
- Escala:
  - Controla o aumento de tamanho
  - Maior = melhor detalhe, mas mais VRAM
  - Menor = processamento mais rápido
  - 1.6 é ótimo para a maioria dos casos

Amostragem & Refinamento

Propósito: Processo de amostragem em duas etapas para transformação de qualidade.

KSampler (Primeira Passagem):
- Passos:
  - Número de passos de remoção de ruído
  - Maior = melhor qualidade, mas mais lento
  - 6 é ótimo para o sampler lcm
- CFG:
  - Controla a influência do prompt
  - Maior = adesão mais forte ao estilo
  - Menor = mais liberdade
- Sampler: lcm
  - Otimizado para velocidade
  - Bom equilíbrio qualidade/velocidade
- Agendador: sgm_uniform
  - Funciona melhor com lcm
  - Mantém consistência temporal
- Remover Ruído:
  - Força total para a primeira passagem
  - Controla a intensidade da transformação
KSampler (Passagem de Alta Resolução):
- Passos:
  - Corresponde à primeira passagem para consistência
  - Maior não é necessário para refinamento
- CFG:
  - Mantém consistência de estilo
  - Preservação de detalhes equilibrada
- Sampler: lcm
  - Mesmo que a primeira passagem
  - Mantém consistência
- Agendador: sgm_uniform
  - Mantém consistência com a primeira passagem
  - Bom para refinamento de detalhes
- Remover Ruído:
  - Menor que a primeira passagem
  - Preserva mais detalhes originais
  - Bom equilíbrio para refinamento

Processamento de Saída

Propósito: Cria saídas de vídeo finais com e sem troca de rosto.

Combinar Vídeo (Bruto):
- Taxa de Quadros:
  - Taxa de quadros padrão de vídeo
  - Controla a velocidade de reprodução
  - Menor = tamanho de arquivo menor
  - Maior = movimento mais suave
- Formato: video/h264-mp4
  - Formato padrão para compatibilidade
  - Bom equilíbrio de qualidade/tamanho
  - Amplamente suportado
- **CRFjson
- CRF:
  - Controla a qualidade da compressão
  - Menor = melhor qualidade, mas arquivo maior
  - Maior = arquivo menor, mas qualidade inferior
  - 19 é uma configuração de alta qualidade
- Formato de Pixel: yuv420p
  - Formato padrão para compatibilidade
  - Não mude a menos que necessário
  - Garante ampla compatibilidade de reprodução
Combinar Vídeo (Troca de Rosto):
- Mesmos parâmetros que a saída bruta
- Usa configurações idênticas para consistência
- Adiciona integração de troca de rosto
- Mantém configurações de qualidade de vídeo

Dicas de Otimização

Trocas entre Qualidade e Velocidade

Equilíbrio de Resolução:
- Padrão: 512x896
  - Processamento mais rápido
  - Bom para a maioria dos usos
- Alta Qualidade: 768x1344
  - Melhor detalhe
  - 2-3x mais tempo de processamento
Qualidade da Troca de Rosto:
- Padrão: Configurações padrão
  - Integração natural
  - Tempo de processamento equilibrado
- Máxima Qualidade:
  - Aumente a fidelidade do codeformer para 0.9
  - Mais lento, mas rostos mais detalhados
Suavidade do Movimento:
- Processamento Mais Rápido:
  - Reduza a sobreposição do contexto para 2
  - Transições ligeiramente menos suaves
- Melhor Movimento:
  - Aumente a sobreposição para 6
  - Usa mais VRAM, processamento mais lento

Problemas Comuns & Soluções

Mistura de Rosto:
- Problema: Transição de rosto não natural
- Solução: Ajuste o peso do codeformer
  - Tente a faixa 0.4-0.7
  - Menor = melhor mistura
  - Maior = mais detalhes faciais
Força do Estilo:
- Problema: Transferência de estilo fraca
- Solução: Aumente o cfg
  - Tente a faixa 7-8
  - Maior = estilo mais forte
  - Pode afetar a qualidade do movimento
Gerenciamento de Memória:
- Problema: Limitações de VRAM
- Soluções:
  - Habilite fatiamento de VAE
  - Reduza a resolução
  - Processe segmentos mais curtos

Mais Informações

Para detalhes adicionais e criações incríveis, visite o .

Deseja Mais Fluxos de Trabalho do ComfyUI?

FLUX NF4 | Acelere a Geração de Imagens FLUX

Geração de imagens mais rápida e melhor gerenciamento de recursos.

ComfyUI Vid2Vid Dance Transfer

Transfere o movimento e o estilo de um vídeo fonte para uma imagem ou objeto alvo.

Dilatação de Máscara Audioreativa | Animações Deslumbrantes

Transforme seus sujeitos e dê-lhes auras pulsantes, movidas pela música, que dançam ao ritmo.

Vid2Vid Parte 2 | SDXL Style Transfer

Aprimore a criatividade do Vid2Vid focando na composição e no mascaramento do seu vídeo original.

AnimateDiff + ControlNet + AutoMask | Estilo de Quadrinhos

Reestilize vídeos sem esforço, convertendo personagens realistas em anime enquanto mantém os planos de fundo originais intactos.

AnimateDiff + ControlNet + IPAdapter V1 | Estilo de Desenho Animado

Converta o vídeo original na animação desejada usando apenas algumas imagens para definir o estilo preferido.

CogVideoX-5B | Modelo Avançado de Texto-para-Vídeo

CogVideoX-5B: Modelo avançado de texto-para-vídeo para geração de vídeos de alta qualidade.

ReActor | Troca Rápida de Rostos

Com o ComfyUI ReActor, você pode facilmente trocar os rostos de um ou mais personagens em imagens ou vídeos.