Flux & 10 Modelos In-Context LoRA
Este fluxo de trabalho Flux In-Context LoRA (IC-LoRA) oferece 10 modelos LoRA poderosos para geração de imagens independentes de tarefa usando transformadores de difusão. Esses modelos cobrem uma ampla gama de aplicações criativas, incluindo design de perfil de casal, storyboard de filmes, design de fontes, decoração de casa, ilustração e fotografia de retratos, modelos de PPT, efeitos visuais (tempestade de areia e faíscas) e design de identidade visual. Cada modelo aproveita as capacidades de aprendizado em contexto dos DiTs e requer apenas pequenos conjuntos de dados para um ajuste específico de tarefa eficiente.ComfyUI Flux In-Context LoRA Fluxo de Trabalho
- Fluxos de trabalho totalmente operacionais
- Sem nós ou modelos ausentes
- Nenhuma configuração manual necessária
- Apresenta visuais impressionantes
ComfyUI Flux In-Context LoRA Exemplos
ComfyUI Flux In-Context LoRA Descrição
O projeto In-Context LoRA (IC-LoRA), desenvolvido por Lianghua Huang, Wei Wang, Zhi-Fan Wu e seus colaboradores no Tongyi Lab, representa uma abordagem inovadora para geração de imagens independentes de tarefa usando transformadores de difusão (DiTs). Seu framework inovador aproveita as capacidades de geração em contexto dos DiTs introduzindo um ajuste mínimo e um pipeline simplificado, permitindo um ajuste específico de tarefa eficiente com pequenos conjuntos de dados. Para saber mais sobre seu trabalho e acessar seus recursos, visite o repositório oficial no .
1. Sobre o In-Context LoRA (IC-LoRA)
In-Context LoRA (IC-LoRA) é um framework poderoso e flexível que permite que modelos existentes de transformadores de difusão de texto para imagem realizem uma ampla variedade de tarefas de geração de imagens com treinamento adicional mínimo. A ideia principal por trás do In-Context LoRA é aproveitar as capacidades inerentes de aprendizado em contexto desses modelos fornecendo-lhes dados de treinamento cuidadosamente selecionados e usando uma abordagem de ajuste fino simples, mas eficaz.
Aqui está como o In-Context LoRA funciona em poucas palavras:
- Concatenação de Imagens: Em vez de gerar imagens individuais, o IC-LoRA concatena um conjunto de itens relacionados em um único composto grande. Isso permite que o modelo aprenda as relações e a consistência exigida em todo o conjunto.
- Engenharia de Prompt: Os prompts de texto para o conjunto também são concatenados em um único prompt. Este prompt começa com uma descrição geral do conjunto, seguido por detalhes específicos para cada item individual. Ao elaborar o prompt desta forma, o modelo pode entender tanto a tarefa de alto nível quanto os requisitos de baixo nível.
- Adaptação de Baixa Classificação (LoRA): Em vez de ajustar todo o modelo de difusão, o que seria computacionalmente caro, o IC-LoRA usa LoRA para adaptar o modelo a cada tarefa específica. LoRA treina apenas um pequeno conjunto de parâmetros auxiliares, mantendo os pesos originais do modelo congelados. Isso torna o processo de ajuste fino muito mais eficiente.
- Pequenos Conjuntos de Dados de Treinamento: Outro insight chave do IC-LoRA é que você não precisa de conjuntos de dados massivos para acionar as capacidades de aprendizado em contexto. Apenas 20-100 conjuntos de imagens de alta qualidade por tarefa são suficientes para alcançar resultados impressionantes. Isso reduz significativamente o ônus da coleta de dados e computação.
A beleza do In-Context LoRA é que é um framework independente de tarefa. A mesma abordagem pode ser aplicada a uma ampla gama de tarefas, como geração de storyboard, design de fontes, design de produtos, efeitos visuais e muito mais. Ao fornecer dados de treinamento específicos da tarefa, o IC-LoRA pode se adaptar a cada tarefa sem exigir qualquer alteração na arquitetura do modelo em si.
2. 10 modelos In-Context LoRA e suas configurações recomendadas
Tarefa | Modelo | Configurações Recomendadas | Exemplo de Prompt |
---|---|---|---|
1. Design de Perfil de Casal | couple-profile.safetensors | largura: 2048, altura: 1024 | Esta imagem de duas partes retrata um casal de gatos de desenho animado em trajes de detetive; [ESQUERDA] um gato preto em um sobretudo e chapéu fedora segura uma lupa e olha para a direita, enquanto [DIREITA] um gato branco com gravata borboleta e chapéu correspondente levanta uma sobrancelha em curiosidade, criando uma cena divertida inspirada em noir contra um fundo mal iluminado. |
2. Storyboard de Filme | film-storyboard.safetensors | largura: 1024, altura: 1536 | [CENAS-DE-FILME] Em um festival vibrante, [CENA-1] encontramos <Leo>, um garoto tímido, parado na borda de um carnaval movimentado, olhos arregalados com admiração para os brinquedos coloridos e risos, [CENA-2] ele relutantemente tenta um jogo ousado, seus amigos o incentivando, [CENA-3] culminando em um momento triunfante quando ele ganha um urso de pelúcia gigante, seu rosto irradiando orgulho enquanto o levanta para todos verem. |
3. Design de Fonte | font-design.safetensors | largura: 1792, altura: 1216 | A imagem de quatro painéis apresenta uma fonte de bolhas divertida em um estilo vibrante de arte pop. [SUPERIOR-ESQUERDA] exibe "Pop Candy" em rosa brilhante com um fundo de bolinhas; [SUPERIOR-DIREITA] mostra "Sweet Treat" em roxo, cercado por ilustrações de doces; [INFERIOR-ESQUERDA] tem "Yum!" em uma mistura de cores vibrantes; [INFERIOR-DIREITA] mostra "Delicious" contra um fundo listrado, perfeito para produtos divertidos e voltados para crianças. |
4. Decoração de Casa | home-decoration.safetensors | largura: 1344, altura: 1728 | Esta imagem de quatro painéis apresenta uma sala de estar rústica com tons de madeira quente e elementos de decoração aconchegantes; [SUPERIOR-ESQUERDA] apresenta uma grande lareira de pedra com prateleiras de madeira cheias de livros e velas; [SUPERIOR-DIREITA] mostra um sofá de couro vintage coberto por mantas xadrez, complementado por uma mistura de almofadas texturizadas; [INFERIOR-ESQUERDA] exibe um canto com uma poltrona de madeira ao lado de uma mesa lateral segurando uma caneca fumegante e um livro clássico; [INFERIOR-DIREITA] captura um canto de leitura aconchegante com um assento de janela, uma manta de pele macia e toras decorativas empilhadas ordenadamente. |
5. Ilustração de Retrato | portrait-illustration.safetensors | largura: 1152, altura: 1088 | Esta imagem de dois painéis apresenta uma transformação de um retrato realista para uma ilustração divertida, capturando tanto detalhes quanto um toque artístico; [ESQUERDA] a fotografia mostra uma mulher em um mercado movimentado, usando um chapéu de aba larga, um vestido boêmio fluido e uma bolsa de couro transversal; [DIREITA] o painel de ilustração exagera seus acessórios e características, com o vestido boêmio retratado em padrões vibrantes e cores ousadas, enquanto o fundo é simplificado em barracas de mercado abstratas, dando à cena um ar animado e vibrante. |
6. Fotografia de Retrato | portrait-photography.safetensors | largura: 1344, altura: 1728 | Esta imagem [QUATRO-PAINÉIS] ilustra o processo criativo de uma jovem artista em um estúdio brilhante e inspirador; [SUPERIOR-ESQUERDA] ela está diante de uma grande tela, pincel na mão, adicionando cores vibrantes a uma pintura parcialmente concluída, [SUPERIOR-DIREITA] ela se senta em uma mesa de madeira desordenada, esboçando ideias em um caderno com vários materiais de arte espalhados ao redor, [INFERIOR-ESQUERDA] ela dá um passo para trás para observar seu trabalho, ajustando seus óculos pensativamente, e [INFERIOR-DIREITA] ela experimenta diferentes texturas misturando tintas diretamente na paleta, sua expressão focada mostrando sua dedicação ao seu ofício. |
7. Modelo de PPT | ppt-templates.safetensors | largura: 1984, altura: 1152 | Esta imagem de quatro painéis apresenta um modelo de PowerPoint com tema rústico para um workshop culinário; [SUPERIOR-ESQUERDA] introduz "Cozinha da Fazenda à Mesa" em tons quentes e terrosos; [SUPERIOR-DIREITA] organiza seções do workshop como "Ingredientes", "Preparação" e "Serviço"; [INFERIOR-ESQUERDA] exibe listas de ingredientes para produtos sazonais; [INFERIOR-DIREITA] inclui perfis de chefs com pequenas biografias. |
8. Efeito Visual de Tempestade de Areia | sandstorm-visual-effect.safetensors | largura: 1408, altura: 1600 | [PSA-TEMPESTADE-DE-AREIA] Esta imagem de duas partes exibe a transformação de um ciclista através de um efeito visual de tempestade de areia; [SUPERIOR] o painel superior apresenta um ciclista em roupas vibrantes pedalando firmemente em uma estrada aberta e clara com um céu sereno ao fundo, destacando foco e determinação, [INFERIOR] o painel inferior transforma a cena à medida que o ciclista é envolvido em uma tempestade de areia feroz, com partículas de areia girando intensamente ao redor da bicicleta e do ciclista contra um fundo tempestuoso e escurecido, enfatizando caos e poder. |
9. Efeito Visual de Faíscas | sparklers-visual-effect.safetensors | largura: 960, altura: 1088 | [SOBREPOSIÇÕES-REAIS-DE-FAÍSCAS] A imagem de duas partes ilustra vividamente uma proposta no bosque transformada por sobreposições de faíscas; [SUPERIOR] o primeiro painel retrata um homem ajoelhado com um anel de noivado diante de seu parceiro em uma clareira da floresta ao anoitecer, com iluminação quente e natural, [INFERIOR] enquanto o segundo painel introduz faíscas brilhantes que formam um coração ao redor do casal, amplificando o romance e a alegria do momento. |
10. Design de Identidade Visual | visual-identity-design.safetensors | largura: 1472, altura: 1024 | A imagem de dois painéis apresenta a identidade alegre de uma marca de produtos, com o painel esquerdo mostrando um abacaxi sorridente como gráfico e o nome da marca "Fresh Tropic" em uma fonte divertida e casual em um fundo aqua claro; [ESQUERDA] enquanto o painel direito traduz o design em uma sacola de compras reutilizável com o logotipo do abacaxi em preto, segurada por uma pessoa em um ambiente de mercado, enfatizando o apelo acessível e ecológico da marca. |
3. Use Flux e In-Context LoRA no ComfyUI
Este fluxo de trabalho Flux e In-Context LoRA utiliza a poderosa combinação do modelo Flux e do In-Context LoRA para gerar um conjunto de imagens relacionadas com base em um prompt de texto. Vamos detalhar como funciona passo a passo.
3.1. Modelos Precarregados Flux e In-Context LoRA para um Fluxo de Trabalho Eficiente
Nossa plataforma já possui o modelo Flux e 10 modelos In-Context LoRA prontos para você usar. Isso facilita seu fluxo de trabalho e economiza tempo. Basta escolher o grupo que deseja e começar a criar.
3.2. Elaborando o Prompt Perfeito com base nos prompts predefinidos
A parte mais importante deste fluxo de trabalho é a descrição de texto que captura a ideia principal que você deseja criar. Já escrevemos prompts para cada modelo In-Context LoRA na lista mencionada anteriormente. Ao escrever seu próprio prompt, use esses exemplos como guia.
3.3. Personalizando Resolução e Dimensões
Para criar visuais que atendam perfeitamente às suas necessidades, altere as configurações de largura e altura para corresponder ao tamanho desejado. Também fornecemos tamanhos recomendados de cada modelo In-Context LoRA para você usar como ponto de partida.
3.4. Amostrador Flux
O nó Amostrador Flux gerencia o processo de amostragem Flux e otimiza os parâmetros de geração para melhores resultados. Os principais parâmetros incluem:
- Semente (1): O valor da semente garante saídas consistentes nas mesmas configurações. Ajustar a semente permite que a geração Flux produza resultados variados.
- Etapas (50): Este parâmetro define o número de etapas no processo de amostragem Flux. Contagens de etapas mais altas aumentam a qualidade, mas requerem mais tempo de processamento. Aqui, 50 etapas oferecem uma opção equilibrada.
- Orientação (3): Determina a força da orientação. Valores mais altos (por exemplo, 3) alinham a saída gerada pelo Flux mais de perto com os prompts de entrada, garantindo representações precisas de sua intenção.
- Deslocamento Máximo (null): Este parâmetro define o alcance máximo de deslocamento ou transformação. Uma configuração "null" indica uso padrão ou alcance ilimitado.
- Deslocamento Base (null): Semelhante ao deslocamento máximo, ajusta a força de transformação base. Defini-lo como "null" aplica a configuração padrão.
- Denoise (1): Ajusta a força de remoção de ruído durante a geração Flux. Um valor de 1 aplica uma remoção de ruído leve, removendo efetivamente pequenas inconsistências enquanto mantém a clareza.
A combinação de Flux e In-Context LoRA abre um mundo de possibilidades para criar conteúdo visual interessante. Experimente esses novos modelos e libere sua criatividade como nunca antes.
Licença
Visualizar arquivos de licença:
O Modelo FLUX.1 [dev] é licenciado pela Black Forest Labs. Inc. sob a Licença Não-Comercial FLUX.1 [dev]. Copyright Black Forest Labs. Inc.
EM NENHUMA HIPÓTESE A BLACK FOREST LABS, INC. SERÁ RESPONSÁVEL POR QUALQUER REIVINDICAÇÃO, DANOS OU OUTRA RESPONSABILIDADE, SEJA EM UMA AÇÃO DE CONTRATO, DELITO OU DE OUTRA FORMA, DECORRENTE DE, FORA OU EM CONEXÃO COM O USO DESTE MODELO.