Il progetto In-Context LoRA (IC-LoRA), sviluppato da Lianghua Huang, Wei Wang, Zhi-Fan Wu e dai loro collaboratori al Tongyi Lab, rappresenta un approccio rivoluzionario alla generazione di immagini task-agnostic usando trasformatori di diffusione (DiTs). Il loro innovativo framework sfrutta le capacità di generazione in contesto dei DiTs introducendo un tuning minimo e una pipeline semplificata, permettendo un tuning specifico del compito efficiente con piccoli dataset. Per saperne di più sul loro lavoro e accedere alle loro risorse, visita il repository ufficiale su .
In-Context LoRA (IC-LoRA) è un framework potente e flessibile che consente ai modelli esistenti di trasformatori di diffusione testo-immagine di eseguire una vasta gamma di compiti di generazione di immagini con un addestramento minimo aggiuntivo. L'idea chiave dietro In-Context LoRA è sfruttare le capacità di apprendimento in contesto intrinseche di questi modelli fornendo loro dati di addestramento attentamente curati e utilizzando un approccio di fine-tuning semplice ma efficace.
Ecco come funziona In-Context LoRA in breve:
La bellezza di In-Context LoRA è che è un framework task-agnostic. Lo stesso approccio può essere applicato a una vasta gamma di compiti, come la generazione di storyboard, il design di font, il design di prodotto, gli effetti visivi e altro. Fornendo dati di addestramento specifici per il compito, IC-LoRA può adattarsi a ciascun compito senza richiedere alcuna modifica all'architettura del modello stesso.
Compito | Modello | Impostazioni Consigliate | Esempio di Prompt |
---|---|---|---|
1. Design di Profili di Coppia | couple-profile.safetensors | larghezza: 2048, altezza: 1024 | Questa immagine in due parti ritrae una coppia di gatti cartoon in abiti da detective; [SINISTRA] un gatto nero in un trench e un fedora tiene una lente d'ingrandimento e guarda a destra, mentre [DESTRA] un gatto bianco con un papillon e un cappello abbinato alza un sopracciglio con curiosità, creando una scena divertente ispirata al noir su uno sfondo debolmente illuminato. |
2. Storyboard Cinematografico | film-storyboard.safetensors | larghezza: 1024, altezza: 1536 | [MOVIE-SHOTS] In un festival vibrante, [SCENA-1] troviamo <Leo>, un ragazzo timido, in piedi al margine di un carnevale affollato, occhi spalancati per lo stupore delle giostre colorate e delle risate, [SCENA-2] passando a lui che prova riluttante un gioco audace, i suoi amici che lo incoraggiano, [SCENA-3] culminando in un momento trionfante quando vince un gigantesco orso di peluche, il suo volto raggiante di orgoglio mentre lo solleva per mostrarlo a tutti. |
3. Design di Font | font-design.safetensors | larghezza: 1792, altezza: 1216 | L'immagine a quattro pannelli mostra un font a bolle giocoso in uno stile pop-art vivace. [ALTO-SINISTRA] mostra "Pop Candy" in rosa acceso con uno sfondo a pois; [ALTO-DESTRA] mostra "Sweet Treat" in viola, circondato da illustrazioni di caramelle; [BASSO-SINISTRA] ha "Yum!" in un mix di colori vivaci; [BASSO-DESTRA] mostra "Delicious" su uno sfondo a strisce, perfetto per prodotti divertenti e adatti ai bambini. |
4. Decorazione d'Interni | home-decoration.safetensors | larghezza: 1344, altezza: 1728 | Questa immagine a quattro pannelli mostra un soggiorno rustico con toni di legno caldi e elementi decorativi accoglienti; [ALTO-SINISTRA] presenta un grande camino in pietra con mensole in legno piene di libri e candele; [ALTO-DESTRA] mostra un divano in pelle vintage coperto da coperte a quadri, completato da un mix di cuscini testurizzati; [BASSO-SINISTRA] mostra un angolo con una poltrona in legno accanto a un tavolino con una tazza fumante e un libro classico; [BASSO-DESTRA] cattura un angolo di lettura accogliente con una panca alla finestra, un morbido plaid in pelliccia e tronchi decorativi impilati ordinatamente. |
5. Illustrazione di Ritratti | portrait-illustration.safetensors | larghezza: 1152, altezza: 1088 | Questa immagine a due pannelli presenta una trasformazione da un ritratto realistico a un'illustrazione giocosa, catturando sia il dettaglio che il tocco artistico; [SINISTRA] la fotografia mostra una donna in piedi in un mercato affollato, con un cappello a tesa larga, un abito bohemien svolazzante e una borsa a tracolla in pelle; [DESTRA] il pannello illustrato esagera i suoi accessori e le sue caratteristiche, con l'abito bohemien raffigurato in motivi vibranti e colori audaci, mentre lo sfondo è semplificato in bancarelle di mercato astratte, dando alla scena un aspetto animato e vivace. |
6. Fotografia di Ritratti | portrait-photography.safetensors | larghezza: 1344, altezza: 1728 | Questa immagine [QUATTRO-PANNELLI] illustra il processo creativo di una giovane artista in uno studio luminoso e ispirante; [ALTO-SINISTRA] è in piedi davanti a una grande tela, pennello in mano, aggiungendo colori vivaci a un dipinto parzialmente completato, [ALTO-DESTRA] è seduta a un tavolo di legno disordinato, disegnando idee in un quaderno con vari materiali artistici sparsi intorno, [BASSO-SINISTRA] si prende un momento per fare un passo indietro e osservare il suo lavoro, aggiustando pensierosa gli occhiali, e [BASSO-DESTRA] sperimenta con diverse texture mescolando i colori direttamente sulla tavolozza, la sua espressione concentrata dimostra la sua dedizione al suo mestiere. |
7. Modello PPT | ppt-templates.safetensors | larghezza: 1984, altezza: 1152 | Questa immagine a quattro pannelli mostra un modello PowerPoint a tema rustico per un workshop culinario; [ALTO-SINISTRA] introduce "Farm to Table Cooking" in toni caldi e terrosi; [ALTO-DESTRA] organizza sezioni del workshop come "Ingredienti," "Preparazione," e "Servire"; [BASSO-SINISTRA] mostra elenchi di ingredienti per prodotti stagionali; [BASSO-DESTRA] include profili di chef con brevi biografie. |
8. Effetto Visivo Tempesta di Sabbia | sandstorm-visual-effect.safetensors | larghezza: 1408, altezza: 1600 | [SANDSTORM-PSA] Questa immagine in due parti mostra la trasformazione di un ciclista attraverso un effetto visivo di tempesta di sabbia; [ALTO] il pannello superiore presenta un ciclista in abiti vivaci che pedala costantemente su una strada aperta e chiara con un cielo sereno sullo sfondo, evidenziando concentrazione e determinazione, [BASSO] il pannello inferiore trasforma la scena mentre il ciclista viene avvolto in una feroce tempesta di sabbia, con particelle di sabbia che vorticano intensamente attorno alla bici e al ciclista su uno sfondo tempestoso e scuro, enfatizzando caos e potenza. |
9. Effetto Visivo Scintille | sparklers-visual-effect.safetensors | larghezza: 960, altezza: 1088 | [REAL-SPARKLERS-OVERLAYS] L'immagine in due parti illustra vividamente una proposta nel bosco trasformata da sovrapposizioni di scintille; [ALTO] il primo pannello ritrae un uomo inginocchiato su un ginocchio con un anello di fidanzamento davanti al suo partner in una radura nel bosco al crepuscolo, con illuminazione calda e naturale, [BASSO] mentre il secondo pannello introduce scintille luminose che formano un cuore intorno alla coppia, amplificando il romanticismo e la gioia del momento. |
10. Design di Identità Visiva | visual-identity-design.safetensors | larghezza: 1472, altezza: 1024 | L'immagine a due pannelli mostra l'identità gioiosa di un marchio di prodotti agricoli, con il pannello sinistro che mostra un'ananas sorridente e il nome del marchio "Fresh Tropic" in un carattere divertente e casual su uno sfondo acquamarina chiaro; [SINISTRA] mentre il pannello destro traduce il design su una borsa della spesa riutilizzabile con il logo dell'ananas in nero, tenuta da una persona in un contesto di mercato, enfatizzando l'aspetto accessibile ed eco-compatibile del marchio. |
Questo workflow Flux e In-Context LoRA utilizza la potente combinazione del modello Flux e dell'In-Context LoRA per generare un set di immagini correlate basate su un prompt testuale. Analizziamo come funziona passo dopo passo.
La nostra piattaforma ha già il modello Flux e 10 modelli In-Context LoRA pronti per essere utilizzati. Questo rende il tuo workflow più facile e ti fa risparmiare tempo. Basta scegliere il gruppo che desideri e iniziare a creare.
La parte più importante di questo workflow è la descrizione testuale che cattura l'idea principale che vuoi creare. Abbiamo già scritto prompt per ciascun modello In-Context LoRA nell'elenco menzionato in precedenza. Quando scrivi il tuo prompt, utilizza questi esempi come guida.
Per creare visual che si adattano perfettamente alle tue esigenze, modifica le impostazioni di larghezza e altezza per adattarsi alla dimensione desiderata. Abbiamo anche fornito dimensioni consigliate di ciascun modello In-Context LoRA da utilizzare come punto di partenza.
Il nodo Campionatore Flux gestisce il processo di campionamento Flux e ottimizza i parametri di generazione per risultati migliori. I parametri chiave includono:
La combinazione di Flux e In-Context LoRA apre un mondo di possibilità per creare contenuti visivi interessanti. Prova questi nuovi modelli e libera la tua creatività come mai prima.
Visualizza i file di licenza:
Il modello FLUX.1 [dev] è concesso in licenza da Black Forest Labs. Inc. sotto la FLUX.1 [dev] Non-Commercial License. Copyright Black Forest Labs. Inc.
IN NESSUN CASO BLACK FOREST LABS, INC. SARÀ RESPONSABILE PER QUALSIASI RECLAMO, DANNI O ALTRA RESPONSABILITÀ, SIA IN UN'AZIONE DI CONTRATTO, TORTO O ALTRO, DERIVANTE DA, O IN CONNESSIONE CON L'USO DI QUESTO MODELLO.
© Copyright 2025 RunComfy. Tutti i Diritti Riservati.