Das In-Context LoRA (IC-LoRA) Projekt, entwickelt von Lianghua Huang, Wei Wang, Zhi-Fan Wu und ihren Mitarbeitern im Tongyi Lab, repräsentiert einen bahnbrechenden Ansatz zur aufgabenunabhängigen Bildgenerierung mit Diffusionstransformatoren (DiTs). Ihr innovatives Framework nutzt die In-Context-Generierungsfähigkeiten von DiTs durch minimale Anpassungen und eine optimierte Pipeline, die eine effiziente aufgabenspezifische Anpassung mit kleinen Datensätzen ermöglicht. Um mehr über ihre Arbeit zu erfahren und auf ihre Ressourcen zuzugreifen, besuchen Sie das offizielle Repository auf .
In-Context LoRA (IC-LoRA) ist ein leistungsstarkes und flexibles Framework, das es bestehenden Text-zu-Bild-Diffusionstransformator-Modellen ermöglicht, eine Vielzahl von Bildgenerierungsaufgaben mit minimalem zusätzlichem Training auszuführen. Die Hauptidee hinter In-Context LoRA ist es, die inhärenten In-Context-Lernfähigkeiten dieser Modelle zu nutzen, indem ihnen sorgfältig kuratierte Trainingsdaten bereitgestellt werden und ein einfaches, aber effektives Feintuning-Verfahren angewendet wird.
So funktioniert In-Context LoRA im Überblick:
Die Schönheit von In-Context LoRA liegt darin, dass es ein aufgabenunabhängiges Framework ist. Der gleiche Ansatz kann auf eine Vielzahl von Aufgaben angewendet werden, wie z.B. Storyboard-Generierung, Schriftdesign, Produktdesign, visuelle Effekte und mehr. Durch die Bereitstellung aufgabenspezifischer Trainingsdaten kann IC-LoRA sich an jede Aufgabe anpassen, ohne eine Änderung der Modellarchitektur selbst zu erfordern.
Aufgabe | Modell | Empfohlene Einstellungen | Beispiel-Prompt |
---|---|---|---|
1. Paarprofil-Design | couple-profile.safetensors | Breite: 2048, Höhe: 1024 | Dieses zweiteilige Bild zeigt ein Paar Cartoon-Katzen in Detektivkleidung; [LINKS] eine schwarze Katze in einem Trenchcoat und Fedora hält eine Lupe und blickt nach rechts, während [RECHTS] eine weiße Katze mit Fliege und passendem Hut eine Augenbraue neugierig hebt und eine lustige, noir-inspirierte Szene vor einem schwach beleuchteten Hintergrund schafft. |
2. Film-Storyboard | film-storyboard.safetensors | Breite: 1024, Höhe: 1536 | [FILM-SZENEN] Auf einem lebhaften Festival [SZENE-1] finden wir <Leo>, einen schüchternen Jungen, der am Rande eines geschäftigen Karnevals steht, die Augen weit aufgerissen vor Staunen über die bunten Fahrgeschäfte und das Lachen, [SZENE-2] er wagt sich zögernd an ein gewagtes Spiel, seine Freunde feuern ihn an, [SZENE-3] gipfelt in einem triumphalen Moment, als er einen riesigen Stoffbären gewinnt, sein Gesicht strahlt vor Stolz, als er ihn hochhält, damit alle ihn sehen können. |
3. Schriftdesign | font-design.safetensors | Breite: 1792, Höhe: 1216 | Das vierteilige Bild zeigt eine spielerische Blasenschrift in einem lebendigen Pop-Art-Stil. [OBEN-LINKS] zeigt "Pop Candy" in leuchtendem Pink mit einem gepunkteten Hintergrund; [OBEN-RECHTS] zeigt "Sweet Treat" in Lila, umgeben von Süßigkeiten-Illustrationen; [UNTEN-LINKS] hat "Yum!" in einer Mischung aus leuchtenden Farben; [UNTEN-RECHTS] zeigt "Delicious" vor einem gestreiften Hintergrund, perfekt für lustige, kinderfreundliche Produkte. |
4. Wohnkultur | home-decoration.safetensors | Breite: 1344, Höhe: 1728 | Dieses vierteilige Bild zeigt ein rustikales Wohnzimmer mit warmen Holztönen und gemütlichen Dekorelementen; [OBEN-LINKS] zeigt einen großen Steinkamin mit Holzregalen voller Bücher und Kerzen; [OBEN-RECHTS] zeigt ein Vintage-Ledersofa, drapiert mit karierten Decken, ergänzt durch eine Mischung aus texturierten Kissen; [UNTEN-LINKS] zeigt eine Ecke mit einem Holzsessel neben einem Beistelltisch, auf dem eine dampfende Tasse und ein klassisches Buch stehen; [UNTEN-RECHTS] fängt eine gemütliche Leseecke mit einem Fenstersitz, einem weichen Fellwurf und dekorativ gestapelten Holzscheiten ein. |
5. Porträtillustration | portrait-illustration.safetensors | Breite: 1152, Höhe: 1088 | Dieses zweiteilige Bild zeigt eine Transformation von einem realistischen Porträt zu einer spielerischen Illustration, die sowohl Detail als auch künstlerische Finesse einfängt; [LINKS] das Foto zeigt eine Frau auf einem belebten Marktplatz, die einen breitkrempigen Hut, ein fließendes Boheme-Kleid und eine Leder-Umhängetasche trägt; [RECHTS] das Illustrationspanel übertreibt ihre Accessoires und Merkmale, wobei das Boheme-Kleid in lebhaften Mustern und kräftigen Farben dargestellt wird, während der Hintergrund in abstrakte Marktstände vereinfacht wird und der Szene ein animiertes und lebendiges Gefühl verleiht. |
6. Porträtfotografie | portrait-photography.safetensors | Breite: 1344, Höhe: 1728 | Dieses [VIERTEILIGE] Bild illustriert den kreativen Prozess einer jungen Künstlerin in einem hellen und inspirierenden Studio; [OBEN-LINKS] steht sie vor einer großen Leinwand, Pinsel in der Hand, und fügt einem teilweise fertigen Gemälde lebendige Farben hinzu, [OBEN-RECHTS] sitzt sie an einem überladenen Holztisch und skizziert Ideen in einem Notizbuch mit verschiedenen verstreuten Kunstmaterialien, [UNTEN-LINKS] nimmt sie sich einen Moment Zeit, um ihr Werk zu betrachten, und passt nachdenklich ihre Brille an, und [UNTEN-RECHTS] experimentiert sie mit verschiedenen Texturen, indem sie Farben direkt auf der Palette mischt, ihr konzentrierter Ausdruck zeigt ihre Hingabe an ihr Handwerk. |
7. PPT-Vorlage | ppt-templates.safetensors | Breite: 1984, Höhe: 1152 | Dieses vierteilige Bild zeigt eine rustikal gestaltete PowerPoint-Vorlage für einen Kochworkshop; [OBEN-LINKS] stellt "Farm to Table Cooking" in warmen, erdigen Tönen vor; [OBEN-RECHTS] organisiert Workshop-Abschnitte wie "Zutaten", "Zubereitung" und "Servieren"; [UNTEN-LINKS] zeigt Zutatenlisten für saisonale Produkte; [UNTEN-RECHTS] enthält Chefprofile mit kurzen Biografien. |
8. Sandsturm-Visuelleffekt | sandstorm-visual-effect.safetensors | Breite: 1408, Höhe: 1600 | [SANDSTURM-PSA] Dieses zweiteilige Bild zeigt die Transformation eines Radfahrers durch einen Sandsturm-Visuelleffekt; [OBEN] das obere Panel zeigt einen Radfahrer in lebendiger Ausrüstung, der stetig auf einer klaren, offenen Straße mit einem ruhigen Himmel im Hintergrund fährt und Fokus und Entschlossenheit hervorhebt, [UNTEN] das untere Panel verwandelt die Szene, als der Radfahrer von einem heftigen Sandsturm eingehüllt wird, mit Sandpartikeln, die intensiv um das Fahrrad und den Fahrer wirbeln, gegen einen stürmischen, verdunkelten Hintergrund, der Chaos und Kraft betont. |
9. Wunderkerzen-Visuelleffekt | sparklers-visual-effect.safetensors | Breite: 960, Höhe: 1088 | [ECHTE-WUNDERKERZEN-OVERLAYS] Das zweiteilige Bild veranschaulicht lebhaft einen Waldantrag, der durch Wunderkerzen-Overlays verwandelt wird; [OBEN] das erste Panel zeigt einen Mann, der in einem Waldlichtung bei Dämmerung auf einem Knie kniet und seiner Partnerin einen Verlobungsring präsentiert, mit warmer, natürlicher Beleuchtung, [UNTEN] während das zweite Panel leuchtende Wunderkerzen einführt, die eine Herzform um das Paar bilden und die Romantik und Freude des Moments verstärken. |
10. Visuelles Identitätsjson Design | visual-identity-design.safetensors | Breite: 1472, Höhe: 1024 | Das zweiteilige Bild zeigt die fröhliche Identität einer Obstmarke, mit dem linken Panel, das eine lächelnde Ananas-Grafik und den Markennamen "Fresh Tropic" in einer lustigen, lässigen Schrift auf einem hellen Aqua-Hintergrund zeigt; [LINKS] während das rechte Panel das Design auf eine wiederverwendbare Einkaufstasche überträgt, mit dem Ananas-Logo in Schwarz, gehalten von einer Person in einer Marktszene, was die zugängliche und umweltfreundliche Ausstrahlung der Marke betont. |
Dieser Flux und In-Context LoRA Workflow nutzt die leistungsstarke Kombination aus dem Flux-Modell und dem In-Context LoRA, um eine Reihe verwandter Bilder basierend auf einem Text-Prompt zu generieren. Lassen Sie uns Schritt für Schritt aufschlüsseln, wie es funktioniert.
Unsere Plattform hat bereits das Flux-Modell und 10 In-Context LoRA Modelle, die Sie verwenden können. Dies macht Ihren Workflow einfacher und spart Ihnen Zeit. Wählen Sie einfach die Gruppe aus, die Sie möchten, und beginnen Sie mit der Erstellung.
Der wichtigste Teil dieses Workflows ist die Textbeschreibung, die die Hauptidee einfängt, die Sie erstellen möchten. Wir haben bereits Prompts für jedes In-Context LoRA Modell in der zuvor genannten Liste geschrieben. Wenn Sie Ihren eigenen Prompt schreiben, verwenden Sie bitte diese Beispiele als Leitfaden.
Um visuelle Inhalte zu erstellen, die perfekt zu Ihren Anforderungen passen, ändern Sie die Breiten- und Höheneinstellungen, um die gewünschte Größe zu erreichen. Wir haben auch empfohlene Größen für jedes In-Context LoRA Modell bereitgestellt, die Sie als Ausgangspunkt verwenden können.
Der Flux Sampler-Knoten verwaltet den Flux-Sampling-Prozess und optimiert die Generierungsparameter für bessere Ergebnisse. Wichtige Parameter sind:
Die Kombination aus Flux und In-Context LoRA eröffnet eine Welt voller Möglichkeiten zur Erstellung interessanter visueller Inhalte. Probieren Sie diese neuen Modelle aus und entfesseln Sie Ihre Kreativität wie nie zuvor.
Lizenzdateien anzeigen:
Das FLUX.1 [dev] Modell ist von Black Forest Labs. Inc. unter der FLUX.1 [dev] Non-Commercial License lizenziert. Urheberrecht Black Forest Labs. Inc.
IN KEINEM FALL HAFTET BLACK FOREST LABS, INC. FÜR ANSPRÜCHE, SCHÄDEN ODER ANDERE HAFTUNGSPFLICHTEN, OB AUS VERTRAG, UNERLAUBTER HANDLUNG ODER ANDERWEITIG, DIE AUS DER NUTZUNG DIESES MODELLS ENTSTEHEN ODER DAMIT IN VERBINDUNG STEHEN.
© Urheberrecht 2024 RunComfy. Alle Rechte vorbehalten.