ComfyUI > Przepływy pracy > Omost | Ulepsz Tworzenie Obrazów

Omost | Ulepsz Tworzenie Obrazów

Omost wykorzystuje Large Language Models do przekształcania kodowania w szczegółowe kompozycje obrazów. Korzystając z uporządkowanego Canvas i zaawansowanej inżynierii promptów, Omost zapewnia dokładne i efektywne generowanie obrazów

ComfyUI Omost Przepływ Pracy

Chcesz uruchomić ten przepływ pracy?

W pełni funkcjonalne przepływy pracy
Brak brakujących węzłów lub modeli
Brak wymaganego ręcznego ustawiania
Cechuje się oszałamiającymi wizualizacjami

ComfyUI Omost Przykłady

comfyui-omost-enhance-image-creation-1100

ComfyUI Omost Opis

1. Czym jest Omost?

Omost, skrót od "Twój obraz jest prawie gotowy!", to innowacyjny projekt, który przekształca możliwości kodowania Large Language Models (LLM) w generowanie obrazów, a dokładniej w możliwości komponowania obrazów. Nazwa "Omost" ma podwójne znaczenie: sugeruje, że za każdym razem, gdy używasz Omost, Twój obraz jest prawie gotowy, a także oznacza "omni" (wielomodalny) i "most" (wyciągający z tego najwięcej).

Omost dostarcza wstępnie wytrenowane modele LLM, które generują kod do komponowania wizualnych treści obrazów za pomocą wirtualnego agenta Canvas Omost. Ten Canvas może być następnie renderowany przez konkretne implementacje generatorów obrazów w celu stworzenia ostatecznych obrazów. Omost został zaprojektowany, aby uprościć i ulepszyć proces generowania obrazów, czyniąc go dostępnym i efektywnym dla artystów AI.

2. Jak działa Omost

2.1. Canvas i Opisy

Omost używa wirtualnego Canvas, gdzie elementy obrazu są opisywane i pozycjonowane. Canvas jest podzielony na siatkę 9x9=81 pozycji, co pozwala na precyzyjne umieszczanie elementów. Te pozycje są dalsze podzielone na ramki, oferując 729 różnych możliwych lokalizacji dla każdego elementu. To uporządkowane podejście zapewnia, że elementy są umieszczane dokładnie i konsekwentnie.

2.2. Głębokość i Kolor

Elementom na Canvas przypisany jest parametr distance_to_viewer, który pomaga sortować je na warstwy od tła do pierwszego planu. Ten parametr działa jako względny wskaźnik głębokości, zapewniając, że bliższe elementy pojawiają się przed tymi, które są dalej. Dodatkowo, parametr HTML_web_color_name dostarcza ogólne przedstawienie koloru do wstępnego renderowania, które może być dopracowane za pomocą modeli dyfuzyjnych. Ten początkowy kolor pomaga w wizualizacji kompozycji przed dopracowaniem.

2.3. Inżynieria Promptów

Omost używa sub-promptów, które są krótkimi, samodzielnymi opisami elementów, do generowania szczegółowych i spójnych kompozycji obrazów. Każdy sub-prompt ma mniej niż 75 tokenów i opisuje element niezależnie. Te sub-prompty są łączone w kompletne prompty dla LLM do przetworzenia, zapewniając, że generowane obrazy są dokładne i semantycznie bogate. Ta metoda zapewnia, że kodowanie tekstu jest efektywne i unika błędów semantycznych.

2.4. Regionalny Prompter

Omost wdraża zaawansowane techniki manipulacji uwagą, aby obsługiwać regionalne prompty, zapewniając, że każda część obrazu jest generowana dokładnie na podstawie podanych opisów. Techniki takie jak manipulacja wynikami uwagi zapewniają, że aktywacje w maskowanych obszarach są wzmacniane, podczas gdy te na zewnątrz są tłumione. Ta precyzyjna kontrola nad uwagą skutkuje wysokiej jakości, specyficzną dla regionu generacją obrazów.

3. Szczegółowe Wyjaśnienie Węzłów ComfyUI Omost

3.1. Węzeł Ładowania LLM Omost

Parametry wejściowe Węzła Ładowania LLM Omost

llm_name: Nazwa wstępnie wytrenowanego modelu LLM do załadowania. Dostępne opcje obejmują:
- lllyasviel/omost-phi-3-mini-128k-8bits
- lllyasviel/omost-llama-3-8b-4bits
- lllyasviel/omost-dolphin-2.9-llama3-8b-4bits

Ten parametr określa, który model załadować, każdy oferujący różne możliwości i optymalizacje.

Parametry wyjściowe Węzła Ładowania LLM Omost

OMOST_LLM: Załadowany model LLM.

Ten wynik dostarcza załadowany LLM, gotowy do generowania opisów i kompozycji obrazów.

3.2. Węzeł Czatu LLM Omost

Parametry wejściowe Węzła Czatu LLM Omost

llm: Model LLM załadowany przez OmostLLMLoader.
text: Prompt tekstowy do wygenerowania obrazu. To główny parametr wejściowy, gdzie opisujesz scenę lub elementy, które chcesz wygenerować.
max_new_tokens: Maksymalna liczba nowych tokenów do wygenerowania. To kontroluje długość wygenerowanego tekstu, z wyższą liczbą pozwalającą na bardziej szczegółowe opisy.
top_p: Kontroluje różnorodność wygenerowanego wyniku. Wartość bliższa 1.0 obejmuje więcej różnych możliwości, podczas gdy niższa wartość koncentruje się na najbardziej prawdopodobnych wynikach.
temperature: Kontroluje losowość wygenerowanego wyniku. Wyższe wartości skutkują bardziej losowymi wynikami, podczas gdy niższe wartości czynią wynik bardziej deterministycznym.
conversation (Opcjonalne): Poprzedni kontekst rozmowy. To pozwala modelowi kontynuować poprzednie interakcje, utrzymując kontekst i spójność.

Parametry wyjściowe Węzła Czatu LLM Omost

OMOST_CONVERSATION: Historia rozmowy, w tym nowa odpowiedź. To pomaga w śledzeniu dialogu i utrzymaniu kontekstu w różnych interakcjach.
OMOST_CANVAS_CONDITIONING: Wygenerowane parametry kondycjonowania Canvas do renderowania. Te parametry definiują, jak elementy są umieszczane i opisywane na Canvas.

3.3. Węzeł Renderowania Kondycjonowania Canvas Omost

Parametry wejściowe Węzła Renderowania Kondycjonowania Canvas Omost

canvas_conds: Parametry kondycjonowania Canvas. Te parametry zawierają szczegółowe opisy i pozycje elementów na Canvas.

Parametry wyjściowe Węzła Renderowania Kondycjonowania Canvas Omost

IMAGE: Renderowany obraz na podstawie kondycjonowania Canvas. Ten wynik jest wizualną reprezentacją opisanej sceny, wygenerowaną z parametrów kondycjonowania.

3.4. Węzeł Kondycjonowania Układu Omost

Parametry wejściowe Węzła Kondycjonowania Układu Omost

canvas_conds: Parametry kondycjonowania Canvas.
clip: Model CLIP do kodowania tekstu. Ten model koduje opisy tekstowe w wektory, które mogą być użyte przez generator obrazów.
global_strength: Siła globalnego kondycjonowania. To kontroluje, jak mocno ogólny opis wpływa na obraz.
region_strength: Siła regionalnego kondycjonowania. To kontroluje, jak mocno specyficzne opisy regionalne wpływają na ich odpowiednie obszary.
overlap_method: Metoda obsługi nakładających się obszarów (np. overlay, average). To definiuje, jak mieszać nakładające się regiony w obrazie.
positive (Opcjonalne): Dodatkowe pozytywne kondycjonowanie. To może obejmować dodatkowe prompty lub warunki w celu ulepszenia specyficznych aspektów obrazu.

Parametry wyjściowe Węzła Kondycjonowania Układu Omost

CONDITIONING: Parametry kondycjonowania do generowania obrazów. Te parametry kierują procesem generowania obrazów, zapewniając, że wynik pasuje do opisanego scenariusza.
MASK: Maska używana do kondycjonowania. To pomaga w debugowaniu i stosowaniu dodatkowych warunków do specyficznych regionów.

3.5. Węzeł Ładowania Kondycjonowania Canvas Omost

Parametry wejściowe Węzła Ładowania Kondycjonowania Canvas Omost

json_str: JSON string reprezentujący parametry kondycjonowania Canvas. To pozwala na ładowanie wstępnie zdefiniowanych warunków z pliku JSON.

Parametry wyjściowe Węzła Ładowania Kondycjonowania Canvas Omost

OMOST_CANVAS_CONDITIONING: Załadowane parametry kondycjonowania Canvas. Te parametry inicjują Canvas ze specyficznymi warunkami, gotowe do generowania obrazów.

Chcesz więcej przepływów pracy ComfyUI?

CCSR | Konsystentny skalowanie obrazu/wideo

Model CCSR poprawia skalowanie obrazu i wideo, koncentrując się bardziej na spójności treści.

SVD (Stable Video Diffusion) + SD | Tekst na Wideo

Zintegruj Stable Diffusion i Stable Video Diffusion, aby bezpośrednio konwertować tekst na wideo.

AnimateDiff + IPAdapter V1 | Od obrazu do wideo

Dzięki IPAdapter możesz efektywnie kontrolować generowanie animacji za pomocą obrazów referencyjnych.

Blender + ComfyUI | AI Renderowanie Animacji 3D

Użyj Blender do konfiguracji scen 3D i generowania sekwencji obrazów, a następnie użyj ComfyUI do renderowania AI.

Mesh Graphormer ControlNet | Napraw Dłonie

Mesh Graphormer ControlNet poprawia zniekształcone dłonie na obrazach, zachowując resztę.

IPAdapter Plus (V2) + AnimateLCM | ipiv's Morph

Użyj IPAdapter Plus, ControlNet QRCode i AnimateLCM, aby szybko tworzyć filmy morphingowe.

IPAdapter Plus (V2) | Łącz Obrazy

Używaj różnych metod łączenia z IPAdapter Plus, aby precyzyjnie i efektywnie kontrolować mieszanie obrazów.

IPAdapter Plus (V2) | Transfer Stylu z Jednym Obrazem

Użyj IPAdapter Plus i ControlNet do precyzyjnego transferu stylu za pomocą jednego obrazu referencyjnego.

Śledź nas

Wsparcie

Zasoby

Prawne

RunComfy

RunComfy jest wiodącą ComfyUI platformą, oferującą ComfyUI online środowisko i usługi, wraz z przepływami pracy ComfyUI cechującymi się oszałamiającymi wizualizacjami.