Hva er PhotoMakerV2
PhotoMakerV2, en oppgradering fra PhotoMaker, tilbyr en effektiv metode for personlig tekst-til-bilde-generering. Den syntetiserer realistiske bilder av enkeltpersoner ved å bruke noen få innputt identitetsbilder og en tekstmelding.
Noen viktige funksjoner i PhotoMakerV2 inkluderer:
- Høy effektivitet: Genererer raskt personlige bilder.
- Utmerket identitetsbevaring: Opprettholder likheten til innputt identiteter.
- Fleksibel tekstkontroll: Lar deg spesifisere kontekst, stil, attributter osv. i meldingen.
- Forbedret identitetsnøyaktighet: Forbedret sammenlignet med PhotoMaker V1.
PhotoMakerV2 genererer fotorealistiske bilder av en person i forskjellige kontekster, stiliserer utseender, endrer attributter som alder og kjønn, slår sammen identiteter og moderniserer mennesker fra gamle bilder eller kunstverk. Det åpner for mange kreative muligheter.
Hvordan PhotoMakerV2 fungerer
PhotoMakerV2 koder ett eller flere innputt identitetsbilder til en "stablet ID-embedding," som fungerer som en enhetlig representasjon som innkapsler identitetsinformasjon.
Denne embedding, kombinert med en tekstmelding, mates inn i en tekst-til-bilde-diffusjonsmodell. Modellen produserer deretter et bilde som viser den embedde identiteten i konteksten beskrevet av meldingen.
Noen viktige aspekter av hvordan det fungerer under panseret:
- Bruker en identitetskoder for å trekke ut identitetsinformasjon fra innputt ansiktsbilder
- Forbedrer identitetsbevaring ved å utnytte en ekstern ansiktsgjenkjenningsmodell (InsightFace)
- Koder flere identitetsbilder til en stablet embedding for å fange identiteten omfattende
- Mater den stablede ID-embedding inn i diffusjonsmodellens tverroppmerksomhetslag
- Veileder generering med tekstmeldingen mens den adaptivt slår sammen identitetsinformasjonen
- Trenet med et identitetsorientert datasett for å forbedre identifikasjonsevner
Hvordan bruke ComfyUI PhotoMakerV2
For å bruke PhotoMakerV2 i ComfyUI, samhandler du hovedsakelig med PhotoMakerEncodePlus-noden. En typisk arbeidsflyt involverer:
- Last inn PhotoMakerV2-modellen ved å bruke "PhotoMaker Loader Plus"-noden.
- Last inn ett eller flere identitetsbilder ved å bruke "Prepare Images For CLIP Vision"-noden.
- Last inn InsightFace-modellen som kreves av PhotoMakerV2 ved å bruke "PhotoMaker InsightFace Loader"-noden.
- Koble utgangene fra disse nodene til de tilsvarende inngangene til "PhotoMaker Encode Plus"-noden.
- I "PhotoMaker Encode Plus"-noden, spesifiser meldingen som beskriver ønsket bilde. Bruk det spesielle utløserordet i meldingen der identiteten skal vises.
- Koble utgangskondisjoneringen fra "PhotoMaker Encode Plus" til en "KSampler"-node for å generere bildet.
For mer informasjon, vennligst besøk og . All ære går til deres bidrag.