ขั้นตอนการทำงานของการขยายภาพนี้ได้รับการออกแบบมาเพื่อขยายขอบเขตของภาพ โดยมีสี่ขั้นตอนที่สำคัญ:
ขั้นตอนนี้เกี่ยวข้องกับการตั้งค่าขนาดสำหรับพื้นที่ที่จะขยายและสร้างมาสก์สำหรับพื้นที่ขยาย เป็นขั้นตอนเตรียมการที่วางรากฐานสำหรับการขยายภาพ
กระบวนการขยายภาพที่แท้จริงดำเนินการผ่าน inpainting model โดยเฉพาะการใช้ ControlNet's inpainting module ในขั้นตอนนี้จะเน้นเฉพาะพื้นที่ที่กำหนดโดยมาสก์ที่สร้างขึ้นก่อนหน้านี้ วิธีการนี้ใช้ inpainting model เพื่อสร้างเนื้อหาเพิ่มเติมที่จำเป็นสำหรับพื้นที่ขยายภาพ สิ่งสำคัญคือต้องเข้าใจว่าแม้ว่าเราจะขยายภาพ (outpainting) แต่วิธีการที่ใช้มาจากเทคนิคการ inpainting ที่ควบคุมโดย ControlNet module ที่เติมเต็มพื้นที่ที่กำหนดอย่างชาญฉลาดตามบริบทที่ได้รับจากภาพรอบข้าง
ที่นี่เราจะได้รับภาพเวอร์ชันเริ่มต้นที่มีพื้นที่ขยายใหม่ ขั้นตอนนี้แสดงให้เห็นว่า inpainting model ได้ขยายขอบเขตของภาพอย่างไร อย่างไรก็ตาม ณ จุดนี้ อาจมีความแตกต่างที่เห็นได้ชัดระหว่างขอบของภาพต้นฉบับและส่วนที่ขยายใหม่ ดังนั้นขั้นตอนต่อไปจึงมีความสำคัญในการซ่อมแซม
ขั้นตอนสุดท้ายเน้นการปรับปรุงการผสานระหว่างภาพต้นฉบับและส่วนที่เพิ่มเข้ามาใหม่ ซึ่งเกี่ยวข้องกับการเน้นและปรับปรุงขอบเพื่อให้การเปลี่ยนผ่านระหว่างส่วนต้นฉบับและส่วนขยายของภาพเป็นไปอย่างราบรื่น
นี่คือโหนดหลักที่เกี่ยวข้องในขั้นตอนนี้:
2.1.1. Image Scale to Side: ปรับขนาดภาพตามพารามิเตอร์ที่กำหนด คุณสามารถตั้งค่าความยาวด้านเป้าหมายและเลือกด้าน (ยาวสุด กว้าง หรือ สูง) ที่จะปรับขนาด มีวิธีการปรับขนาดหลายวิธี (nearest-exact, bilinear, area) และคุณสมบัติตัดแต่งเพิ่มเติมเพื่อรักษาสัดส่วนของภาพ
2.1.2. Pad Image for Outpainting: เตรียมภาพสำหรับ outpainting โดยการเพิ่ม padding รอบขอบภาพ โหนดนี้อนุญาตให้กำหนดปริมาณ padding สำหรับแต่ละด้านของภาพและมีตัวเลือก "feathering" เพื่อผสานภาพต้นฉบับเข้ากับพื้นที่ padding ได้อย่างราบรื่น
2.1.3. Convert Image to Mask: แปลงช่องที่เลือก (แดง เขียว น้ำเงิน อัลฟ่า) ของภาพเป็นมาสก์ แยกส่วนของภาพสำหรับการประมวลผล
ในขั้นตอนนี้ ภาพที่มี padding และมาสก์จะถูกเตรียมพร้อม
นี่คือโหนดหลักที่เกี่ยวข้องในขั้นตอนนี้:
2.2.1. Apply Advanced ControlNet: ใช้โหนด ControlNet เพื่อควบคุมกระบวนการ inpainting อย่างละเอียด โดยมุ่งเน้นที่พื้นที่ที่ระบุโดยมาสก์ที่เตรียมไว้ในขั้นตอนแรก
2.2.2. Load ControlNet Model: เลือกและโหลด inpainting ControlNet model
2.2.3. Inpainting Preprocessor: ส่งภาพที่มี padding และมาสก์ที่เตรียมไว้ในขั้นตอนแรกไปยัง inpainting preprocessor
2.2.4. Scaled Soft Weights: ปรับน้ำหนักในกระบวนการ inpainting เพื่อควบคุมอย่างละเอียด มีพารามิเตอร์เช่น base_multiplier สำหรับปรับความแรงของน้ำหนักและ flip_weights เพื่อกลับกันผลของน้ำหนัก
ในขั้นตอนนี้ ภาพที่ขยายใหม่จะถูกสร้างขึ้น อย่างไรก็ตาม อาจมีขอบที่เห็นได้ชัดรอบ ๆ ภาพต้นฉบับ
ขั้นตอนสุดท้ายนี้เกี่ยวข้องกับการมาสก์พื้นที่ขอบเพื่อการสร้างใหม่ ซึ่งช่วยปรับปรุงลักษณะโดยรวมของพื้นที่ขยาย
นี่คือโหนดสำคัญที่เกี่ยวข้องในการนำขอบที่เห็นได้ชัดเข้าไปในมาสก์:
2.4.1. Mask Dilate Region: ขยายขอบเขตของมาสก์ภายในภาพ มีประโยชน์ในการรับรองการครอบคลุมที่สมบูรณ์หรือสร้างขอบเขตที่ใหญ่ขึ้นสำหรับการประมวลผลเอฟเฟกต์
2.4.2. Mask Contour: เกี่ยวข้องกับการระบุและวาดขอบในมาสก์ ช่วยในการแยกแยะองค์ประกอบต่าง ๆ ในภาพ
ขั้นตอนการทำงานนี้ได้รับแรงบันดาลใจจาก Ning
© ลิขสิทธิ์ 2024 RunComfy. สงวนลิขสิทธิ์