ComfyUI  >  工作流  >  ComfyUI PhotoMakerV2 | 创建逼真的照片

ComfyUI PhotoMakerV2 | 创建逼真的照片

ComfyUI PhotoMakerV2是一款强大的文本到图像生成工具,使用户能够高效地创建逼真的个性化照片。通过输入身份图像和文本提示,PhotoMakerV2在保留个人相貌的同时,允许灵活控制背景、风格和属性。这个最新版本相比其前身提供了更好的身份保真度。探索在不同场景中生成逼真图像的创意可能性,风格化外观,甚至合并身份。

ComfyUI PhotoMakerV2 工作流程

ComfyUI PhotoMakerV2 Workflow
想要运行这个工作流吗?
  • 完全可操作的工作流
  • 没有缺失的节点或模型
  • 无需手动设置
  • 具有惊艳的视觉效果

ComfyUI PhotoMakerV2 示例

comfyui-photomakerv2-create-realistic-photos-1109

ComfyUI PhotoMakerV2 描述

什么是PhotoMakerV2

PhotoMakerV2是PhotoMaker的升级版,提供了一种高效的个性化文本到图像生成方法。它使用少量输入身份图像和文本提示合成逼真的个人照片。

PhotoMakerV2的一些主要特点包括:

  • 高效:快速生成个性化照片。
  • 优秀的身份保留:保持输入身份的相貌。
  • 灵活的文本控制:允许在提示中指定背景、风格、属性等。
  • 改进的身份保真度:相比PhotoMaker V1有所增强。 PhotoMakerV2在各种背景下生成逼真的个人图像,风格化外观,改变年龄和性别等属性,合并身份,并将旧照片或艺术作品中的人物现代化。它解锁了无数的创意可能性。

PhotoMakerV2的工作原理

PhotoMakerV2将一个或多个输入身份图像编码为"堆叠ID嵌入",作为封装身份信息的统一表示。

这个嵌入与文本提示结合,输入到文本到图像扩散模型中。然后模型生成一张图像,展示嵌入身份在提示描述的背景下。

其工作原理的一些关键方面:

  • 使用身份编码器从输入的面部图像中提取身份信息
  • 通过利用外部面部识别模型(InsightFace)改进身份保留
  • 将多个身份图像编码为堆叠嵌入,以全面捕捉身份
  • 将堆叠ID嵌入输入到扩散模型的交叉注意力层中
  • 在文本提示的指导下,自适应地合并身份信息
  • 使用面向身份的数据集进行训练,以提高识别能力

如何使用ComfyUI PhotoMakerV2

要在ComfyUI中使用PhotoMakerV2,主要与PhotoMakerEncodePlus节点交互。典型的工作流程包括:

  1. 使用"PhotoMaker Loader Plus"节点加载PhotoMakerV2模型。
  2. 使用"Prepare Images For CLIP Vision"节点加载一个或多个身份图像。
  3. 使用"PhotoMaker InsightFace Loader"节点加载PhotoMakerV2所需的InsightFace模型。
  4. 将这些节点的输出连接到"PhotoMaker Encode Plus"节点的对应输入。
  5. 在"PhotoMaker Encode Plus"节点中指定描述所需图像的提示。使用提示中特殊的触发词指示身份出现的位置。
  6. 将"PhotoMaker Encode Plus"的输出条件连接到"KSampler"节点以生成图像。

更多信息,请访问。所有功劳归于他们的贡献。

想要更多 ComfyUI 工作流吗?

RunComfy

© 版权 2024 RunComfy. 保留所有权利。

RunComfy 是首选的 ComfyUI 平台,提供 ComfyUI 在线 环境和服务,以及 ComfyUI 工作流 具有惊艳的视觉效果。