ComfyUI  >  工作流  >  ComfyUI PhotoMakerV2 | 创建逼真的照片

ComfyUI PhotoMakerV2 | 创建逼真的照片

ComfyUI PhotoMakerV2是一款强大的文本到图像生成工具,使用户能够高效地创建逼真的个性化照片。通过输入身份图像和文本提示,PhotoMakerV2在保留个人相貌的同时,允许灵活控制背景、风格和属性。这个最新版本相比其前身提供了更好的身份保真度。探索在不同场景中生成逼真图像的创意可能性,风格化外观,甚至合并身份。

ComfyUI PhotoMakerV2 工作流程

ComfyUI PhotoMakerV2 Workflow
想要运行这个工作流吗?
  • 完全可操作的工作流
  • 没有缺失的节点或模型
  • 无需手动设置
  • 具有惊艳的视觉效果

ComfyUI PhotoMakerV2 示例

comfyui-photomakerv2-create-realistic-photos-1109

ComfyUI PhotoMakerV2 描述

什么是PhotoMakerV2

PhotoMakerV2是PhotoMaker的升级版,提供了一种高效的个性化文本到图像生成方法。它使用少量输入身份图像和文本提示合成逼真的个人照片。

PhotoMakerV2的一些主要特点包括:

  • 高效:快速生成个性化照片。
  • 优秀的身份保留:保持输入身份的相貌。
  • 灵活的文本控制:允许在提示中指定背景、风格、属性等。
  • 改进的身份保真度:相比PhotoMaker V1有所增强。 PhotoMakerV2在各种背景下生成逼真的个人图像,风格化外观,改变年龄和性别等属性,合并身份,并将旧照片或艺术作品中的人物现代化。它解锁了无数的创意可能性。

PhotoMakerV2的工作原理

PhotoMakerV2将一个或多个输入身份图像编码为"堆叠ID嵌入",作为封装身份信息的统一表示。

这个嵌入与文本提示结合,输入到文本到图像扩散模型中。然后模型生成一张图像,展示嵌入身份在提示描述的背景下。

其工作原理的一些关键方面:

  • 使用身份编码器从输入的面部图像中提取身份信息
  • 通过利用外部面部识别模型(InsightFace)改进身份保留
  • 将多个身份图像编码为堆叠嵌入,以全面捕捉身份
  • 将堆叠ID嵌入输入到扩散模型的交叉注意力层中
  • 在文本提示的指导下,自适应地合并身份信息
  • 使用面向身份的数据集进行训练,以提高识别能力

如何使用ComfyUI PhotoMakerV2

要在ComfyUI中使用PhotoMakerV2,主要与PhotoMakerEncodePlus节点交互。典型的工作流程包括:

  1. 使用"PhotoMaker Loader Plus"节点加载PhotoMakerV2模型。
  2. 使用"Prepare Images For CLIP Vision"节点加载一个或多个身份图像。
  3. 使用"PhotoMaker InsightFace Loader"节点加载PhotoMakerV2所需的InsightFace模型。
  4. 将这些节点的输出连接到"PhotoMaker Encode Plus"节点的对应输入。
  5. 在"PhotoMaker Encode Plus"节点中指定描述所需图像的提示。使用提示中特殊的触发词指示身份出现的位置。
  6. 将"PhotoMaker Encode Plus"的输出条件连接到"KSampler"节点以生成图像。

更多信息,请访问。所有功劳归于他们的贡献。

想要更多 ComfyUI 工作流吗?

RunComfy
版权 2025 RunComfy. 保留所有权利。

RunComfy 是首选的 ComfyUI 平台,提供 ComfyUI 在线 环境和服务,以及 ComfyUI 工作流 具有惊艳的视觉效果。 RunComfy还提供 AI Playground, 帮助艺术家利用最新的AI工具创作出令人惊叹的艺术作品。