AI开源

PhotoMaker

无需训练LoRA,保持人脸一致,生成多种风格的肖像

标签:
其他站点:项目仓库

PhotoMaker是腾讯人工智能实验室(TencentARC)开发的一种高效的个性化文本到图像生成方法。它的主要功能是将任意数量的输入ID图像编码为堆叠ID嵌入,以保存ID信息。这种嵌入作为统一的ID表示,不仅可以全面封装同一输入ID的特征,而且可以容纳不同ID的特征以便后续集成PhotoMaker的主要特点包括:

  • 根据文字描述制作照片:用户可以通过文本提示来指导图像的生成,PhotoMaker能够生成符合描述的人物照片
  • 身份混合:它可以整合不同图像ID的特征,形成一个新的ID
  • 改变年龄或性别:例如,可以将男性照片转换为女性样子,或者让照片中的人看起来年轻或年老
  • 风格化:PhotoMaker能够在保留ID属性的同时,给照片加上不同的艺术效果,如油画风格或卡通风格
  • 将艺术品/旧照片中的人物带入现实:可以将艺术绘画、雕塑或旧照片作为输入,将人物带到现代“拍照”

PhotoMaker的工作原理是首先分析照片,识别出每张照片中人物的特征,然后将这些特征结合起来,创建一个新的图像。这个图像是一个结合了多个不同照片特征的个性化人物图像

相关导航

暂无评论

暂无评论...