PhotoMaker

PhotoMaker插图

PhotoMaker

PhotoMaker是一种高效的个性化文本到图像生成方法,主要将任意数量的输入ID图像编码成堆叠ID嵌入,以保留ID信息。这种嵌入作为统一的ID表示,不仅可以全面地封装相同输入ID的特征,还可以容纳不同ID的特征以供后续整合。此举为更有趣和实际有价值的应用铺平了道路。此外,为了驱动我们的PhotoMaker的训练,我们提出了一个面向ID的数据构建流水线来组装训练数据。在通过提议的流水线构建的数据集的滋养下,我们的PhotoMaker表现出比基于测试时间微调的方法更好的ID保留能力,同时提供了显著的速度改进、高质量的生成结果、强大的泛化能力和广泛的应用。

需求人群:

“用于快速创建人像照片/头像,支持个性化定制”

使用场景示例:

在艺术作品、旧照片中带入现实

实现年龄或性别变化

身份混合

产品特色:

将几张相同身份的输入图像转换为堆叠的ID嵌入

在推理阶段,构成堆叠ID嵌入的图像可以来自不同的ID

合成具有不同上下文的定制ID

© 版权声明
THE END
喜欢就支持一下吧
点赞11 分享