PhotoMaker
PhotoMaker是一种高效的个性化文本到图像生成方法,主要将任意数量的输入ID图像编码成堆叠ID嵌入,以保留ID信息。这种嵌入作为统一的ID表示,不仅可以全面地封装相同输入ID的特征,还可以容纳不同ID的特征以供后续整合。此举为更有趣和实际有价值的应用铺平了道路。此外,为了驱动我们的PhotoMaker的训练,我们提出了一个面向ID的数据构建流水线来组装训练数据。在通过提议的流水线构建的数据集的滋养下,我们的PhotoMaker表现出比基于测试时间微调的方法更好的ID保留能力,同时提供了显著的速度改进、高质量的生成结果、强大的泛化能力和广泛的应用。
需求人群:
“用于快速创建人像照片/头像,支持个性化定制”
使用场景示例:
在艺术作品、旧照片中带入现实
实现年龄或性别变化
身份混合
产品特色:
将几张相同身份的输入图像转换为堆叠的ID嵌入
在推理阶段,构成堆叠ID嵌入的图像可以来自不同的ID
合成具有不同上下文的定制ID
© 版权声明
文章版权归作者所有,未经允许请勿转载。
THE END