ConsiStory
ConsiStory是一个无需训练就能实现在预训练的文本到图像模型中生成一致性主体的方法。它不需要微调或个性化,因此比先前最优方法快20倍。我们通过引入以主体为驱动的共享注意力模块和基于对应关系的特征注入来增强模型,以促进图像之间的主体一致性。另外,我们开发了在保持主体一致性的同时鼓励布局多样性的策略。ConsiStory可以自然地扩展到多主体场景,甚至可以实现对常见对象的无需训练的个性化。
需求人群:
“可用于生成一系列关于某一主题的图像,如商品图片、角色形象等。”
使用场景示例:
生成一系列同一角色的图像
生成一系列同一商品不同角度的图片
生成一致的艺术作品系列
产品特色:
生成一致的主体
Layout多样性
多主体生成
无需训练个性化
© 版权声明
文章版权归作者所有,未经允许请勿转载。
THE END