StableIdentity
StableIdentity是一个基于大型预训练文本到图像模型的最新进展,能够实现高质量的以人为中心的生成。与现有方法不同的是,StableIdentity能够确保稳定的身份保留和灵活的可编辑性,即使在训练过程中只使用了每个主体的一张面部图像。它利用面部编码器和身份先验对输入的面部进行编码,然后将面部表示投射到一个可编辑的先验空间中。通过结合身份先验和可编辑性先验,学习到的身份可以在各种上下文中注入。此外,StableIdentity还设计了一个掩蔽的两阶段扩散损失,以提升对输入面部的像素级感知,并保持生成的多样性。大量实验证明,StableIdentity的性能优于以往的定制方法。学习到的身份还可以灵活地与ControlNet等现成模块结合使用。值得注意的是,我们是首个能够直接将从单张图像学习到的身份注入到视频/3D生成中而无需微调的方法。我们相信,StableIdentity是统一图像、视频和3D定制生成模型的重要一步。
需求人群:
“StableIdentity可应用于图像、视频和3D生成领域,适用于需要定制化人物形象的场景。”
使用场景示例:
一个社交媒体平台使用StableIdentity定制用户头像
一家影视公司将StableIdentity应用于角色形象的定制化
一家游戏开发公司利用StableIdentity生成游戏角色
产品特色:
身份一致的重新语境化
可编辑的身份注入
像素级感知
多样性生成
© 版权声明
文章版权归作者所有,未经允许请勿转载。
THE END