StableIdentity

StableIdentity插图

StableIdentity

StableIdentity是一个基于大型预训练文本到图像模型的最新进展,能够实现高质量的以人为中心的生成。与现有方法不同的是,StableIdentity能够确保稳定的身份保留和灵活的可编辑性,即使在训练过程中只使用了每个主体的一张面部图像。它利用面部编码器和身份先验对输入的面部进行编码,然后将面部表示投射到一个可编辑的先验空间中。通过结合身份先验和可编辑性先验,学习到的身份可以在各种上下文中注入。此外,StableIdentity还设计了一个掩蔽的两阶段扩散损失,以提升对输入面部的像素级感知,并保持生成的多样性。大量实验证明,StableIdentity的性能优于以往的定制方法。学习到的身份还可以灵活地与ControlNet等现成模块结合使用。值得注意的是,我们是首个能够直接将从单张图像学习到的身份注入到视频/3D生成中而无需微调的方法。我们相信,StableIdentity是统一图像、视频和3D定制生成模型的重要一步。

需求人群:

“StableIdentity可应用于图像、视频和3D生成领域,适用于需要定制化人物形象的场景。”

使用场景示例:

一个社交媒体平台使用StableIdentity定制用户头像

一家影视公司将StableIdentity应用于角色形象的定制化

一家游戏开发公司利用StableIdentity生成游戏角色

产品特色:

身份一致的重新语境化

可编辑的身份注入

像素级感知

多样性生成

© 版权声明
THE END
喜欢就支持一下吧
点赞15 分享