MoMA

MoMA插图

MoMA

MoMA Personalization 是一款基于开源 Multimodal Large Language Model (MLLM) 的个性化图像生成工具。它专注于主题驱动的个性化图像生成,可以根据参考图像和文本提示生成高质量、保留目标物体特征的图像。MoMA 不需要任何 fine-tuning,是一个插件式的模型,可以直接应用于现有的 diffusion 模型中,并在保留原模型性能的同时提高生成图像的细节和 prompt 忠实度。

需求人群:

“适用于需要对图像进行定制化生成、背景替换或文本描述转图像的场景”

使用场景示例:

将自己的照片放入网站,生成与特定背景或场景相匹配的图像

根据文本描述生成符合要求的图像

将现有图像的背景替换为白色或其他颜色

产品特色:

基于大语言模型的图像生成

支持主题驱动的个性化图像生成

无需 fine-tuning,直接应用于现有 diffusion 模型

© 版权声明
THE END
喜欢就支持一下吧
点赞15 分享