LlamaGen

LlamaGen插图

LlamaGen

LlamaGen是一个新的图像生成模型家族,它将大型语言模型的原始下一个token预测范式应用于视觉生成领域。该模型通过适当的扩展,无需对视觉信号的归纳偏差即可实现最先进的图像生成性能。LlamaGen重新审视了图像分词器的设计空间、图像生成模型的可扩展性属性以及它们的训练数据质量。

需求人群:

“LlamaGen的目标受众是图像生成领域的研究人员和开发者,特别是那些对利用自回归模型进行高质量图像合成感兴趣的人。它适合需要生成高质量图像的AI艺术家、游戏开发者、电影制作者以及任何需要图像生成技术的行业。”

使用场景示例:

使用LlamaGen生成特定风格的艺术作品。

在游戏开发中,使用LlamaGen快速生成游戏内环境和角色的图像。

电影制作中,利用LlamaGen创建逼真的背景和场景。

产品特色:

提供两种图像分词器,下采样比率分别为16和8。

发布七个类条件生成模型,参数从100M到3B不等。

提供两个文本条件生成模型,参数为700M。

支持在线演示,运行预训练模型。

支持LLM服务框架,可实现300% – 400%的速度提升。

类条件图像生成在ImageNet上的应用。

文本条件图像生成,使用LAION COCO数据集和内部数据。

使用教程:

访问LlamaGen的GitHub页面并克隆或下载代码。

阅读并遵循GETTING_STARTED.md文件中的安装指南。

下载预训练模型并将其放置在指定的文件夹中。

运行提供的脚本以生成图像,查看生成结果。

根据需要调整参数和设置以优化生成的图像。

© 版权声明
THE END
喜欢就支持一下吧
点赞15 分享