Imagen 3 是 Google DeepMind 最新推出的文本到图像生成模型,它能够生成高质量、高分辨率的图像,具有更好的细节和丰富的光照效果。该模型支持多种视觉风格,从照片般逼真到油画质感,以及黏土动画场景。Imagen 3 还改进了对自然语言提示的理解,简化了生成所需图像的过程,并采用了最新的安全和责任技术,包括隐私保护和内容安全。
Imagen 3 的功能特性
- 高质量图像生成:Imagen 3 能够生成比以前Imagen 2模型具有更好的细节、更丰富的照明和更少的分散注意力的伪影的图像。
- 改进的提示理解:模型对提示词的理解能力得到显著提升,可以生成多种视觉风格,并捕捉长提示中的小细节。
- 多版本优化:Imagen 3 将提供多个版本,针对不同任务类型进行优化,从快速草图到高分辨率图像。
- 多样化风格生成:设计用于生成多种格式和风格的高质量图像,包括照片般逼真的风景、质感丰富的油画或生动的黏土动画场景。
- 自然语言提示:能够理解用日常自然语言编写的提示,简化了获取所需输出的过程。
- 丰富的训练数据:为了帮助模型捕捉特定镜头角度或复杂提示中的构图等细节,训练数据中的每张图片的标题都添加了更丰富的细节。
- 高质量的文本渲染:文本渲染能力得到显著提升,为风格化的生日卡片、演示文稿等用例开辟了新的可能性。
- 安全性和责任性设计:Imagen 3 采用了最新的安全和责任创新技术构建和部署,从数据和模型开发到生产都进行了广泛过滤和数据标记,以最小化数据集中的有害内容,并减少有害输出的可能性。
- 隐私、安全和安全技术:部署了包括创新的水印工具 SynthID 在内的最新隐私、安全和安全技术,该工具将数字水印直接嵌入到图像像素中,使其可以被检测以识别,但对人眼来说是不可见的。
如何使用Imagen 3 ?
AIHub 最新消息,Imagen 3 暂未完全开放,仅供部分选定创作者使用。普通用户需要在 ImageFX 平台注册并加入等待列表以获取访问权限。
加入候补名单:http://labs.google/trustedtester/
Imagen 3 也即将登陆 Vertex AI。
© 版权声明
文章版权归作者所有,未经允许请勿转载。
THE END