国产大模型“腾讯混元 1.2”出图效果测评-龙跃AI

国产大模型“腾讯混元 1.2”出图效果测评

4个月前发布

428

前言

国产大模型“腾讯混元 1.2”出图效果测评插图

腾讯之前官方推出了混元Dit模型，目前已经升级到了1. 2 版。这次测评的是刚刚推出的“微调动漫版模型”。该版本已经首发于LibLibAI，感兴趣的小伙伴可以直接去LibLib在线使用。

国产大模型“腾讯混元 1.2”出图效果测评插图1

国产大模型“腾讯混元 1.2”出图效果测评插图2

模型的 3 大亮点

由于是国产模型，混元很好地支持了中英文双语的提示词输入，这对于英语能力比较有限的朋友来说，是一个好消息。同时，混元的产出结果相对比较稳定，人物结构和谐，审美水平有基础保障。同时，模型自带大量知识，不需要依赖各种风格、角色、动作Lora。只需要通过书写提示词，就能直接调用预置在模型中的各种知识，包括 6000 个以上的角色、 1000 种以上的风格和 2000 种以上的动作资源。

国产大模型“腾讯混元 1.2”出图效果测评插图3

效果实测

我们使用纯中文输入，来作为提示词。不管是使用“tag”类型的短语，或者自然语言的描述，都可以发挥作用。我直接使用一些简单的自然语言，来看一下效果。比如“一个黑色齐刘海短发，大眼睛，穿着公主服的动漫女孩，看着镜头微笑”。

国产大模型“腾讯混元 1.2”出图效果测评插图4

负面提示词：错误的眼睛，糟糕的人脸，毁容，糟糕的艺术，变形，多余的肢体，模糊的颜色，模糊，重复，病态，残缺，水印

采样方法：DDPM，步数： 50 步。以上参数是模型作者的推荐参数。

国产大模型“腾讯混元 1.2”出图效果测评插图5

从结果上看，模型对中文的语义理解还是不错的，能还原关键特征。

国产大模型“腾讯混元 1.2”出图效果测评插图6

风格调用

接下来，来测试一下，风格关键词的起效情况。在原有提示词的情况下，额外增加风格词汇。比如“chibi可爱”、“flat color平涂”、“pixel art像素风”，看看对应的出图结果。

每个词汇都只测试了一次，风格的展示程度还是挺不错的。能很明显感知到风格词汇的效果。这确实在一定程度上，省去了调用Lora，让使用体验向Midjourney更加靠近。仅仅用提示词，就能控制画面的大致风格。

国产大模型“腾讯混元 1.2”出图效果测评插图7

© 版权声明

文章版权归作者所有，未经允许请勿转载。

THE END

喜欢就支持一下吧

相关推荐