国产大模型“腾讯混元 1.2”出图效果测评

前言

国产大模型“腾讯混元 1.2”出图效果测评插图

腾讯之前官方推出了混元Dit模型,目前已经升级到了1. 2 版。这次测评的是刚刚推出的“微调动漫版模型”。该版本已经首发于LibLibAI,感兴趣的小伙伴可以直接去LibLib在线使用。

国产大模型“腾讯混元 1.2”出图效果测评插图1

国产大模型“腾讯混元 1.2”出图效果测评插图2

模型的 3 大亮点

由于是国产模型,混元很好地支持了中英文双语的提示词输入,这对于英语能力比较有限的朋友来说,是一个好消息。同时,混元的产出结果相对比较稳定,人物结构和谐,审美水平有基础保障。同时,模型自带大量知识,不需要依赖各种风格、角色、动作Lora。只需要通过书写提示词,就能直接调用预置在模型中的各种知识,包括 6000 个以上的角色、 1000 种以上的风格和 2000 种以上的动作资源。

国产大模型“腾讯混元 1.2”出图效果测评插图3

效果实测

我们使用纯中文输入,来作为提示词。不管是使用“tag”类型的短语,或者自然语言的描述,都可以发挥作用。我直接使用一些简单的自然语言,来看一下效果。比如“一个黑色齐刘海短发,大眼睛,穿着公主服的动漫女孩,看着镜头微笑”。

国产大模型“腾讯混元 1.2”出图效果测评插图4

负面提示词:错误的眼睛,糟糕的人脸,毁容,糟糕的艺术,变形,多余的肢体,模糊的颜色,模糊,重复,病态,残缺,水印

采样方法:DDPM,步数: 50 步。以上参数是模型作者的推荐参数。

国产大模型“腾讯混元 1.2”出图效果测评插图5

从结果上看,模型对中文的语义理解还是不错的,能还原关键特征。

国产大模型“腾讯混元 1.2”出图效果测评插图6

风格调用

接下来,来测试一下,风格关键词的起效情况。在原有提示词的情况下,额外增加风格词汇。比如“chibi可爱”、“flat color平涂”、“pixel art像素风”,看看对应的出图结果。

每个词汇都只测试了一次,风格的展示程度还是挺不错的。能很明显感知到风格词汇的效果。这确实在一定程度上,省去了调用Lora,让使用体验向Midjourney更加靠近。仅仅用提示词,就能控制画面的大致风格。

国产大模型“腾讯混元 1.2”出图效果测评插图7

© 版权声明
THE END
喜欢就支持一下吧
点赞8 分享