最近几天,MiniMax发布的海螺视频生成模型 abab-video-1在海内外赚足了眼球。
不仅国内网友玩的欢,国外网友对它的评价也颇高。
比如X上这位名叫“Ryan Morrison”的博主直言:海螺视频是目前他见过的手部动作生成最自然的。
还有博主用海螺视频生成了“星球大战”视频,从画面的色彩和美学上来看,已经有”好莱坞电影“那味儿了。而且运镜整体也很流畅,动作幅度大,视频也没有崩。
更有博主做了一个对比,直言海螺视频在美学和视频表现上超越可灵。事实真的是这样吗?
海螺视频VS可灵实测效果对比
下面,AIbase搞了三组提示词进行测试对比,一起来看看对比效果吧!
实测对比一:城市风景(复杂提示词)
提示词1:展现一座现代城市逐渐变回过去的样子。摩天大楼慢慢消失,取而代之的是古老的建筑;汽车变成马车,街道上的人们衣着也回到了过去的风格。整个城市仿佛在时光机里穿梭,带观众体验不同时代的风貌。
可以看到,海螺视频对提示词的理解还是比较到位的,视频古今建筑转场渐变的过渡也还算自然。表现还是很不错的。
可灵文生视频在复杂且较长提示词的理解方面感觉有点欠缺,目前从视频来看,只理解了前半部分,并没有生成从现代建筑到古老建筑的转变效果。如果用图生视频的话,可灵应该可以表现的更好。
实测对比二:酒吧里的人(复杂提示词)
提示词2:5个人坐在酒吧的吧台上,通过颜色变化展现5个人的情绪波动。画面以人物肖像为主,背景颜色随着表情变化而改变。喜悦时明亮温暖,悲伤时深沉冷调,愤怒时鲜艳激烈。颜色的流动展现情绪的微妙变化,让观众直观感受人物内心世界。
AIbase在提示词2里设置了好几个复杂的细节,比如“情绪的变化”以及“背景色调跟随情绪变化”这样的描述,而且还增加了画面的人数,难度升级。
目前来看,海螺视频貌似没有被难住,人物情绪的转换很自然,而且脸没有崩,背景的色调也紧随着情绪进行相应的变化,表现力很强。
同样的提示词,可灵生成的人物少了一个,而且脸部也崩了,色调也没按照提示词的要求做到跟随情绪变化。
实测对比三:星空下的情侣(简单提示词)
可能是提示词太长,且过于复杂了,换个简单的提示词试试~
提示词3:一对情侣牵手,在繁星点点的夜空中漫步,背景中的星河在缓的移动
海螺生成的视频从运动幅度到构图到美学角度都没有毛病,情侣散步的动作也很自然
可灵生成的星空也没有啥问题,唯一的小瑕疵就是下方的情侣在画面中占比有点小了,很容易被忽略,人物的外形也有一点崩,但还在可接受范围。
实测对比结果
整体体验下来,海螺视频生成易用性强,只需要简单输入一句话就可以生成一段丝滑的视频。视频整体运动比较稳定,而且人物的动作十分自然。
从上面的几个测试对比来看,至少在文生视频这块,海螺视频确实是超越了可灵。
目前可灵的优势在于它的功能更丰富,还支持图生视频,首尾帧等,这块表现会比文生视频要强得多。
需要强调的是,由于海螺视频只有文生视频,图生视频这块这里就无法做对比了。
总结起来,海螺视频主要优点如下:
- 美学水平:海螺模型生成的视频在画面美感上有显著提升,色彩搭配更加协调,构图更加精美。
- 镜头运动:相比可灵,海螺模型在视频的运镜技巧上更胜一筹,能够呈现出更加流畅自然的画面转换和镜头移动。
- 表情刻画:海螺模型在人物表情的塑造上更加细腻丰富,能够更好地传达情感和故事。
- 文字呈现:在需要展示文字的场景中,海螺模型的表现更加出色,文字的布局和设计更加美观,易于阅读。
- 视频连贯性:海螺模型生成的视频在情节发展和画面转换上更加连贯,storytelling能力更强。
- 创意空间:海螺模型为创作者提供了更广阔的创意发挥空间,能够更好地实现独特的视觉效果和叙事方式。
暂无评论内容