职贝云数AI新零售门户

标题: 星流/美图/Manus...6大主流视频Agent横测,我们在1句成片这条路上走了多远? [打印本页]

作者: kGADorA3 时间: 昨天 10:59
标题: 星流/美图/Manus...6大主流视频Agent横测,我们在1句成片这条路上走了多远?
最近测Agent测的非常上头，

而且越来越发现AI在各种专门的范畴的垂直才能发展的越来越好了。

那感觉就是，我总能在一个事儿上找到一个合适的Agent辅助我从头到尾完成一个义务。这几天，就有人问我用过那么多Agent，视频的呢，有没有合适的Agent可以用啊？

我就有点坐不住了，kuku我就甩了两个视频过去。

没错，两个视频都是用市面上曾经在用的视频Agent，只经过文字对话（没有其他操作）生成出来的。

用AI“接手”视频制造全流程这个事儿，如今曾经在路上了。

那目前可以做到什么程度呢？或者说这个交互过程是什么样的？甚至是每个Agent擅长什么不擅长什么？我们如今到底在什么场景下能用上这些视频Agent？

带着这些成绩，我找来了最近市面上的6个视频Agent产品：

AIpai、星流、纳米AI、美图 RoboNeo、Flowith、Manus

然后用两个非常常见的视频场景来横测它们：

整个过程我会不掺杂任何优化，完全实测，从交互体验、画面、细节到音画婚配，都实打实展开说，看看它们到底能做到什么程度。

文章中一切case的高清素材和提示语我都打包好了，公众号后台回复“视频Agent”就可以啦。

01｜AI剧情导演组

剧情小短片其实可以说难度相当高的一个义务了，不只考验模型编写剧情故事的才能，还要看对应分镜能否分歧、生成图片的人物分歧性、场景分歧性、配音、旁白、音乐、剪辑等等等等每一步都不可或缺。

由于我要的，就是我用一个提示语的输入得到一个残缺视频的输入。

所以这把，我给了6个Agent异样的提示语，

“写一个30秒的小故事，主角是一个穿着宇航服的女孩，在下雨天的便利店门口偶遇了将来的本人。要画面氛围感强，补充残缺的剧情，有配音和背景音乐。”

然后我得到了这样6个视频，

我觉得完成度还可以，至少每一个都是基本上完成了一组镜头的生成制造，并且搭配了旁白和相应的配乐。

个人来说，会比较喜欢纳米和AIpai生成的两个版本，镜头衔接比较流利，画面的分歧性也比较强，剧情补充的比较残缺，配音也很残缺，尤其是纳米甚至为了整个故事的残缺制造了超出30s的剧情。

星流全体是做了一个动画版的视频，画面单个来看都很精巧，氛围感很足。但是放在一个故事里的前后几个分镜，就比如说小女孩给将来的本人递伞但是又被退回来后却接了一个女孩低头看向星空的镜头，和将来的本人转身走远的镜头，看上去会觉得稍微有点不那么连接。镜头设计这里还可以再加强。

(, 下载次数: 0)

美图RoboNeo的30s视频一共做了4个分镜，单个镜头看起来都不错，尤其是最后女孩消逝的特效做的还挺有意思，但是由于这四个镜头几乎都是同景别切换，短少人物动线，就会显得镜头切换稍微有些僵硬。

(, 下载次数: 0)

Flowith最最最大的成绩是，没给我一个成品视频，而是做了一个嵌入视频的网页，而且我并不能在网页中下载视频。而且网页的逻辑是把音频也是嵌在网页中，不是和视频婚配上，所以导致打开网页播放视频后，音频会不断不断循环播放。

(, 下载次数: 0)

manus的话，扫尾结尾镜头和中间镜头的分歧性保持的不太好，有点割裂，视频的动态感也不是很强，有点像PPT，同时音频对应的不是很准确，最后话都没说完的视频就结束了。

(, 下载次数: 0)

(, 下载次数: 0)

(, 下载次数: 0)

体验上去，几个模型目前共同存在的成绩就是，大多数模型生成的分镜数量还是比较少，很少会设计动态比较大的镜头，不足以支撑复杂残缺的剧情，人物配音的AI感还是非常强，并且没有婚配场景中生成对应音效的才能，但我置信这些都是各个模型正在或者将来即将优化的方向。

02｜AI产品创意组

接上去，假如我给出一个指定的产品图和logo的话，这6个模型会给出什么样的结果呢？

(, 下载次数: 0)

(, 下载次数: 0)
👍
给第一张图片中的雪糕产品制造一个带有旁白和配乐的30秒创意广告片，并在最后一个画面中展现第二张图中的logo，严厉保持我给你的图片中雪糕和logo的分歧性

然后我们能得到这样6个产品视频：

个人觉得完成度最高的是纳米AI这个短片，38秒做出了9个镜头，每一个镜头都和台词对应上了，而且镜头从环境到产品展现到人物品味到制造过程最后到logo展现（还把logo做成了平面版本非常心爱），属于是一气呵成，非常符合产品宣传片的逻辑了

(, 下载次数: 0)

(, 下载次数: 0)

(, 下载次数: 0)

美图RoboNeo的产品视频我觉得做的比剧情视频要好玩很多，会针对产品给出很多艺术化、夸张的画面处理，比如我下面放了几张我另外跑了一个视频的部分截图，把雪糕放在城堡、画展、展览上就很有意思。一点点遗憾就是在不停止中途干涉的状况下，还是只会给出4-5个的分镜设计，数量有点少。

(, 下载次数: 0)

(, 下载次数: 0)

(, 下载次数: 0)

星流的视频其实也很符合产品展现的逻辑，从场景到产品展现再到细节展现，最后也给logo做了一个动画展现。完成度是很不错，但个人觉得在镜头数量上可以再多一些和单个镜头的动态上可以再大一些。（看完视频只记得星流的巧克力雪糕很豪华hhh）

(, 下载次数: 0)

(, 下载次数: 0)

AIpai由于只能上传一张图片，所以结尾自然忽略了logo这一部分，全体上镜头数量会稍微多一点，台词、音乐和画面对应的都很好，但是中间有一些镜头的动态不够，有几个镜头雪糕的分歧性和我给的原图相差出入也有一点点大。

(, 下载次数: 0)

(, 下载次数: 0)

Flowith的成绩和下面剧情视频还是一样，我甚至觉得能够不用它专门做视频而是做一个带视频和其他元素的一个比较残缺的网页会更好。

(, 下载次数: 0)

Manus。。。。这个收场大热天的镜头还是震惊到我了，一下子没get到啥意思。没有做出台词配音，而且最后两个镜头的雪糕渐变成冰淇淋，还有我那么大一个logo去哪了。。。。。

(, 下载次数: 0)

(, 下载次数: 0)

03｜交互方式

再来看交互方面，这6个工具各有各的特点。

我个人是非常喜欢AIpai的交互方式，我可以看到角色设定、场景设定、每一个分镜的画面描画、景别并调整镜头运动，同时我可以持续在右侧的对话框中针对一个详细的分镜停止修正再修正，然后再继续完成接上去的制造。每一个阶段都有我的参与和确认，能保证视频按照我想要的方向去制造，

这非常的兽性化，让我有种感觉：嗯。。。这个产品是做过视频的人做的。

纳米AI以前我都用来做搜索或者做做调研报告，这回没想到的是它的视频Agent功能也这么凶猛，而且很简单就是传统的对话框唤起义务，一看就知道怎样用。中间不会暂停等待确认，但是能看到它对于剧情的设计比较残缺，调用工具的次数很多但是几乎不会有出错的状况，成功率很高。

(, 下载次数: 0)

而且纳米里内置了很多视频创意供我们参考制造，可以提供很多灵感。

(, 下载次数: 0)

星流是自在画布+对话框的交互方式，基于星流本身弱小的AI图像处理才能再搭配如今Agent，非常合适一套品牌设计流程的运用，可以直接从0末尾完成雪糕到logo到产品宣传片的设计，直接在一个对话内就可以完成，不用跳出。

（其实我更情愿称星流为拥有Agent才能的AI图像处理工具，真的强）

(, 下载次数: 0)

RoboNeo异样是自在画布+对话框的方式，中间每一个步骤完成后都会停止讯问，可以在每个步骤停止修正，然后继续生成。

(, 下载次数: 0)

而且美图对于动漫风格的视频生成效果非常好，动作流利度和画面风格都做的很有意思，这个视频也是一句话生成的，人物分歧性和动态都做的很好。

Flowith则是节点对话的方式，某一个节点不称心的状况可以重重生成，从中途重新末尾下面的义务，这个对于我们曾经经过了一轮番程之后忽然对后面某一步觉得不好，既想要延续这之前的生成又想要更改这之后的效果的状况，非常的敌对。

(, 下载次数: 0)

而且还想要重点提一嘴，Flowith每次都会做网页的总结，排版非常的好看精致。

(, 下载次数: 0)

manus是对话框唤起义务的方式，中间会确认一点重点步骤，对于一些发生的错误解执行安全检测，缺陷就是生成出来的效果真的有点普通，我开的还都是高质量形式。。。

(, 下载次数: 0)

04｜适用场景

说假话，这一轮测完之后，我末尾看法到，

视频Agent曾经不只是一个新颖的生成工具，它其实曾经可以在我真实的日常义务里，替我完成一些详细的事情了。

打个比方，假如你在参加一场宣传片比稿大会，要知道比稿时期工夫紧、还没钱拿，

这时要本人写文案、找参考图、抠素材，做动效，结果客户来一句“还是不太有感觉”你又要重来一版。

如今我直接丢一句提示：“来一条30秒的xxx风格广告，（描画想要的细节），重点突出节拍感强、产品视觉有高光、画面心情饱满。”

之后就能拿出一些demo给甲方看看效果，这中间耗费的工夫、人力、金钱成本都低的多得多。

(, 下载次数: 0)

又或者，我们可以在某一条剧情短片创作时，把剧情想法告诉这些Agent，让他们先出一个剧情预演版本，有了demo的参考，你会更知道哪里的剧情需求更改，哪里的镜头需求交换。

实践上，我们可以看出目前的视频Agent产出的质量虽然不足以支撑将成片直接投入实践宣传中运用，

但却可以在创意和demo阶段给我提供非常大的助力，

甚至AI的脑子加上我们的本人的脑子，想象出的东西会愈加风趣。

(, 下载次数: 0)

在视频Agent的合作下，我们的技术和效率都将得到分明的提高，

这就是，如今常说的 AI不是取代你，而是取代不会用AI的你。

写在最后

这其实不是一篇传统意义上的AI工具测评。

更像是一次我对本人提出的疑问：

假如视频是我表达本人的方式，AI到底能不能成为帮我表达的搭档？

不是听指令的工具，也不是拼运气的生成器，

而是那个能帮我完成片段、填上节拍、回应我心情、甚至懂得我风格的拍摄搭子。

这一次，我找来了6个不异性情的AI，一同“拍了一场片”，他们都不完美，也有卡壳、有偏题，

但你就是能感觉到，他们真的都在试图懂你。

这很重要，这是当前发展的基石。

这篇文章，可以说是我和这6位AI拍摄搭子，共同完成的一次练习卷子。

在这个过程中，我没有被替代，反而更确定了本人作为创作者的地位。

由于当“拍视频”这件事故得更轻松了、可控了、有反馈了，

表达这件事，就更自在了。

而我也越来越置信：

将来的创作，不是一个人对抗工具，而是一群伙伴，围着你，帮你把脑子里的东西都变成画面。

所以假如你也曾经想拍点什么，我觉得如今正是一个好机遇，

一个和AI一同成长的好机遇。

@ 作者 / 阿汤 & 卡尔

最后，感激你看到这里👏假如喜欢这篇文章，不妨随手给我们点赞👍｜在看👀｜转发📪｜评论📣

假如想要第一工夫收到推送，不妨给我个星标🌟

更多的内容正在不断填坑中……

欢迎光临职贝云数AI新零售门户 (https://www.taojin168.com/cloud/)