职贝云数AI新零售门户
标题:
关于Manus的进一步思索
[打印本页]
作者:
SP0u
时间:
昨天 00:19
标题:
关于Manus的进一步思索
由于鬼使神差的一些缘由,最近用上了Manus,相较于之前看大部分的use case,本人也上手试了几个场景,以及详细体验了一些对应的功能
发理想际体验之后有了一些新的思索和不一样的感受,所以在之前的那一篇文章的基础上做个补充,也有一些跟之前文章提到的感受和观点不一样的地方,算是一种认知上的迭代的吧,这也是持续记录的好处吧,可以观察本人的思索,察觉本人的思索和途径的成绩
AI+虚拟机的价值
这部分其实是Manus的一大特点和甚至叫卖点,我发如今之前的分析中把这部分就随意地滑过去了,没有深化去思索这外面的价值是什么,特别是4月我们又看到一些其他产品外形的Agent的时分,比如从阅读器的外形来切入的Fellou,愈加引发了假如一个AI助理有详细的外形和载体,到底应该是个什么?是APP还是阅读器还是一个虚拟机?
虚拟机其实是这个外面最重的,但是也是才能上最片面的,所以也带来了最高的下限。虚拟机其实最核心的才能是两部分,阅读器+代码环境。阅读器处理信息和知识的成绩,代码环境处理动手执行和处理详细成绩。
这两部分组合之后其实下限是非常高的,我们能够都低估了这个价值。我们想象一下,这不就是你真的把一个非常聪明的实习生请到了你的公司或者家里,你给他配置了电脑,给他讲解了详细的工作环境的感觉嘛。
相较于我们之前用到的chatbot,能够聊天对话更像是一个线上的会议,对面那个人只能“动脑”,而manus是真的把人带到了实践工作和生活的环境中,完成“动脑又动手”。笼一致点说,AI的手脚被放开,能够就只要能耗和权限是限制了
能够还有人没有get到这个差异点,我们在举一些manus实践能够可以做到的例子(AI帮我想的),我们看到很多Agent完成的义务能够都比较静态,比如写一个代码或者网页,或者深度分析和检索一个主题内容等等,这些能够是我们比较容易能想到的
但是实践上,假如AI有了一个虚拟机的环境,它可以做的远远不止这些,比如它可以本人去看第三方的API文档,本人去学习一个新的言语或者工具的运用,本人去调用第三方的API来完成义务,本人去跨越多个不同的网页和环境完成愈加复杂的自动化义务的执行
比如一个市场分析师,需求搜集最新的行业数据。以往他要手动登录几十个行业网站,注册账号、央求API、爬取数据、数据清洗、入库、用Python分析,还得不断迭代脚本。如今,AI助手在虚拟机中自主上网,根据指令自动央求账号,接收验证码,调用API,爬下数据,写入本地数据库,然后根据指令自动用pandas等库生成初分析报告、数据可视化,并给出几条独立洞察。比如一个创业者要上新产品,需求从阿里云买CDN、在Github上拉取开源代码、配置AWS的邮件推送、注册Stripe收款、配置Notion管理文档、甚至还要去知乎找达人合作做推行。每个平台都得登录、验证、阅读策略、填表、检测错误、甚至要中英文字转换。AI+虚拟机外形下,用户只需求描画目的(比如“把这个SaaS网站搭上线+完成邮件推送+完成上线告诉+抓取前三个同行业网站的功能结构”),AI能智能化拆解义务,逐渐自动完成央求、配置、测试、整合……每到关键环节遇到权限妨碍,自动推送给用户授权即可。
虽然能够下面的例子当前产品层面没办法很好的准确执行,但是确真实AI+虚拟机的架构下给了我们更大的想象空间
我们在思索的科幻一点,是不是实际上AI也可以在虚拟机外面本人去用其他的大模型产品,比如用chatGPT来做deep research,甚至本人去衔接服务器去训练模型呢?7*24小时持续迭代自我退化呢?在当下一定是有些科幻的,但是这个边界和下限的确是比我们想象得要高很多的
基于这个框架和我看到的更多的用户案例,我觉得叫通用Agent是完全没成绩的,这一点是我在之前的文章中判别出现成绩的地方,我当时的判别更多的是基于官方的use case,在当下技术还不是那么好,完成的义务质量还不是那么高的状况下,能够就是只要这些案例
但是假如从底层逻辑出发,这个产品框架和外形能够就是能走向愈加通用场景的,同时也是一种面向技术高速迭代的设计逻辑,置信模型会越来越智能,价格会越来越低,同时随着模型才能的加强,产品的体验会越来越好,而不是被替代掉
产品的核心价值
之前的那篇文章更多的在思索怎样做,但是比较少分析产品对于用户的核心价值。这次实践运用和看了更多的用户案例之后,对于这个成绩有些不一样的思索
我们在AI出来这几年,听到最多的词能够就是降本增效、效率提升等等,这是AI带来的价值,但不是最大的价值,或者最核心的价值,比如降本增效很多之前的工具和Saas也是可以完成相似效果的
AI最大的价值其实更多的在于扩展我们每个人的边界,在Manus这个产品上尤为分明
我们看到更多的use case都是用户可以借助Manus完成了更多之前本人能够完全做不到的事情,想到的事情就有能够被完成,而不是仅仅是想想
它既不像SaaS那样只能做一件事,也不是传统RPA那样死板流程自动化,而是能自动了解目的、不停自我调整,一路推进义务到底
而且更重要的是AI与人的关系,从工具在往协作伙伴的层面持续退化。Agent打破了我们的的体力&信息获取瓶颈,让人往更深层成绩进发,AI和人是协作和成长的关系
Agent是你的个性智能助手,完成反复性和自动化工作,同时持续退化。不是简单的完成一些杂事,是基于你的义务和习气持续退化,是加速“人-目的-执行-反馈-迭代”的整个闭环,由于中间的执行AI如今能帮你做了,你不再被你已有的才能和知识信息边界所局限你在这个过程中也在持续退化,你的精神被释放,对于你而言更重要的是思索“做什么”和“为什么”,而不是“怎样做”。同时在协作的过程中,你基于Agent详细完成的过程,目的的拆分,你也在持续的学习和成长,最终边界和局限能够都只在于我们本人了
所以这个时分能够愈加了解为什么他们要叫Manus的名字了,举动的价值是宏大的
Manus,源自拉丁语中“手”的意思,
是一款可以将你的想法转化为举动的通用型 AI 助手
AI有了手之后,就从单纯的工具往实践的消费力在退化,之前的AI能够更多的都是给答案,给信息,给建议。但是Manus是真的动手,直接交付结果之前能够我们每个人都有本人才能和信息的局限性,但是如今信息和工具壁垒被打破了,我们每个人都有能够去打破我们的才能边界和局限性人从繁琐的反复中束缚出来,效率的提升能够不只仅是帮你做的更快了,而是帮你去完成一些你之前完全做不了的事情。你的精神和工夫花的去思索做什么和最终的目的上。你从一个执行者变成一个指挥者,你获得了创造的成就感基于用户的义务、行为和持续的交互过程,持续退化提供极致的个性化体验。你的偏好、风格、决策习气都被有效的沉淀,你获得了越用越懂你的AI
产品的核心体验
基于下面提到产品给用户带来的价值,以及本人在实践运用的感受,总结了几个这种类型Agent需求提供的核心体验
义务目的的智能拆解
想把一个详细的义务执行好,最末尾与用户对齐的过程至关重要,不然就很容易出现AI辛辛劳苦完成了义务,用户发现不是本人想要的,或者了解错了。很多时分交付的结果能够不是不好,而是不是用户想要的
而且观察当下很多人运用AI的习气,
“好像大家都想试试看对面这个AI到底有多聪明,一个个惜字如金的
“(开个玩笑)
基于这些背景下,我们就愈加需求能准确了解用户的真实意图,哪怕用户的表达比较模糊、口语化,甚至带有一些隐含的上下文
这种“懂你”的体验是运用AI的过程中最爽的体验之一,就是那种你往常工作中有个非常懂你的搭子的感觉,你一个眼神,它就能get到重点
比如你要求它给你一个市场分析报告,它基于你之前问过的相关信息,判别你需求一个PPT去做汇报,然后基于你的目的来停止义务拆分和执行,这种感受带来的用户价值是非常大的
这种体验是你说个大概,它就能体会,甚至能想到我没想到的细节,这样可以建立起激烈的信任感和依赖感
详细到产品设计能够也有一些要求:
二次确认不要太僵硬,比如义务能够曾经足够明晰了还是每次都基于规则停止确认这就让人感受不太好,详细确认的内容和维度也应该基于义务和当前上下文停止调整,而不是非常机械地反复要持续提高,比如某个习气或者模板之前的义务外面曾经提到过了,就应该能记住,而不是反复的发问确认,或者发现用户对于某一个要求在不同的义务反复的提到,则可以建议是不是固化成一个详细的流程要愈加灵敏,比如不一定非要用文字的方式来与用户沟通和确认,毕竟看文字和打字的交互压力都是比较大的,可以思索音讯卡片的方式,让用户直接经过点击的交互方式来选择,而不是经过文字,毕竟文字是模糊性的,有时分能够不能那么精准的传递详细的意图
2. 提供确定性的体验
这部分其实是很多AI产品的核心,由于大模型技术本身带来的不确定性,我们需求在产品设计上去提高更多的确定性,Manus把虚拟机执行过程放出来其实也是一种传递确定性的方式
义务执行过程的智能化
理想场景中义务执行的环境和过程还是蛮复杂的,很多时分能够不是所谓的单纯的技术成绩,是理想环境成绩。
比如登录需求验证码、发现资源没有权限下载、接口不是最新的、代码环境有成绩、网络有限制等等,这些成绩我们其实就是找个真实的实习生在详细工作中也是有能够碰到的
假如随意碰到一个相似的成绩,产品就直接卡住了,其实体验就是不好的,就像理想工作中,我们假如发现有个实习生在相似成绩上卡住了,你能够就会觉得这个人有点不太开窍的感觉
所以这些成绩怎样有效的处理是产品需求去设计和思索的,怎样能在义务执行的过程中越来越智能,能碰到详细的环境相关的成绩及时与用户停止确认,又不要过于打扰用户
比如假如一个账号登录过,是不是后面就不需求持续登录了,就算是不同的义务;
比如一些合适的容错和重试的机制,发现一个方式走不通就换另外一个途径,或者给出一些方案和建议和用户沟通来持续推进;
比如之前能够碰到过的成绩,有了对应的处理方案,下次能直接本人处理掉,而不是再次反复一遍
核心就是能随着执行的义务,见过的场景越来越多,变得越来越智能,给用户提供更多的确定性的感受
最后一点是有更多自动性的设计和交互,不是一定是出现了成绩才找用户停止确认,创造一个愈加温馨的与AI停止协作的环境和感受
基于之前的义务记录和当前的上下文做一些预测性的建议和推送,比如当下的义务是个市场分析报告,然后这个报告外面有提到一个产品是这个用户之前提过的一个次要竞品,那么在完成了当下的义务之后,还可以提示用户对应的竞品有新的动作,是不是可以深度在分析一下
设置还可以持续关注一些固定的数据或者信息源,当发现有与用户之前的记录和上下文相关的信息后,自动停止推送和分析,判别当前的信息对于用户的价值,提出一些建设性的义务建议
愈加灵敏的人机协作和反馈
为了更进一步提高用户的安全感和确定性,义务执行的全部过程应该都是可以随时回溯甚至是打一个断点的,而且展现方式上能够不应该是把原始的指令或者代码展现给用户,由于很多时分你展现的这些内容对于用户而言能够也是有一定门槛的
能够需求愈加可视化的展现方式,同时还能展现明晰每个节点详细完成的义务是什么,以及能回到详细的工夫点去修正一些信息或者补充一些信息重新执行
比如我们可以想象一个场景,假如有个非常复杂的分析报告的义务,假如我们把义务给了一个实习生,那么愈加高效的方式是我们先要务实习生给我一个大纲,包括详细的分析目录和预备去哪找信息等等,我们给出一些建议之后在去继续推进
当然作为AI产品我们能够可以要求更多,比如就算义务全部执行完了,我也可以要求回到中间的某个节点的快照,我从这个地方出发提出新的要求,而不是从头末尾
详细什么工夫节点与用户确认、以什么方式停止确认,也可以有更多的设计和思索,寻觅打扰用户和不安全感之间的平衡
愈加极致的个性化体验
个性化的体验其实本质也是在给用户提供确定性,由于个性化对于用户意味着熟习感,这个AI不是第一天看法我,跟我很有默契的感觉,这也是当前chatGPT外面记忆才能提供的核心价值。(感觉这个功能的价值也是被大家低估了,chatGPT默默上线快两年了)
回到详细的产品上,需求对于用户的习气、偏好有更多的积累。Manus在这个点上就做得不错,第一天上线就有一个知识模块,虽然当前能够体验不是那么好,但是这个方向一定是值得持续投入的
基于用户持续的运用,去沉淀更多的只与当前用户有关的偏好、习气和形式
- 比如用户义务一切生成和检索过的内容,都自动沉淀成一个知识库,后面不只能复用,还能节约成本
- 比如之前的义务中调用过的一些API,或者编写的一些程序,是不是可以构成一个才能库,在后续的义务中被持续的复用,甚至包括用户偏好的搜索习气,运用工具习气等等
- 比如用户的各种行为组成的偏好库,交互的节拍、言语习气、不同的场景下的邮件措辞方式、输入风格、编码的命名习气、代码的常用库等等
这些偏好和习气能够协助我们持续给用户提供独一无二的个性化的体验,同时这些体验也是随着用户的退化而持续迭代的,比如发现用户有个新的习气,或者有个操作跟之前的习气不一样,可以自动停止提示和建议,从单纯被动的工具,变成一个持续退化的协作伙伴
详细设计上的一些思索
回到详细的产品设计上,可以有愈加自动式的设计(AI把这个叫成长式UI,也挺有意思的)
更过自动的预测性的弹窗,比如基于当前用户的行为、详细的页面、义务的需求和其他的上下文,停止一下预测性的信息推送和弹窗(当前Manus就有一些相似设计,感受非常好),比如某个流程要不要设置成默许的,某个义务要不要保存成模版等等
和与人类协作一样,AI可以阶段性的约请用户一同做个”会议”复盘,比如阶段性沉淀一些偏好和习气,修正一些有成绩的部分。阶段性分析一下数据状况,比如本月累计处理了XXX条数据,传递一种共同完成义务之后的掌控感和成就感
甚至是不是可以思索愈加心情化的设计,毕竟人是心情动物,工作中大家也需求更多的心情价值,比如语气上、碰到详细成绩上的一些鼓励,完成义务之后的一些激励等等
这些能够都是以前的纯工具很难去提供的价值
实践产品体验后的想法
在详细体验的过程中,还是发现了一些之前看use case没有发现的功能细节,有些和下面提到的内容也比较契合,有些也有新的想法
关于义务的二次确认
关于义务的二次确认是经过知识模块来完成的(这个设计也很巧妙,相当于二次确认也是用户的偏好之一,而不是单独停止所谓的规则的设定),而且二次确认是在完成了第一个义务之后,末尾第二次义务之前,产品自动提出的(这个机遇也很棒,相等于把才能嵌入到了详细的流程,而不是硬生生的打断当前的流程去做一个设置)
(, 下载次数: 0)
上传
点击文件名下载附件
但是这个系统提示的知识也有一些小成绩,就是二次确认的过程有点僵硬,就是在硬要求用户去补充更多的信息,而不是那种去追溯原始的目的来补充信息的感觉
就是你的发问是一句简短的要求,比如要一个分析报告,而且确认就是给你发问确认,工夫范围、详细的范畴和深度要求等等,粗看好像是没成绩,但是其实细想更好的成绩是不是去思索用户为什么需求这个报告,从目的出发能够可以提高一个更好的答案
就像在职场上相似的逻辑,S级的人才不是只完成义务,而不是去发掘目的,达成目的,而不是简单的执行命令
当前这能够也有一个人类去顺应的过程,大家能够当前的习气就是我给你一个义务你完成就好了,不要问那么多
2. 关于虚拟机
关于虚拟机的运用上其实有个比较大的疑问,就是为啥一个用户的不同义务非要开不同的虚拟机呢?更多的信息沉淀到同一个环境不是更容易做上下文信息的沉淀嘛
每次都是新环境不是很糜费嘛,能够之前义务曾经积累过的一些配置和信息没办法有效地复用,一些习气和模板也没办法有效沉淀
想了想应该还是成本成绩吧,不断开个虚拟机应该还是蛮贵的,以及义务积分的耗费的确还是蛮大的,看了个会员权益,应该也用不了太多次,成本成绩应该是个当下非常重要的成绩吧
3. 关于社区的构建
其他用户分享的use case有个做同款的按钮,想到了最末尾抖音病毒式的传播效果
这个思绪还是挺好的,用户能够不知道本人能用Manus做什么,可以参考其别人的案例,而且详细功能完成也挺有意思的,好像是把之前用户的上下文+用户当前的诉求一同带入来停止新的义务执行,这样用户还可以提出本人个性化的需求
整个设计还是挺巧妙的,但是也有一些其他的思索,感觉这种方式足够灵敏,但是不够精准,比如我能够就是想完全参考别人案例的网站的设计和风格,就只是换一些内容,这种程度能够就是做不到的,由于义务是完全重新执行的
这些引出了另外一个思索就是用户是不是只能分享整个案例,有没有能够分享的是本人做的义务中的某一部分的才能,能够是个模板、能够是个流程呢?不知道这样是不是有能够有构建社区氛围的能够性
总结一下
这轮AI的带来的能够不只仅是技术的革命,更是思想的革命。人的想法和思索思索方式是一个更难改变的事情,不管是我们去设计产品的思绪,还是用户在运用产品的方式,能够都面临新的变化
虽然从产品外形下去说,Manus是一个非常有想象空间的产品外形,但是实践落地中也还是有非常多的应战需求处理
这些应战也不是所谓的模型退化就足够了的,这些应战来自于我们怎样能回到原点,去思索一个完全智能化的AI产品能给我们带来什么,我们与AI到底应该怎样协作,每一个详细的细节和环节都需求我们重新去思索和设计,怎样给用户带来各方面足够有价值的全新体验,产品设计和细节变得愈加的重要
欢迎光临 职贝云数AI新零售门户 (https://www.taojin168.com/cloud/)
Powered by Discuz! X3.5