职贝云数AI新零售门户

标题: AIGC年度激辩:3轮交互内准确率95%以上才能真正运用| 中国AIGC产业峰会 [打印本页]

作者: BLpt8N    时间: 昨天 19:24
标题: AIGC年度激辩:3轮交互内准确率95%以上才能真正运用| 中国AIGC产业峰会
编辑部 整理自 AIGC峰会
量子位 | 公众号 QbitAI


“ROI是衡量AIGC运用价值的独一标准。”

“如今AIGC客户的需求有两类,一类是尝鲜,一类是真正在工作流里运用。后者假如类比AI 1.0时代的运用金标准,在AI 2.0时代,应该就是在至少3轮交互内要达到95%以上的准确率。”

“AIGC运用落地的关键,还是要从业务和场景中来,到业务和场景中去,拿结果说话。”

“假如是高质量的、投入真金白银去做的百模大战,那么就是有意义的。”

……

从ChatGPT带动AI产业爆火,再到如今越来越多AIGC运用的出现,AI行业曾经从初步探求期,发展到运用落地期。往年也被很多人称为“AIGC的运用元年”。

那么对于一切AIGC玩家来说,都会面临一个理想的成绩:怎样将AIGC运用落地,如何赚钱?

围绕这一成绩,阿里云通义大模型业务担任人徐栋、轻松集团技术副总裁高玉石和澜码科技创始人兼CEO周健在本次中国AIGC产业峰会的圆桌环节,详细分享了本人的看法。

公司产品类型、形式都不同的三位玩家,对AIGC运用落地的探求都到了什么阶段?

如今的AIGC运用,又有什么价值?

以及最重要的,AIGC运用如何落地、怎样赚钱?

中国AIGC产业峰会是由量子位主办的行业峰会,20位产业代表与会讨论。线下参会观众近千人,线上直播观众300万,获得了主流媒体的广泛关注与报道。
话题要点


(圆桌环节由量子位主编金磊掌管。在不改变原意的基础上,量子位对内容停止了编辑整理。希望可以给你带来更多的启示与思索。)
论坛实录

(话题要点为后添加)
AIGC运用已在不同细分赛道上岗

量子位金磊:感激各位嘉宾冤家参加这次圆桌,我们这次峰会的主题叫做「你好,新运用」。为此我们约请到不同产业和范畴的落地先锋代表。

从ChatGPT问世到如今一年半的工夫里,我们看到生成式AI行业发展有一个非常分明的趋向:从基础层的建设和探求,逐渐在向怎样把他们用起来去发展,往年也被很多人以为是AIGC的运用元年。

我们觉得在这个工夫节点上有必要坐上去聊一聊与AIGC有关、且非常接地气的话题:「怎样落地,如何赚钱」。

紧扣这次圆桌的话题,我想先问一个开门见山的成绩,就像刚才快刀青衣教师说的,不要告诉我大模型有多凶猛,要告诉我它们用得怎样样了。

首先想讨教一下高总,轻松集团在去年年底的时分对轻松问医Dr.GPT做了片面晋级,相应发布了7个创新运用,目前病患和医生对新运用的运用状况是怎样样的?

轻松高玉石:我来引见一下我们轻松集团的落地状况,算是对应快刀青医教师说的企业落地实际的过程。

(, 下载次数: 0)

我们在去年上半年发布了轻松问医的大模型,是医疗健康范畴的大模型。

随着下半年整个运用和场景的拓展,我们在去年年底做了晋级。基于轻松问医大模型,还有详细运用场景外面运用模型的结合,我们在医生和患者端的确做了落地的运用,目前看效果还可以。

比如医生端,我们会给医生提供过往积累了很多的病例数据,并且我们做了病例辨认AI模型,结合轻松Dr.GPT对于健康医疗数据辨认的才能和推理才能,我们向临床研讨部分推出临床预分析的数据才能。

做临床研讨的这些医生,他临床搜集的病例只需求提交下去,很轻松就可以拿到辨认结果包括结构化,甚至说他在临床研讨过程中搜集到各种其他类型的数据,都可以综合做一个预分析。

(, 下载次数: 0)

目前我们看到的状况,在我们平台上采用这种方式去做的,在同等工作上效率相对于传统临床研讨能提升2倍,目前全体用的效果还是非常不错的。

同时,我们平台上还有很多医生在做科普。我们能给他们提供一些文字或者视频类科普内容创作过程中的AI辅助工具。

目前看来,这部分医生在我们平台上每个月可以应用这个工具消费或者说创作内容,大概维持在万这个级别的规模。

同时,我们还给医生推出辅助诊疗AI工具。它可以本人跟患者沟通、交流,会预生成出诊断结果的判别,包括给诊疗建议,最终医生会对结果做全体的复核并给出最终结论。

我们跟一家互联网医院做试运用,目前看来这个结果被医生的采纳率能达到86%。一个医生正常问诊的过程之前是10分钟左右,如今只需求1-2分钟,这是我们医生端的。

(, 下载次数: 0)

从患者端来说,由于我们C端用户比较多,所以做了健康顾问。

比如对慢病患者,它会提供用药提示;对普通用户,特别我们中老年用户比较多,它可以提供饮食、生活的健康建议。

我们目前这个顾问覆盖30多万用户,活跃率可以做到70%多。这在过往很难做到,由于这种方式跟用户沟通需求非常大的人工团队去维护,但如今有了大模型,这个事情可以做得非常轻松了。

包括我们健康商城里在线的智能客服,全体上了大模型之后收缩了70%人工人力成本、人工客服的成本。由于工夫关系,还有其他的运用我这里不详细的展开了。

(, 下载次数: 0)

量子位金磊:刚才高总提到病例分析义务,这对于医生来说应该是必须严谨且耗时的工作,有没有数据经过Dr.GPT给医生带来省时的数据呢,节省多少工夫?

轻松高玉石:对于一个残缺的问诊过程来说,在线问诊比线下问诊工夫耗时较长。正常状况下,本来是10分钟左右,如今大概降到1-2分钟。

后面很容易的沟通不需求人工,用机器就能搜集上信息,最后医生做出决策之前,可以看到大模型提取完的结果。

假如他想要的信息没有残缺提取到,由于这不只是残缺模型而是一套系统,系统自动就会把想问的成绩用人工跟患者沟通,整个过程看上去工夫节约了很多。由于医生看病大量工夫都用在后面的过程,最后出结论时,很多时分很快。

量子位金磊:接上去想问问徐总,我们通义千问正式开放也有半年多的工夫了,如今用户运用的状况是怎样样的?

阿里云徐栋:我跟高总的角度能够会不太一样,由于我们是云厂商,再加上模型服务面向全行业。

(, 下载次数: 0)

坦率说很多客户比较两极分化,一方面以为模型是万能的,另一方面有些用户觉得模型是对原有搜索的加强,能够是这么两个角度。我们把市场去做个分割,AIGC怎样运用的状况可以分两个层面。

第一个,大模型塑造了产业的核心商业形式。比如游戏行业的NPC、社交范畴的角色扮演,包括高总讲的范围像是SaaS的场景,它是AIGC内容消费的下游和下游,而且它有本人特定的work flow,这个产业链也是在疾速变化。

除此之外可以看到像智能硬件包含的范围很广,包括车机、智能座驾、手机,也能看到手机厂商和PC厂商分别把名字都改了,叫AI Phone或者AI PC。还有像鼠标这种消费电子类的穿戴设备,都有模型上的场景运用。

可以把这一大类通称为大模型对商业形式做的大晋级,它们或多或少可以把模型集中出去。

第二大类是企业级市场,未必是对商业形式做了根本性重塑,而是在降本增效场景作用比较突出,比如最典型的客服场景、知识库的问答等等,这些场景在企业外部对提效来说有非常多的协助。

快刀青衣教师在刚刚讲的时分,说团队规模未必将来会足够大,缘由也是这样。由于你会发现很多原有岗位角色都是围绕着详细的业务场景的,这个场景下面很多角色经过AI被提效,因此可以做更好的降本增效形式的改变。

(, 下载次数: 0)

讲到阿里巴巴集团模型外部的模型运用状况,有一个很好的案例,无机会可以听钉钉总裁分享。钉钉是非常好的工具链SaaS企业,他们运用分了三步。

第一步把原有IM的Saas运用AI化。比如闪记、视频会议还有文档,全部接入了像魔法棒这样一个才能,一切内容都跟AI打包了。

第二步推出了钉钉超级助理。由于AI助理、AI Agent这个场景,也就是一个AI助理协助企业经过IM运用相应的功能,不管调用功能还是做摘要都会变得很方便。

第三个是钉钉走的另外一条更有打破性的道路,它有一个场景叫“炼丹炉”,也就是一个企业可以把才能包括知识库跟钉钉原有场景结合,变成本人所需求的AI助理,或者特定企业的数字员工。我觉得这样场景也是非常有意思的。

明天很多AIGC运用场景在渐渐发展,也在不断地分层,我们本人看到这两个层面客户的需求会不太一样,毫无疑问调用量也正在非常疾速的增长,不管在第一个场景还是在第二个场景。

量子位金磊:接上去想讨教一下周总,澜码科技是去年2月份成立的,可以说是非常典型的AI 2.0公司,我们去年年底发布了AI Agent平台AskXBOT,那么我们这款运用如今目前运用状况是怎样样的?

澜码周健:我们一末尾从自动化的视角设计AI Agent,我们关注到企业外部员工,特别是一线员工,处理的很多都是数据、文档、运用、流程,这四个核心要素,我们就围绕这几个打造了核心才能。

(, 下载次数: 0)

去年比较多的才能还是在文档这个维度下面,比如说最简单的政策解答、出题判卷,包括保险产品条款的回答,这样做一系列的运用。往年我们末尾有一些所谓的Chart才能或者Work Flow的才能,我们把这些才能组装在一同,就可以做高级一些的加强自动化,专家可以经过知识去赋能基层的业务员工。

这里有一个典型场景,以前保险代理只能经过盲打电话推销新的保险产品,成功率非常低,如今保险代理可以根据体检状况生成的个性化保险产品引荐,去引荐给对应的体检客户,并且引荐的产品也符合他的健康状况,从而可以大大提高销售转化率。

另外一个场景是银行普惠金融,政府如今也希望引导银行资金可以到优质的中小企业那里去,这时分就需求对央求资金的企业撰写尽调报告。

过去一个客户经理要花半地利间写报告,由于要搜集各种各样的信息,例如公司章程、营业执照、银行流水、财务报表,大概要花半天。但是经过Agent,10分钟就能生成一份报告,再检查一下,基本上30分钟就能完成一份报告。

(, 下载次数: 0)

我们本人总结上去,一种是日常办公的加强自动化,包括刚才讲的查询文档、差旅预定、会议预定、智能客服等都是降本增效,另外可以做一些创新业务。

过去由于企业外部的专家供给是稀缺资源,专家的工夫一天也是24个小时,像刚才讲的保险代理、理财经理,不能够每个理财经理都是专家,一定是初级、中级、高级员工婚配起来,这个时分专家工夫的供给是瓶颈。

而明天有了AI Agent或者用上大言语模型之后,智能体能发挥出来专家的才能,这时分专家工夫就不再是瓶颈资源了,我们可以做一些新的业务。原来觉得不能够、质量太差或者风险太高的业务,如今就都有能够了。

这个是我们看到很多落地的场景中,企业特别想要去购买的运用。

量子位金磊:好的,从三位嘉宾的分享我们可以看到,AIGC运用曾经在不同的细分赛道上很有效地上岗了。
AIGC产业越来越卷,也越来越成熟

量子位金磊:与此同时我们也看到这一年半以来,AIGC的运用越来越多,在功能上也呈现出你追我赶的现象。总而言之,越来越卷。

所以我想先讨教一下徐总。我们通义千问应该算是大厂AIGC运用的代表,能否有感遭到同类产品迭代速度过快,感遭到了一些压力?

阿里云徐栋:由于通义千问跟别的厂商还有区别,它的开源力度非常大。比如两周前和一个月前,我们分别开源了两次,所以在社区里会得到很多关于效果的反馈。有的时分一个模型刚放出来,第一周都是噪音,一个月之后才会渐渐知道效果怎样样。

坦率说明天假如要卷的话,我们对效果还是比较有决计的,很多客户会给我们一些反馈,觉得效果还可以。

(, 下载次数: 0)

但是我们明天曾经末尾卷到另外一个维度,我以为是好事情。一个叫做延时,我如今发现有些场景对工夫会非常敏感。比如说有些外呼的场景,还有对图片语义了解的场景,用户能接受的工夫点一定是在2秒,2秒以上没办法接受。

我们其实跟一个手机厂商合作,是面向视障人士,他们可以经过手机去辨认当下环境的物体是什么样子。大家都知道视障人士非常敏感,能感遭到100毫秒的辅助声响的了解,但是在今地利间假如要超过3秒或者4秒、5秒,这个场景就不可用。

而且功能、延时、并发,是我们目前觉得是重点要去卷的方向。

另外一个我们发现明天对成本的敏感度也越来越高。由于过去调用量不大,所以大家觉得成本还好,但是明天我们发如今成本方面卷得也是非常凶猛的。从效果卷到了功能、延时、成本,这是目前看到比较多的方向。

不过这代表产业越来越成熟了,进入了一些核心的敏感范畴,所以才会提这么多需求给我们,这是一方面。

第二方面我们不能只卷言语模型,我们如今在卷多模态的了解、多模态的生成,比如刚才讲到怎样了解图像,怎样了解声响。

前段工夫有个客户告诉我,开水的声响和冷水的声响是不一样的。声响代表很多信息、有很多标签,所以我说声响的辨认不是把语音转化成文字的形式。

有能够明天一切模型输入的信息可以多元,可以是声响、图片、文本,也可以是视频,输入内容也能够是多元的。假如再加工夫轴,有能够变成视频。

所以我觉得多模态应该是往年下半年卷得最凶猛的方向,也是由于上半年OpenAI在春节的时分发布了Sora这个模型。

(, 下载次数: 0)

除此之外,我觉得还有一个目前卷的压力比较大的方向,准确地说是插件生态,或者说是工具链。

过去大家都知道工具链的核心讲的是怎样做SFT,后来末尾卷RAG。如今我们发现随着Agent成为重要的商业化出口后,就需求越来越多的工具或者API,这些API背后代表是不同才能的插件。

所以明天我们能看到,什么样的模型服务可以提供更丰富的插件服务,能够也是一个非常重要的事情。

所以我觉得分几个层次,我们倒未必觉得明天在效果上会有足够大的压力,当然我们也是在不断对标国际上最先进的模型。

但是我们觉得落地场景下去说,能够会在其他几个方面卷的更凶猛,而且这几个方面真正决议了客户能不能用模型获得正收益,这是我们的观察。

量子位金磊:刚才徐总谈到卷的不同方向,但是阿里本身通义大模型就是很卷了。10天前在4月7日的时分,阿里通义千问刚刚开源了千问1.5的34B这个大模型,在明天又开源了一个CodeQwen1.5-7B和Qwen-7B-Chat。

接上去在To B运用当中医疗是非常火热的赛道,其实市场上曾经有很多医疗大模型和相关的运用了。高总,您觉得整个医疗的AIGC运用,目前的困境是什么?

轻松高玉石:首先我觉得这能够是目前整个AIGC落地过程中普遍存在的成绩,就是怎样找到一个比较合适的场景,可以把它处理实践成绩,落得下去。

而不是说如今依然大家看到发布各种各样的内容、造概念、追热点,甚至说我先把大模型搞出来,然后再去找场景。

我的建议还是从业务和场景中来,到业务场景中去,拿结果说话,有没有增效,有没有增收。其实这个说起来很容易,做起来很难。

(, 下载次数: 0)

我们往年1月份的时分做了年终总结,大家看到我们去年AI落地状况,真正运用起来和对业务产生价值,成功率只要30%多一点。等于我做三个尝试,最后只能成一个,这个东西说起来也很容易,做起来其实挺难的。

第二点是医疗的高质量的数据还是比较少的,而且数据也比较分散,是后天的一些要素形成的比较分散,而且这个行业外面还有部分数据的封闭性比较强。怎样把数据有效应用起来,可以给模型强化出来更好的才能,从目前看来能够更好的方式还是经过国家,在数据要素这一系列建设上和规划上怎样缓解这个成绩。

第三点是医疗这个场景是一个很严肃的场景,对于容错率要求是非常高的。

包括刚才徐总也讲,我们会有一些SFT,包括一些微调,还有检索加强的方法,能把这些提升和强化。以如今实践状况看,我个人建议还是以辅助的方式为主,比如说无人化和自动化的方式,我建议不宜过早和悲观地做这件事情,这是我个人的观点。

量子位金磊:那在成本上呢,很多客户一定都是会希望能拿到一个又快又好又省钱的处理方案和产品。我们的产品在上岗医院的时分,在成本上是怎样做到降本增效?

轻松高玉石:这个核心点在于算账,用的过程中一定要算账。

大家都讲ROI,有些场景外面,你能获得的收益其实是很高的,就可以用到更好的或者说可以付出更大的成本,但有些成本其实很低的,所以说这个过程中就需求去平衡。我们那2/3失败的项目,外面有一部分项目是用起来的确不错,但最后的确成本扛不住。

量子位金磊:好的,刚才提到成本,我们AI Agent属于AIGC技术外面非常潮流的一个,虽然这种方法在交互的场景中效果比较好,但是它的成本应该算是一个硬伤。

所以想讨教一下周总,我们在这个方面是怎样处理的?

(, 下载次数: 0)

澜码周健:在我们实践完成过程中,基本上还只是先拿最好的模型去验证这个场景的可完成性。

假如如今在GPT-4下面,经过提示词也没有办法做到的话,基本上我们会回绝这个项目。假如能做的话,我们的客群外面很多是要公有化部署,因此还是想要经过拆解去处理。一方面经过辅助专家知识,这样的话就把大模型的才能局限在很多言语了解上,只是去处理、总结或者说去做自然言语,还有的是实体辨认、或者意图辨认、意图分类等这样一些事情。

这时分对底下模型的推理才能的要求就会大大降低。所以这样的话,对于整个端到端处理方案,就会比用最贵的模型要好很多。

量子位金磊:那么除了在产品运用越来越卷之外,放眼整个宏观的AIGC市场,必然也产生了一定的变化。还是想先讨教一下周总,您觉得市场对于AIGC运用的产品是不是越来越严厉了?

澜码周健:您是说客户吗?

量子位金磊:对。

澜码周健:客户的需求其实是两类,一类只是尝鲜,这时分是不会真的用起来的。第二类是真的要在实践消费工作流外面被用起来,在AI 1.0时代都有明白的可以被用起来的目的,当然明天稍微有一些不同。

以前在人脸辨认的运用场景,准确率95%就是金标准,假如准确率达不到95%,一定没有办法上线。如今能够可以放宽到在交互三轮以内一定要达到95%的准确率,这个还是必须的。

(, 下载次数: 0)

量子位金磊:我们高总这边呢?有这个感觉吗?

轻松高玉石:在这个过程中,我觉得用户对于我们容忍度是比较高的。

包括用户也好,包括外部运用一些供给也好,由于是新事物,所以本身后天有一定的兴味。在这个过程中,他是接受的。但是能够在这个过程中需求适当地控制好预期。假如给出的支出预期以及实践状况的预期过高,之后带来的结果能够会走向另一个极端。

至于另一个点,目前整个市场上对于AIGC有点跟过往的状况不一样。过往说有一个比较好的增长就行了,如今能够支出和利润是同等重要的。假如从资本的层面看,其实对AIGC产品的要求比以前要高很多。

量子位金磊:如今我想问一问徐总,这一年半来,我们有没有对AIGC市场有一个新的感受?

阿里云徐栋:我个人感觉越来越悲观了。

由于大家过去卷的都是在卡层面,前段工夫红杉在美国有一个报告,去年花了500亿美元买卡,真正的AIGC产值就30亿美金,大概是这么一个结构。明天来看,刚才周总、高总讲了一个观点我特别认同,就是客户的预期变了。原来是以为你一下去就是一个pilot,不是copilot。

所以有些用户对准确率不是那么敏感了,他觉得够用就可以,甚至有些客户由于成本和功能,自动选择从千亿参数模型改变到了14B甚至7B的模型,由于他知道本人要什么了,这是非常大的转变。

很多客户明天跟我们聊的时分,好像不需求这么大的模型了,由于这个量太大了。而且我觉得是一个copilot,我不需求把它直接变成最终的消费的结论,所以我觉得这是一个非常大的变化。

(, 下载次数: 0)

第二个我本人觉得市场为什么越来越好了,由于原来一末尾都是像在消费力的办公工具,或者说像Office 360这个方向转。如今看到越来越多不一样的场景,特别是To C的场景。原来是To B多,由于过去To B的融资比较容易,而如今看到To C的AIGC融资渐渐起来了。这和基础模型才能的提升,以及性价比越来越高是有关系的。

另外还看到了一个疾速发展的市场,比如智能硬件,尤其是穿戴设备和一些带摄像头的,或者带一些语音和麦克风的小的设备。

这些设备原来有一定的ASI或者TTS的才能,或者说有一些图象辨认才能,但泛化性很差,商业价值没有办法被发挥出来。明天我们看到淘宝很多类目外面,你搜消费电子产品后面加一个“AI”、加一个“智能”,鼠标、摄像头、耳机、手表排名都很靠前。几乎一切的智能硬件的厂商都在做这件事情。

由于明天不管从投融资角度还是从客户的预期角度,大家对大模型的认知越来越准确、明晰了。一末尾觉得什么都行,或者什么都不行,但目前需求末尾分层了。有些场景的准确率要求依然很高,需求做精准的幻觉控制,有些场景觉得不需求。我看还有人做审核,对后面一切链路做了大幅提效,这个场景还是挺有意思的。

我个人觉得越来越悲观,明天有跑不完的客户提需求,而且需求越来越分层,这是非常有意思的事情。
AIGC运用落地变现的方式

量子位金磊:接上去我们聊一个更直接一点的成绩:怎样变现,怎样赚钱?

还是想先请徐总分享一下,通义千问目前在C端没有采取收费形式,接上去在商业变现方面有怎样样的计划呢?

阿里云徐栋:我们对标其他厂商的话,比如ChatGPT就是订阅制,对用户收订阅费,根据工夫观察我们的action是什么,我想先分享一下大的逻辑。

我觉得一旦有新的技术出现之后,会构成新的产品体验,新的产品体验会把流量吸过来,疾速构成高地,基于流量看到有很多很成熟的商业形式。不管是广告,还是最早的短视频和直播,都跟广告和电商有关,还有些做金融服务、增值服务卖虚拟商品等等等等。明天还没有看到C端产品到两千万DAU,每个DAU时长超过60分钟,所以明天聊商业化或者长期商业化还有点过早。

而明天成熟的商业形式还是就那些,LM-Base的Agent或者说to C的运用,有没有能够产生一些新的付费形式?我觉得是有能够的。

有能够是一个订阅制的形式,但订阅制形式有点太泛了,需求订阅多个AI Agent,不同Agent之间怎样通讯,这些东西能够都是随着下半年multi-agent架构越来越成熟再处理。比如一个To C产品背后不是一个模型,它能够是多个模型,甚至少个模型下面分装出的多个Agent,之间会互相通讯。

我在线下跟高总聊multi-agent这个架构,这个架构其实将来可以看到这样的状况。

假设我们努力于做一家量化教育的基金或者私募,明天首先需求一个做基本面分析的分析师,需求一个在二级市场搜集信息、爬取数据的一个角色;同时需求有个写代码的人;另外还有去应战后面一切人逻辑的反对者,它能够就是multi-agent架构。基于这个架构能够就会产出一个小型的私募量化买卖公司,有能够持续迭代,甚至能够会比人的例如效果会更好一点,由于它一切记忆都会存在,也很感性。

我想当下单个To C,尤其是像ChatGPT场景,是不是订阅费是独一的方法呢?我觉得如今聊这个能够过早。我们可以到下半年看一看,看看有没有新的商业形式可以跑出来,不管是Kimi也好,还是其他的厂商。

我们看到如今流量增长都非常快,但是详细怎样收费,我觉得是一个短期还没有那么明白,可以观察一下下半年基于multi-agent架构,或者多模态的架构,有没有新的商业化的能够性出现。

(, 下载次数: 0)

量子位金磊:那么高总,请问我们产品面向B端停止商业变现,是按需付费还是其他的形式?以及对将来新出现的变现形式有什么样的想法?

轻松高玉石:我们是健康保障的科技公司,做很多东西还是围绕着既有业务和生态整合的。所以我们变现形式相对非常纯粹的AI公司来说更自若一点。

我们目前的产品次要服务大量C端用户,他们对健康有很大的需求,包括还有一些机构、医生。所以说我们变现形式是围绕这些用户做的。C端围绕增值服务,我们提供一些保险的保障,还有健康TPA的服务,包括用户可以经过商城、经过健康管家的服务来购买我们健康的产品,甚至有些用户对于我们客户的知识比较感兴味的话,可以买高端科普的内容。

而B端次要以安全付费的方式。一类像医疗、医药的机构做临床研讨,他会做一些付费,另一部分则是还有很多的机构的用户,有健康教育的需求,这类需求也是可以得到满足的。

(, 下载次数: 0)

量子位金磊:那么周总这边呢?

澜码周健:我们做AI Agent,最近大厂把这个品类炒起来了,甲方如今要采购一个Agent平台基本上成为共识。这是传统软件的方式。

还有一些运用的方式,不管像刚才提到的信贷尽调报告,还是政策解答,我们看到有一种能够性,可以按照数字员工按月收费。由于如今很多业务的客户,比如像某个分行在很多时分去采购GPU算力非常困难,需求找算力厂商。这套用如今比较时兴的词来说就是,AI智能体是新质消费力,专家知识、模型、算力都是全新的消费要素。

假如算力厂商情愿以租用的方式,倒过来变成分行每个月雇佣员工一样付费,再分成分给模型或者说算力的厂商,这是如今正在探求的一种新的商业形式。

(, 下载次数: 0)

AIGC运用的价值

量子位金磊:好的,那接上去这个话题是比较开放的:AIGC运用的价值。

由于三位嘉宾每个人所身处的细分赛道也是不同,想必感受也是会有稍微的不同。我们按照顺序,从高总这边来依次聊一聊,您觉得什么样的AIGC产品才算是好产品,才算有价值,这个有价值的标准是什么?

轻松高玉石:从企业运营角度,特别这两年基本上各家企业都比较频繁的提到一个概念,就是降本增效增收。假如我们把它扩展到C端的层面,能够还会有一个体验的点。

我觉得这四个点异样适用于,如今去评价AIGC产品到底有没有价值。就是对于个人,对于企业,对于社会有没有做到降本、增效、增收,或者说带来很好的体验。假如能做到其中的一到两个点,我觉得这个产品在严厉意义上是有价值的。

(, 下载次数: 0)

量子位金磊:徐总呢?

阿里云徐栋:我觉得大家思绪差不多,看ROI。

这样一个场景,或者产品,或者用了大模型,用和没用之间的差额是什么样子。大家都知道用大模型是有成本的,而且成本不低,最少从目前来看,背后是跟GPU挂钩的。所以我觉得ROI这件事情是衡量到底有没有价值的第一标准。

但是每个企业来评价ROI的逻辑和方法是不一样的。比如一个场景是,一个企业每个月大概有百万左右的询单,但是销售只能接触其中10%的订单,缘由是大量商品是非标的,需求去经过工单的方式问技术人员,技术人员给他一来一回的反馈。那假如你让客户来补充这个信息,客户能够只发一个截图过来,我只需这个商品,你给我报个价。所以在这种场景下面,90%的生意都丢失了。

但假如在这种场景下,用AI的方式就很容易了解。用一个chat bot也好,还是说可以自动生成一个报价单,让90%那本来会丢掉的生意可以接起来,这就是对这个企业的ROI的非常正面的场景。

所以在这种场景下,对成本不会特别敏感,就会达到非常好的ROI的效果。

但这个前提也很复杂,需求建很好的知识库、需求把RAG调到本人觉得可用的形态、模型推理效果要好、最后生成的格式是相对标准化的,并且能够还要嵌入到工作流外面,能让最终销售人员点击确认……所以还是一个比较复杂的体系。但很分明大家能感遭到,这个场景是ROI比较高的场景。

(, 下载次数: 0)

还有一些用法不一样,就是短视频公司、互联网公司,拿大模型或者是AIGC内容做导流。大家都知道通义千问下面有一个场景叫做全民舞王,给一张照片能让外面的人跳起来。由于这个场景非常有意思,能做流量转化,很多互联网公司情愿拿这样一个场景对外投放,投放能导回到APP,对他来说也是算ROI。

所以我觉得每个行业、每个场景的价值判别不太一样,但是独一标准是看投出去算力卡的资源和最终收益比例是什么样子。有的很敏感,有的不一定很敏感。

比如按照云计算的逻辑看,其实手游绝大部分都在云下面。当时我们测算过,云的成本占手游公司的支出差不多是2%-4%,这就是ROI非常大的场景。由于手游核心成本除了人力之外就是服务器的成本,由于要扩服。

我觉得假如将来大模型的成本或者算力的成本,可以占到客户营收或这件事情的10%以下,那我觉得就是非常成功,行业变化一定非常大。

量子位金磊:那么请问周总这边,您觉得什么样的AI Agent产品是有价值的?

澜码周健:第一个是所谓的岗位增效。过去AI 1.0时代,是用数字化的方式把岗位的反复性工作替代掉。明天提供了一个能够性,是说可以用专家的方式把这个岗位的部分义务自动化掉,这其实是一个很分明的提供价值的方式。

第二个是管理的增效。我们如今有个客户是做中介平台,买卖员很多信息其实没有被传递到其他买卖员那里去,AI Agent就相当于在流程当中,可以把这个信息更有效、更及时、更可信地传递出去。

(, 下载次数: 0)

过去不断说火线听得到炮火声的人可以呼唤炮火,但中间还是需求经过人去传递信息,所以速度会慢,信息会有失真。明天假如中间是一些AI智能体去担任传递,火线能够只是把这个信息像无人机一样传递回去,后台由Agent总结,再让专家做出决策,这能够会带来更大的价值。

就像我刚才提到的,我们有服务过一个猎头公司,他外部有700个猎头,一年能够发4500个offer,最终接受offer的只要3000个,剩下1500个是优秀的候选人,那么能不能经过他外部的700个猎头把这1500个优秀候选人的线索传递出去?这产生的价值其实很难用岗位增效去衡量。本质上,基于大言语模型的AI提升了信息处理的消费力,我们其实能看到它在管理上的增效。
One More Thing:百模大战,还有必要吗

量子位金磊:熟习量子位的冤家都知道,在我们公众号文章底部,常常会有一部分内容叫“One More Thing”,这次我们在圆桌也设置了这样一个环节,想请三位嘉宾发表一下本人的看法。

如今AIGC运用的产品越来越多,对于市场和用户来说是一件好事情,可以促使产品本身变得愈加优质。但是反过来看底层的大模型,去年百模大战的盛况,如今还有必要吗?训那么多的大模型,是不是资源的糜费、反复造轮子?以及会不会出现大模型层面上的一次大洗牌?

先请高总聊一聊。

轻松高玉石:百模大战假如是高质量的、的确投入真金白银去做的,我个人觉得是比较有价值的。

由于目前AI这一波的发展,特别是生成式AI这一波的发展,全体还是暴力美学的逻辑,是靠大量堆算力、堆数据去做的,就是一个典型的scaling law的方式。所以说为什么会这样,它的一些实际到如今也没有完完全全地透彻出来。整个模型从训练到推理各个环节,如今也还是有存在很多需求去探求的地方。

举个例子,我在前两天看到中科院发了论文,意思是说百度贴吧的弱智吧是最强的中文语料库,训练处理模型的效果甚至要超过豆瓣、小红书、百科这一类,过往以为是非常高质量的传统内容平台。

所以这种高强度的竞争,必然会加速对未知、未确定东西探求的过程。而这对于加快整个AI一系列技术的发展是比较有价值的。只是在这个过程中,能够适当做得更开放一点,可以缓解一些资源损耗。

(, 下载次数: 0)

至于会不会出现洗牌,我个人的观点是看如今整个AI技术发展的曲线,依然是非常峻峭的,还没有看到任何放缓或者说见顶的态势。在这种状况下,其实很难判别会不会见顶。

举一个最分明的例子,AI视频范畴,在去年像Runway或者Pika基本上就是风头无二的形态,但是往年终Sora一出,整个AI视频范畴竞争态势发生了很大的变化,如今像Runway或者Pika的处境也是挺巧妙的。

但是这不代表着一切东西都是不确定的,我觉得还是有一定的确定性。由于目前这一波AI是重资本、重算力、重数据、重人才大的方式。所以洗牌大概率会发生在科技巨头,或者说这些巨头支持的创意公司。而且我个人觉得后者的能够性会更大一些。当然目前还是局限于整个基模这一套,由于在运用层面完全是另外一套逻辑。

量子位金磊:那徐总您觉得如今还需求那么多大模型吗?

阿里云徐栋:假如站在我的工作角度当然不需求,大家用通义千问就可以了。

理想上我们可以把这个成绩稍微分析一下,看看是不是一切大模型都是同质的?假如都是同质的,那么这个成绩可以讨论一下。

大家知道过去很多做基模的团队,有一些做垂直模型,比如做金融模型、做教育模型等等。以我们的观察来说,这样的方向能够有一定的价值,由于其实是它们有独立的词表、有本人特定的下游义务,有一些本人finetune用的数据对在外面,包括对齐的方式都不一样。所以我们能够还需求讨论一下,所谓的基础模型强调的是一切东西都懂,而且还有很好的泛化性。

那垂直模型将来不一定叫垂直模型了,有能够叫垂直的Agent,有能够由于下面的插件会有差异化所独占的特点,它的词表到下游义务、到对齐方式能够完全不一样。甚至可以阉割掉很多基模原有的才能,就为这个场景服务;有能够能在成本和功能方面做到极致。

其实市场有很多小的模型,其实做得也非常好,就是专门做闲谈方面,成本极低,千token的成本甚至可以做到1厘以下,这也是非常好的方式。

所以我觉得关键看训练这个模型的团队目的是为了去对标ChatGPT,还是说处理详细的成绩?这能够会不太一样。这是第一个角度。

(, 下载次数: 0)

第二个角度是,过去这样卷挺好的,好在哪里?好在人才都渐渐被培育出来。过去很多人才都是从NLP或者CV范畴渐渐转型到大模型,去做这件事情。大家卷到后面会发现一个成绩,其实并不是要做模型架构,而是很多人会重新了解数据工程。

什么叫好的数据、数据的多样性是什么样子的。比如音乐数据和语文数据和数学数据,多样性是什么样子的;每个数据怎样构建复杂度。由于数据构建越复杂,最后的效果能够会更好。

另外什么叫做好的数据质量,包括不同的数据的配比。为什么我觉得这件事情是有意义的,是由于很多基模的知识阅历,将来完全可以被复用到在下游义务的finetune环节。由于知识会传播,所以有这么多人才做这件事情,这对将来整个模型探求商业化,最终搭出足够有用的、正ROI的Agent一定有非常大的协助。

所以从我的角度来说,我觉得过去卷一卷并没有形成太多糜费,还是挺好的一个方向。当然也特别欢迎大家多用用通义千问,不管是开源还是闭源的,由于效果的确还是不错的。

量子位金磊:最后请周总谈谈对于这个成绩的看法。

澜码周健:我觉得既多又不多。我挺赞同徐总讲的,攀科技树这边最后应该只会剩下几家,由于中国并不需求一百家可以追逐GPT4、GPT-5的大模型公司。

明天从商品的角度下去讲,往下细分,比如像代码的生成模型曾经分明占据一个品类了,而其他的大家如今更多都是在用13B、33B、72B,这是很诡异的一件事情。包括像大家买商品买的是代码模型、金融模型,不会买一个多少参数的模型。我觉得不同专业场景下会有不同的数据集,他们可以发挥出来更好的用途。

(, 下载次数: 0)

当然,由于这波风潮,预备好了这些人才,随着产业逐渐分化、融资游戏结束之后,二线大模型公司要找本人的定位,就需求进场景,找我们运用方、场景方合作做一些市场,正向叫Scaling law,反向实践上它需求的算力并不多。其实越小的模型,通用功才能会越弱,只能用作专业性。而就专业性状况来讲,13B能够需求100个,70B能够需求10个,万亿模型只需求2、3个,这是我如今能看到的状况。

而我们这样做Agent的厂商,希望在各种场景当中选需求的模型,如今模型都没有什么描画,包括产品、feature、list都没有,需求各种各样去测才知道什么场景用哪个,这是行业最早期的时分。

我置信跟软件行业一样,最终会细分到ERP、CRM、OA等功能,而不会说我这是7B模型,我这是33B模型。并且下半年逐渐会出来细分的模型,下面做运用的厂商就会更容易一些。假如每个运用厂商都要测,太糜费整个行业的精神了。

量子位金磊:非常感激三位嘉宾从不同角度数据、人才、资源等等方面分享本人关于这个成绩的观点。由于工夫成绩,这场圆桌到此结束了。至于AIGC运用下半年又会怎样发展,我们明年大会再揭晓答案,谢谢大家。

— 完 —

量子位年度AI主题策划正在征集中!

欢迎投稿专题 一千零一个AI运用,365行AI落地方案

或与我们分享你在寻觅的AI产品,或发现的AI新动向

(, 下载次数: 0)

点这里👇关注我,记得标星哦~

一键三连「分享」、「点赞」和「在看」

科技前沿停顿日日相见 ~






欢迎光临 职贝云数AI新零售门户 (https://www.taojin168.com/cloud/) Powered by Discuz! X3.5