因此我想先从宏观上解释一下大模型对引荐系统的实践意义到底是什么。我的了解中,大模型宏观上在三个层级上改变了这个世界,也异样是在这三个层次上改变了引荐系统。
一、大模型改变了“知识学习”的方式
大言语模型的出现,特别是多模态大模型的出现,毫无疑问改变了 AI 学习了解知识的方式。传统的深度学习引荐模型对知识的学习其实是封闭式的,它依赖人工的内容型特征的挑选和构造来学习知识,同时它的知识范围普通限于公司的外部引荐数据。而大模型的知识学习是开放式的,一个大模型就可以融会贯通开放世界中能获取到的几乎一切知识,这是之前没有技术可以达到的。
本质上,多模态大模型这里被当做了一个功能弱小的 encoder,过去我们想构造一个多模态引荐系统,还需求为相应的模态分别构建 encoder,如今一个预训练的多模态大模型,或者是成熟大模型公司的 api 就处理一切成绩。详细的方案有很多,比如下图的 MoRec 运用 Switch 游戏的引见图片和引见文字构建多模态特征,停止游戏引荐。
(, 下载次数: 0)
上传
点击文件名下载附件
MoRec 交融多模态特征的过程
比如在 MKGAT(Multi-modal Knowledge Graphs for Recommender Systems)方案中,把图片,文本描画信息,结构化信息等多模态的 Embedding 经过 FC layers 整合起来,构成更片面的关于物品内容的 Embedding 表达。MKGAT 其实是一个比较老的方案,当时的图片类信息还是采用 resnet 作为一个编码器,如今通用的做法就是交换成大模型把图片转换成 Embedding 或者图片描画型 tag 后输入引荐模型。
(, 下载次数: 0)
上传
点击文件名下载附件
MKGAT 方案中的多模态 Embedding 交融方案
再比如快手的多模态引荐模型方案 EM3(End-to-end training of Multimodal Model and ranking Model)。可以看到其最大的特点是用多模态大模型抽取出用户行为历史物品和目的商品的内容特征,Embedding 化后供后续模型做特征交叉。值得留意的是,ID 型特征还保留在模型中,由于 ID 特征和多模态内容型特征是互补的关系,二者包含的信息是不可互相替代的。
技术方案上,GR 也可谓是完全脱胎于大模型的结构,直接推翻了传统引荐模型 CTR 预估式的 point wise 模型结构,而是采用生成式言语模型的结构,从预测点击率的成绩,变成预测用户下一个行为是什么这种生成式引荐的成绩。针对这种新的成绩提出方式,模型的结构也完全遵照 LLM 的序列模型结构,输入的特征也全部通用化为序列特征的方式。毫无疑问,这是革命性的。
GR 的工程优化方式也是非常巧妙,比如模型一次 inference 即可生成对一切候选物品的预估结果,模型的 transformer 结构停止了高效的简化等等,可以看出 Meta 的工程师们是在竭尽一切智慧和技巧推 GR 上线。
(, 下载次数: 0)
上传
点击文件名下载附件
Meta 的 GR 模型与深度学习引荐模型结构的对比
Meta GR 的珠玉在前,应用 LLM 结构优化引荐系统的各个模块似乎一下子成为了新的盛行趋向,并有不少公司拿到了实在的业务效果。召回层、粗排层、精排层的模型方案都有了大模型的影子。这第三阶段大有百花齐放的趋向。这里举一个比较有代表性的例子是快手的基于 Transformer 的召回模型 KuaiFormer。
和 Meta GR 一样,KuaiFormer 也把过去“视引荐为分类成绩”的做法改成了“把引荐视为预测用户的 next token”的成绩,于是就可以应用 Transfomer 的结构预测用户的 next interest embedding,再把这些 embedding 当作 ANN 召回的索引 Embedding,就完成了 LLM 思想对召回层的改造。可以说,这类方案的核心是用训练 LLM 的思绪处理引荐成绩,用 Transformer 为基础的模型结构。
再比如,目前曾经有一些模版化,规则化的 AI 生成视频,在短视频平台上获得了非常不错的点击量。我想下面一些 AI 生成的视频你一定刷到过。
(, 下载次数: 0)
上传
点击文件名下载附件
这里我要强调的是,目前一切的 AIGC 产品,还都是需求人类介入的,人类要提供最最少的指令型 prompt,比如生成内容的核心要素是什么,生成广告创意的大致样式是怎样的。这间隔完美的个性化 AI 生成视频还有一定的间隔。我想 AIGC 最大的想象空间是将来的引荐系统将根据用户反馈完全自主的生成用户想看的内容,不再依赖人类的参与,达到完全自主的用户 -AI- 引荐系统闭环。
目前有一些探求性的研讨,比如个性化的电影海报生成(PMG: Personalized Multimodal Generation with Large Language Models)。它的次要逻辑是把用户的行为历史交融到电影海报的生成过程中,生成针对用户爱好的个性化海报。这类方案从商业逻辑上还不完全成立,但大家应该能从这个方案中了解到 AI 个性化内容生成的大致框架。
(, 下载次数: 0)
上传
点击文件名下载附件
PMG 个性化海报生成
发散一点来说,AI 生成越来越多引荐内容之时,另一个关于 AI 伦理的更宏大的命题又应运而生,假如真的有那么一天,AI 生成了一切人类乐意看的引荐内容,人类情愿活在完全由 AI 引荐系统创造的高兴世界里吗?人类终究还是需求与其别人类的灵感碰撞才是真正高兴的吧。引荐系统的信息茧房,甚至哲学意义上的“缸中之脑”成绩,终究要在 AI 进一步发展滞后寻求一个答案。
深度学习引荐系统 2.0 时代对引荐系统下一步打破的探求
最后谈一谈作为引荐、广告、搜索范畴的从业者,如何对待引荐系统下一步的破局点以及对职业发展的一点建议。
首先我旗帜鲜明的以为,搜广推行业没有寒冬一说,它只是不断在退化,不断在寻求进一步的增长点。就像 2014-2015 年的时分,深度学习的革命片面到来之前,大家也是都在谈广告效果停滞,效果广告行业瓶颈。理想是,那是一个 LR 模型就能一统江湖的时代,大家口中的效果瓶颈在后来人看来是完全不存在的,在那波深度学习革命中被淘汰的,是一批靠着规则引荐、靠着营销、甚至效果作弊红极一时的公司。