爱收集资源网

撬动短视频商机,快手联盟新杠杆!

网络 2023-08-23 15:07

嘉宾|白晓航、晁杨、谢淼

编辑|薛梁

伴随短视频行业的急速发展和快手商业化的加速繁荣,2022年快手联盟增速迅猛,作为联通开发者短视频商业生态联盟,快手联盟正在成为各行业撬动短视频商业红利的新杠杆。InfoQ技术会议旗下《大会早班车》直播栏目约请到了快手联盟营运负责人白晓航,产品负责人晁杨和中级算法专家谢淼博士,来从业务,产品和算法技术角度说说快手联盟近些年来在产研合作上的探求与创新。

InfoQ:随着短视频和直播近些年来已成为我们日常生活中必不可少的部份,互联网的这些新形态下,快手在广告业务上,有哪些新的探求,对于联盟的业务,有哪些特殊的期盼吗?

白晓航:广告联盟本质上是一个撮合平台,一端是广大的开发者(背后是各类各样的App),另一端是广大的广告主;联盟平台居中联接两端,提供统一的投放能力和变现能力。

快手做联盟的本意,是期望将快手在短视频和直播上积累的产品算法能力释放下来,在快手系App之外获得联盟流量的增量,给广告主提供更大的投放空间。

具体说来,快手联盟可以给广告主这种奇特的价值:一是流量和可触达用户数目巨大,快手联盟DAU超过8.5亿,这个量级远超大多数互联网App;二是流量类型丰富、用户群体多样,囊括游戏、工具、阅读、生活、运动健康、视频、资讯等等各种类型App。

晁杨:从产品角度,简单来说联盟广告有激励视频、信息流、开屏、插屏及视频流几大类,整体来说我们要依照媒体App的特性及用户的特点设计不同的广告形态。

逻辑上广告也是一种信息,广告的呈现跟你们日常听到的新闻、视频没哪些两样,只不过广告是为用户提供了感兴趣的商品、游戏等有别于传统内容的信息,我们在广告设计上用户体验是第一位的,希望给用户带来更有价值的信息。

在短视频和直播的赋能下,广告形态在广告呈现、用户交互上有了更大的空间,例如直播给广告带来了跟用户互动的全新形式,用户可以在快手联盟覆盖的App上实时观看丰富多样的直播,可以无缝衔接到快手App上,给用户带来全新体验的同时也给广告主提供了触达用户的新途径。短视频和直播给广告注入全新的想像空间,联盟会持续探求用户体验和新的广告形态怎样更好结合。

谢淼:优化联盟广告投放,我们较其他脑部广告联盟起步较晚,只有广告产品形态设计完成并打通投放链路后,我们算法能够发挥出价值,持续的优化AB和盘面促使广告的匹配效率更高。

可以说前期靠营运和销售获客,后期靠算法迭代拓客。从算法难度上,与在站内投放快手原生广告相对比,对我们提出了更高的要求和更多的挑战。

首先,联盟的环境更不稳定,外部App从流量和质量上变化程度都十分大,明天有100w的恳求,可能今天就10w了。

为什么快手播放量一直是1_快手播放量才几十什么情况_快手播放量只有几十是不是号不正常

第二点,是对用户行为理解的难度,相比主站,主站的用户黏性高,原生广告的转化率自然就高,但是随着时间的推移,我们能够积累大量丰富的用户行为数据,对用户偏好有特别强的挖掘能力。相比较而言,联盟上的流量是由诸多互联网App所组成的异构型动态流量池,即便是快手用户,她们在这种外部App上的行为与对快手广告的兴趣,与站内浏览时也存在巨大差别,并且把用户吸引到快手App中达成转化所需的链路更长。

第三点,优化的元素增多了,从站内的用户到广告的二元构成,弄成了外部App,用户再到广告的三元匹配,因而对算法的要求更高。所以从算法角度,我们期盼才能找到针对联盟复杂环境的算法建模方法,沉淀有深度的解决方案。

InfoQ:这么为了达成联盟广告的业务目标,从业务营运角度认为有哪些挑战吗?

白晓航:介绍联盟的核心痛点,内外循环可以一起说,之后突出给出冷启问题和业务上疼的程度。诸如可以拆成预算侧和流量侧冷启两个问题来讲,深度转化类型的广告在量和质上的要求,流量侧冷启问题等。

1.流量大且杂,怎么挑准适配流量;

2.冷启:流量大、异构、变动多;

3.直播广告时间短、要求快速起量。

InfoQ:冷启这个问题是行业内联盟的共性业务难点吗,还是快手广告的特殊业务问题?

白晓航:存在一定共性,而且快手原生广告的特殊性是短视频和直播,广告主对广告的深度目标达成有特别高的期盼,并且这些新业态的广告,本身在联盟的动态性较高的媒体流量中和广告做深度匹配时就存在很大的挑战。另外,快手原生的内循环广告在联盟是2021年才渐渐开始做的,我们对他有更高的要求,就是起量过程不能严重影响已起量广告的预算匹配效率。

InfoQ:那针对这个冷启的业务痛点,从营运和产品角度,怎么解决呢,有没有哪些现有的工具和手段?

晁杨:针对冷启这个业务核心痛点,我是如此看的:

(1)须要从这个产品的设计角度看这个事情,是系统性冷启问题还是少数个例,产研系统在冷启设计上是全局的,好多时侯冷启问题可能是比较小的点引起的,例如是否由于素材诱因引起于流量不匹配,因而量出不去;

(2)不管是全局问题还是个例问题,我们都须要从链路角度瞧瞧在线系统各个阶段的转化情况,定向地发觉潜在问题,各个击破,这个链路就是我们常说的投放漏斗,也是产研给营运朋友提供的工具之一;

(3)冷启是从无到有的过程,不仅系统冷启的机制外,我们也会从人群适配等角度挖掘符合行业特点的人群,帮助算法快速收敛;

为什么快手播放量一直是1_快手播放量才几十什么情况_快手播放量只有几十是不是号不正常

(4)多数的情况下从前面几个方面可以快速定位和解决冷启问题,但在系统有新能力上线或系统性出现冷启动问题时,我们要逼着算法专家们一起定位问题,共同去挖掘能解决这个问题的解决方案,哈哈。

谢淼:是,在大家的强压下,我们当然也成长了好多;

(1)在广告系统中,我理解的冷启问题的本质,虽然是因为每次恳求下模型对候选广告的预估误差造成的有效投放量少的问题,其实模型的误差是来自训练数据稀疏这个情况,这儿的训练数据的稀疏并不是单纯指样本量少,也就是说并不意味着量大了,一定没有冷启问题。

一般而言对于广告系统来说他是始终伴随着业务成长的,例如一个新行业刚开始投放时,肯定是数据量少造成训练数据少,模型误差较大,而且假如前面仅局限在某个人群上,或则某类广告上扩量,这么虽然他的投放量每晚达到亿级别,这么它依然是稀疏的,由于其别人群或其他类广告的样本几乎没有,也会造成模型预估误差。

为什么模型的误差会造成量起不来呢?由于广告系统中绝大多数都是ecpm竞价(千次爆光下的预期利润),而这儿的ecpm估算是离不开模型预估的,其实还有广告主出价的影响,模型预估不准,可以拆解为两种情况,模型预估过高,这么直接造成竞价能力变差,广告自然很难去领到量,没有量,也就不可能有太多的正样本,这么模型会持续偏高;

另一种情况,模型预市值过高,竞争力偏大,量是会有一些,而且会出现超成本,即投放了,并且没有实际转化,这些情况下,系统的调价机制都会被触发,会造成大力杀价,竞争力都会回归正常甚至弄成过高,量就变小了,前面当模型重训时,都会造成量持续变小。

(2)内循环行业的外投晚于外循环,因而在内循环开搞的时侯,已有好多行业在联盟上有稳定的投放,但是量不小,所以针对内循环的业务问题的建模,天然就带了个约束,即尽可能不影响已起量行业的前提条件下,让内循环广告在联盟起量。可见,这个带约束的冷启问题比单纯的冷启还要难。

要解决这个带约束的冷启问题,我们首先须要一类算法才能帮助模型破圈,即避免持续偏高或偏低的情况,MAB就是这类算法。直接用MAB来解决实际业务问题,必不可少地须要将实际业务问题建模为算法可解的形态,假如建模存在较大误差,则再优秀的MAB算法也很难取得利润。

这些面向实际业务问题,建立算法策略的建模,一般在实际落地时,须要的可能不止一种建模形态,而是一个问题建模的组合,并且她们之间是有关联的。

我们围绕着内循环冷启的这个事来剖析下,首先当链路打通后,系统虽然是个右侧冷启状态,对于媒体侧而言,联盟之前甚少投放过具有快手特色的短视频和直播类型广告,相像行业极少,而从广告侧看,所有的候选广告也没有投放过类似的联盟媒体流量,因而它是左侧冷启问题。

当我们针对这个问题进行合理地建模后,量上去了一些,这时,我们看见了一些媒体位的量从0到1进行突破了,骤然我们希望在这种媒体上的量能进一步扩大,那这个时侯,冷启问题就从左侧冷启问题转化为了单侧冷启问题,由于从媒体上看早已“热”了,这时他的核心问题就弄成了帮助某一给定的媒体位,来优化候选广告的位序,致使业务指标最大化,比如预期耗费最大化,于是算法的建模形态就弄成了单侧冷启的优化问题。

之后我们来想一下量进一步变大,会怎样呢?我们期盼模型越来越好,由于样本量减小了不少,渐渐地才能学到背后的规律,逐步演变为成熟状态,模型的预市值越来越准,且让人满意。这样不就渐渐产生了一套整体解决方案了嘛,在我们的实际优化过程中也见到了这种阶段所用的策略,互相承继和演变的关系和数据。

也泼个热水,在联盟中,虽然我们期盼模型绝对的确切,是十分不切实际的,虽然当有些行业投放量大了,也不可防止的是媒体侧流量的动态变化,因而像Bandit这些技术虽然就可以针对这些动态性持续地在线上优化,是天然的练兵场。

InfoQ:可以用白话帮忙介绍下,为什么这些算法能减轻冷启问题?为什么它能比随机这些,探求的更好,利润怎么测度呢?

为什么快手播放量一直是1_快手播放量才几十什么情况_快手播放量只有几十是不是号不正常

谢淼:MAB这类算法显然是在线学习和加强学习的交叉方向,快速学习(一条恳求学一次),并且能快速感知环境给的reward,即后验,借此来改变自己的决策行为,并通过权衡探求和借助,致使一段时间整体累计疗效最大化;所以这些算法即可以给候选透出的机会,又能在透出后的疗效中挖掘出实际质量较好的候选集合,持续地优选,在此过程中达到优胜略汰。因而能否在保证业务指标尽可能地达成的前提下,将消耗起量,提高匹配效率。这是一个动态的寻优过程,我们也有指标来评判当前算法所达到的状态,即算法的可收敛性。

并且随机这些策略,虽然是证明不下来收敛性的,因而疗效是无法评判的。另外,实际的收敛程度也说明了在哪些情况下能形成利润,假如单纯依赖模型,就可以做到绝对准的话,这么也就是说只要降低一定的探求成份,就一定是次优解,才会形成错误,致使Bandit拿不到利润,这儿的错误当然就是探求的成本,虽然就是“抛开经验,不一定每次都是对的,而且一旦比经验好,就带来了利润”,所以当且仅当探求的成本大于探求利润的时侯,Bandit能够形成利润。

晁杨:所以说我们之前采用的在AB上进行随机投放用于探求的做法,虽然是纯探求的过程,由于随机选定这些技巧,本身并不能收敛,因而疗效未能测度和保证。

InfoQ:嗯,虽然有了这类算法,冷启问题的确有解了,那上线还存在什么挑战吗?

谢淼:尽管MAB算法在业内已有一些成功案例,并且将MAB正确且才能获得稳定业务利润地落地,并非易事。实际上我们躺过好多坑,这种坑归纳上去有如下几点:1.问题建模;2.算法假定;3.超参数;4.算法链路长。

简单介绍下上述几点。最主要的虽然是怎样将对业务的理解注入到算法中,以最大化算法利润,我来讲个故事,国图优化中专业玩家的故事。这儿可能还有个更深的问题,假如上述坑都避免了,那是不是直接作用到业务能够取得足够的利润了?似乎不然,它可能存在更大的优化空间,绝大多数Bandits算法的提出,都须要在理论上对所提出的新问题的建模方式,给出可证明的累计懊悔度的理论下界(UpperBoundsofCumulativeRegret),并且在研究中可能存在为了获得一个可证明的“漂亮”算法,而阉割原有算法或则降低严格的限制条件,致使牺牲原有算法在大多数实际业务中的疗效,因而在落地时存在针对业务场景的优化空间,但是这些优化沉淀下来,就是业务的行业竞争力。

晁杨:业务理解十分重要,也是对合格产品朋友的要求之一,然而怎样将对业务的理解注入到算法呢?能具体点不?

谢淼:例如首先我们得解一侧冷启问题,对于我们而言或许就是盲探,用算法手动探求,而且假如能找到一些先验知识或历史经验,帮助我们把范围有效地缩小,这么可以加速我们算法的收敛;否则范围越大,我们难度越高,这个来讲,产品对业务理解可能更深,大家得挖掘下,争取才能比我们挖的准。

晁杨:我这儿讲讲电商零售等相像的外循环行业,用这种行业挖可能得POS,另外再讲讲人群的挖掘方式。

在这方面我们有比较成功的case可以给你们分享一下:内循环广告数为百万量级,历史的联盟流量探求中,因广告侧与要探求的流量侧的匹配数据较少,属于一侧冷启,跑量难度大,且容易超成本。针对该痛点产品上基于好的快手用户流量,对所有直播广告,都能有低于均值的转化,用这种用户去做增量探求,超成本预计会远高于当前无人群方向引导的POS盲探。将右侧冷启问题转变为单侧冷启,同时借助Bandit算法,疗效稳定性更有保障。

人群落地的思路:凭着产品对业务的理解,搜集电商、主站、商业化等多方数据,组合维度,基于现有投放数据进行人群评估,得出后验疗效显著低于联盟直播整体值的多个人群条件组合,再验证圈选的人群仍在联盟流量漏斗中存在足够增量机会。使用Bandit算法在这种人群条件上进行探求,逐渐收敛。通过在目标人群上领到较高的消耗增量,来推动整体消耗的提高。

谢淼:有了这种信息,有助于我们缩小探求的范围,集中战火,加速算法迭代。还记得之前俺们合作第一个优化点的时侯,就是这样,效率十分高,各司其职。

经过右侧冷启的解决方案的落地,我们须要建模一个从1到2的冷启问题,期盼广告投放量才能在某个媒体细度上进一步减小,这儿的策略建模方法可以是以某个媒体细度的实例为问题单元,即machine,来通过平衡探求和借助优选广告,打破模型预估所深陷的局部最优解,这么这儿在落地时才会遇见一个棘手的问题,就是媒体侧变化太大了,若果选择的维度变化大,算法就可能存在没有收敛趋势的情况,即难以稳定,在这些情况下,探求成本就比借助带来的疗效下降要大好多,因而获得不了利润。这个问题的确头痛了好久。

白晓航:这个点,我们营运可能有发言权,讲讲对顾客的理解,推导入媒体行业和媒体场景的叠加细度会较POS更为稳定。

快手播放量只有几十是不是号不正常_为什么快手播放量一直是1_快手播放量才几十什么情况

谢淼:对,融合这个点后,经过实验,俺们作出的首版优化就是基于这个理念。假如我们自己穷举维度,一个个试,恐怕得拖几个月才会上线。

晁杨:从流量和广告侧角度看,每两侧都有好多影响诱因,例如流量侧有App、POS、ADStyle、流量行业、用户行为等,广告侧会有定向、创意、出价及人群等多个抒发,从探求的角度出发我们有好多可拆解的冷启子问题,产品可以针对那些子问题,不断挖掘新维度,给到算法提高迭代。

谢淼:对,那样的话,我们得解决这种策略叠加的问题,我们得设置大的兜底,以避免超成本的发生;于此同时,我们还要继续进行更深的算法研究,以应对产品在人群和维度上的迭代,例如随着产品挖掘人群的程度越大,挖掘下来的人群可能种类就随着增多,于是我们就须要考虑那些所带来的迭代问题,怎么让算法手动适应越来越多的圈圈?这儿可介绍下AutoBandit的思路。

晁杨:这样一来,我们就可以并行迭代了,分别开实验看疗效,螺旋上升。从今年的合作疗效上看,我们的AB提高幅度达到了翻翻的指标利润,AA上看的确量上去了几十倍,但是对已起量的其他行业广告,没有明显负向。

白晓航:从我们营运角度,须要平衡算法风险和广告主利益,介绍下平台保护广告主利益的机制。广告主不用害怕算法迭代影响自身利益。

白晓航:我认为这样优化行业盘面是没有问题,然而我这儿的问题还有重点广告主的营运,我们得做营运活动,冲击消耗盘面,得满足广告主各自的诉求,这儿可能跟盘面的优化向矛盾,我们该如何解呢?

晁杨:提产品理念。在广告系统的产品设计上我们既要全局盘面最优,也要兼具重要节点和重点顾客的诉求,为了解决营运朋友面临的那些问题,产研对营运工具做了大量的平台化工作,主要是让工具产品才能愈发智能化,例如上提及的多配置、不断调参等可以通过约束目标的方法,交给系统去探求,提高日常使用的效率和疗效。

谢淼:我们之前也根据这些方法做过好多工作,比如针对绿通,我们可以以Bandit算法为基石,做个指标正向且理论上可以配置无穷多个候选的非圈占绿通,介绍下原理(自创的non-stationarye-greedy算法)。另一方面,在营运干预广告主出价的工具上,我们可以用Bandit来进行对出价干预力度的手动控制,营运只需设置上下界即可,而非直接固定一个干预力度。

InfoQ:听起来大家之间的合作还是蛮紧密的,这么在互联网公司中,合作都是这样的吗?还是大家摸索下来的,我理解产品像是个PMO角色,并且在大家的合作中如何还承当了数据剖析和业务理解的工作?

晁杨:这是一个十分好的问题,在回答产品工作内容之前先简单说一下我理解的商业产品有哪几大类,平台产品、用户产品、策略产品等,产品确实在工作中承当了一部份pmo的角色,除此之外产品更多的工作内容是怎样解决业务问题,这个解决问题包含了深入业务、发现问题、理解问题、抽象逻辑和给出解决思路,对产品朋友对不同行业顾客的商业模式和投放系统的理解有特别高的要求。

日常跟算法打交道比较的多是策略产品朋友,我自己概括策略产品的价值可以用一个词“idea”来概括,idea包含了前面讲的全部,这个idea就是解决某一具体业务问题的策略思路。产品朋友给算法提需求的时侯须要讲清楚业务问题、数据逻辑和解决思路,我们常说的强化同算法的对话能力就是指提需求的过程,面对具体业务问题产品须要找到其中的机会点,数据和逻辑上验证可行性后再去与算法联动,同算法朋友一齐阐述思路实现并不断优化。

通过上述的项目合作,我们在多行业取得了明显疗效,例如内循环,业务利润,尤其深度下降了数十倍,游戏等外循环行业在AA上,也取得了较好的冷启疗效。

谢淼:在合作中,我们也沉淀了一些经验,被动的等着产品提需求,常常有逆反心理,虽然是在给算法找bug,因而得化被动为主动,将这个需求转化为算法的一部份,而且将算法领到的利润与产品分享,达到共赢。

举个反例,当时做直播广告起量的时侯,有个问题就是不可能一下子对所有广告主都起量,因而我们得贴着业务特点,挖一批最优潜力的大V主播下来,挖的方式有好多,产品很擅长,但是可以通过历史数据,先简略验证一下,最后把最佳的几个后选,我们领到线上实际配合算法策略做ab实验,取得了业务利润,这么未来随着时间的推移,这个挖掘的方式也应当会与时俱进,产品可以自行通过离线剖析和在线ab来迭代,因而假如没有营运给出的行业建议,没有产品的业务理解作为补充,AB的利润可能也不会这么大,或则须要更长的时间摸索。

快手播放量只有几十是不是号不正常_快手播放量才几十什么情况_为什么快手播放量一直是1

InfoQ:这样的确看起来,摸索出了一套技术、业务和产品的闭环合作方式。这么在此过程中三方分别积累了哪些能力呢?是否能在不同的专业上各取所需?

白晓航:分享营运理念,摸索沉淀了一套营运问题及其对应的剖析和营运工具契机,但是将gotomarket市场走深的顾客需求带给合作团队。

晁杨:在此过程中,产品对业务的理解愈发深刻,但是发觉的机会点也越来越准,也在跟算法合作的过程中,了解了算法运作机理,同时也看见了能通过业务理解对系统形成正向影响的契机。

对于新行业的起量,积累了方式论,对于新的顾客诉求,也有引诱算法进行针对性优化的契机。觉得其他类型的业务问题,这个方式论仍然奏效,核心是找到双方优势互补的地方,而不是干干地做提需求的一方,也应当拥抱算法所提出的需求。

谢淼:在探求出有效地合作模式后,我们就可以沉下心做更深入的算法研究且迭代业务认知,致使算法能力持续在行业保持领先,比如随着算法落地和走深,我们发觉好多有意思的待解问题,例如刚才讲到的Bandit算法作为算法策略的一部份,是可以起到对模型预估纠偏的功能的,并且模型一定能随着样本的增多,预估就一定能变准吗?不一定,或则说在业务中须要很长时间可能能够感受到预估渐渐变准的过程,这么能不能将深度学习模型和Bandit算法融合上去?针对这一点,我们是有一些研究成果的,同时这个问题也是学术界近些年来的研究热点问题。

往深一步,假如才能从产品的需求中抽身下来,我们就能畅享一下,通过我们的努力,促使Bandit的学术成果转化为业内生产力愈发方便。

InfoQ:冷启问题,不光在广告系统中存在,虽然好多在线系统都存在这个问题,市场空间是不是也蛮多的?从技术本身,能塑造技术、产品到业务的闭环吗?

谢淼:嗯,是的,冷启问题在互联网上的应用场景是十分多的,我们每天都能听到成百上千的新App在应用市场上架,其中每位新App就会碰到冷启问题;具体而言呢,小到推荐场景中的一张图片,一个视频的封面图,都须要优选,这个是很难依靠一个深度模型直接优化的,是典型的冷启问题,再例如一个场景中的新款推荐问题,大促上的问题,日常和大促用户行为和兴趣均不相同,在线系统中的参数调优问题等,所以只要能建模为选择性问题且模型不能给出特别准的预估时,都是Bandit算法的适用范围。

因而倘若我们能将Bandit算法弄成算法产品,让更多的业务可以十分低成本的接入,则将是企业降本增效,明显提高生产效率的一环。Bandit产品化,核心能解决理论工作到实际落地的鸿沟,将采完的坑,加到产品功能中,帮助顾客避坑。

这么怎么完善该产品的门槛呢?我们尝试通过如下三个方面来进行建立壁垒:(1)提供基于实践经验的避坑功能,帮助用户有效防止典型的应用误区,例如应用环境和算法假定手动审查,在借助UCB,TS等不能支持大量arm的算法时,手动检查arm的数目是否过多;(2)提供就能快速收敛,领到指标利润的功能,比如产品支持算法应用范围导出功能,把业务中不适宜探求的部份过滤掉;(3)不断地以应用中的实际问题促使算法的创新,并将这种创新转化为产品力,比如我们针对给定业务场景,通过AutoML思路,手动地通过Bandit算法寻优超参,甚至直接寻优Bandit算法本身的AutoBandit,减少应用时对人工经验的依赖,真正做到智能寻优。

活动推荐

2023年4月21-22日,ArchSummit全球构架师大会将落地深圳·明捷万丽宾馆。来自阿里、顺丰、保时捷、肯德基、蔚来车辆、Shopee等企业的技术专家,凑合微服务构架、大数据构架、开源、国产软件、制造业数字化变革、金融业数字化变革、人工智能、架构师进阶等主题展开分享讨论。

如今买票可享8折特价,单张立减1760元,买票及其他问题咨询请联系票务朋友:18514549229(陌陌同电话)

快手播放量只有几十是不是