随着互联网的不断发展,黑产产业链也急剧发展上去,并有着复杂而建立的体系。本文作者针对抖音其中一个黑产场景的一些作弊动机进行了剖析,让我们一起来瞧瞧吧。
这篇有点标题党,文章并非完整的在写抖音黑产产业链。而是针对抖音其中一个黑产场景的一些作弊动机进行的产业链不完整剖析,以及包括怎样辨识和严打,限定到这一个小场景来进行的讨论。
整个黑产产业链有着复杂而建立的体系,过程中还有可能有其他一些可能的作弊形式,但未展开,例如要做任务须要先交 20 块钱押金才可做任务,目的是骗押金。
一、背景
昨天下午接到一个来自台湾的固话电话,顺手接了,对方一口西北口音(描述事实,无地域歧视)的问乐意在抖音做任务吗,问了下啥任务,开始介绍任务。
在 QQ 群内接任务,5-20 块钱一个任务,任务包括搜索某人,然后关注、点赞、评论他的内容,任务完成后将截图发群里,通过红包方式领取奖励(下图来自 QQ 群)。
二、产业链
从台湾地区+东北口音,就几乎可确定这是个成熟的产业链,所以这儿准备把产业链做一个些细拆。
1. 做任务产业链
这类型创作者一般属于某个工作室(或者称作帮会、MCN 机构),甚至可能没有真实的创作者,而工作室+创作者就只是一个人,批量操作手机,批量操作帐号,批量生产内容(甚至可能是机器手动生成内容,或其他地方盗内容)。这里就假定一种简单状况,真的是工作室下边有一批创作者。
工作室联系黑产给旗下创作者点赞、关注、评论,这样做可能的动机:
高关注,生产的内容高互动,接广告时能领到更高价钱
例如行业内估算广告价位的一种方法是粉丝数 * 一定比列(例如 5%),例如你有 100w 粉丝,则一条广告 5w。接广告的估算价钱形式好多,不同行业、不同平台、不同创作者都可能会不同。
内容获得高互动,平台会给到更大量级的爆光(这是抖音的分发形式),进而让更多正常用户听到,进而形成正常的互动行为(点赞、关注、评论等)
早年积分墙行业也有类似操作,官方买流量刷下载,目的是刷高在 App Store 的排行,进而得到更多爆光,带来正常用户的下载。
用户作弊动机可能还为其他,但我对抖音业务不足够了解,这里就以这两种来讨论。
黑产结伙电话联系我,加群,群里发放任务,去做任务并截图,截图发群里,发 QQ 红包方式结算任务奖励。
2. 作弊结伙产业链(黑产产业链)
「作弊结伙」也是一个产业链,他们也会有专业分工:
《风控要略——互联网业务反欺诈之路》
3. 拓展两本和本篇文章关系不大的两张图,其他行业的黑产产业链
《智能风控平台——架构、设计与实现》
《风控要略——互联网业务反欺诈之路》
三、为什么要严打
以上文中的两个作弊动机为例展开谈谈。
1. 增加互动量,得到更大爆光,进而带来更多正常用户的互动
内容获得了与质量不匹配的流量,导致消费者认为这个内容属于低质内容,进而流失。
对其他创作者不公平,消费侧人数和消费时间固定,所以能消费的内容量固定,当用户消费了这个刷量内容,其他优质内容被消费到的机率就增加了,进而造成其他创作者流失。
2. 增加粉丝量,接广告领到更高价钱
广告主投了广告,获得了高于预期的利润,例如 10w 粉丝,3000 元一条广告,实际上真实用户可能只有 1w ,则单用户成本实则高了 10 倍。时间长了,广告主流失。
其他可能的一些缘由,这个产业链会导致抖音用户被电信诈骗、增加平台整治成本等。
四、识别方法
打击之前得辨识,得晓得什么用户是在做刷赞任务、哪些用户的什么赞是做任务什么是真心想点赞、哪些创作者在被刷、哪些创作者的什么内容在被刷、哪些内容的其中哪部份赞是被刷的等等等。
通常会借助大量的数据剖析、反作弊策略、反作弊模型,基于用户行为、知识图谱、设备环境、内容等来辨识。
1. 基于行为
2. 基于设备环境/基础信息等 3. 基于知识图谱
知识图谱定义如下图,举个简单事例,账号A被判断为了作弊帐号,账号A在设备A上登陆过,当帐号B再去设备A登陆时,可能会判断为帐号B也有比较大几率属于违法帐号,然后用更严的策略、模型去判定它。
他们的关联可能是同一个设备、同一个IP、一些共同或相像行为、 同一个或有规律的爱称/简介、同一个模板的内容、同一个异常数字的提现金额等。
以上不管是行为还是设备,还是基础信息都仅列举了部份,都还可以无限扩充,都是基于对业务的理解能够更好的发觉。但有这种行为并不代表用户真的是在作弊,会存在刺伤,所以有时须要多个行为结合来判别。
例如单纯用行为 A/B/C 来判定就会出现准召率不满意,则可借助行为 A 的值处于区间 a,且行为 B 的值处于区间 B,且行为 C 的值处于区间C,则判定用户为作弊用户。
五、打击
在第四步早已辨识出作弊,所以她们一般会在作弊链条的各个环节都进行严打,下面列举几个严打思路,这些思路并非符合 MECE 原则,而是可能互相之间有交叉,甚至不属于同一维度的思路。
1. 作弊动机严打
通过业务或产品功能调整,提升作弊成本或增加利润,让用户不再有作弊动机。
2. 作弊链条严打
作弊一般是一个完整的链条,从链条每一环节都可进行严打,例如登入注册、访问、做个别行为等。但一般只会在旁边有业务价值的行为才能进行拦截,在前期不过分异常的用户,通常只会做标记,后期业务再结合这种标签来综合判定。
3. 联防联控严打
联防联控这个词近日听的最多的是在疫情防治中,在风控中也常用这个词,是指多个业务、多个部门甚至多家公司联合防治。例如在西瓜视频上作弊的用户,在抖音上也可能会被限制。
4. 资源层严打
因为资源理论上都是有限的,一个抖音注册帐号、认证帐号等在黑产市场都是有固定的标价的。
从资源层进行严打,目的是提升用户作弊成本,当成本≥收益,那用户也就不再作弊了。
我们可以对帐号、设备、IP( 针对 IPv4 可行,针对 IPv6 打击则适用人群小了许多,IPv6 理论上可以看做是无限的)、手机号等资源进行严打。例如把某一个设备判黑,则以后所有帐号在这个设备上登陆就会算作作弊帐号,这个设备将不再可用,提高了作弊成本。
六、最后
以上只是做生态整治的其中一个问题,生态整治有很多好多好多这样的问题须要解决,抖音也一定会有多种策略、模型,来辨识、拦截以及相应的处罚,来保持生态平衡。
注:以上是基于我对抖音不足够了解的情况下写的初步看法,结合具体业务可能会发觉个别不可行,或者有一些更好的严打形式。
给风控朋友推荐基本我看过的风控相关书籍,这些几乎我全看了,能够更好地了解风控概貌、更好地了解自己单位风控处于行业哪些水平、接下来还有什么优化方向等。虽然其中大部分都是金融行业,但好多通用逻辑都是一样的。