一看怎样定义内容;
二看怎样定义人:常年属性、中期属性、短期属性;
三看怎么设计人与内容的互动。
以及背后的价值观:
基尼系数
快手在内容消费端的人工智能技术主要围绕三个核心:定义内容、定义人、人与内容的互动。理解它的机制,对内容生产者而言就可以更好地有的放矢、生产出传播更高效的内容。简单来说,想要你的内容怎么更容易被机器辨识和“喜欢”,首先你得了解机器运作的原理。
定义内容
编者按:每一次推测都是一个弱决策,大量的弱决策叠加在一起就产生强匹配。也就是辨识图文和视频。到目前技术的发展,图文辨识已然很先进了,例如它能辨识出一篇文章的分类,也能辨识一片文章的情感,判断文章抒发的喜怒哀乐、褒贬心态。但视频的机器辨识技术还没有这么确切,假如要辨识一个视频里有没有黄赌毒,就很复杂了,仅仅通过机器辨识图象后提取的概念是不够的,还须要大量的只有人类才会判定的常识信息才才能确切判别。同样,机器也未能通过一次辨识就判定这只视频是否受欢迎。
所以采取了这样的办法:当一则视频上传到快手,机器先会抓取一些特点、提取信息,例如辨识主体、表情、场景、图像质量、OCR文字辨识、音乐、声音提取的文字等等。诸如可以辨识出一只兔子,在草地,同时机器会进一步找寻视频里的细微特点,每一个特点都是机器的猜想,之后做验证。每一次猜想都是一个弱决策,大量的弱决策叠加在一起就产生强匹配。机器要实现对用户兴趣的精准辨识,须要一定时间。系统会优先推送高CTR的内容,在这个过程中进行兴趣侦测,投放到用户池中做灰度测试,因而得到不断的验证。例如,刚才辨识了兔子在草地,哦,那机器猜想,这是不是一个萌宠视频?机器找到一小部份带有“萌宠”标签的用户,观察打开量,假如超过了一定的阀值,就断定这是个萌宠视频,因而推荐给更多带有“萌宠”标签的用户,这样反复,很快能够确定这支视频的分类了。而判定视频质量的方法也很相像,视频推给一小部份用户后,通过观察互动量例如点赞、评论、播放完成度等几个维度,超过一定阀值,就推荐给更大范围的用户。这么反复,持续正向反馈的视频依据数据表现步入优质视频库,机器随机选择其中的一些上快手的“热门”也就是发觉页。
定义人
编者按:带有大量标签的用户,可以总结出特点,便于更好地让系统了解用户。你从一开始晓得一个陌生人是男是女,那里人,做哪些工作,等时间久了,你会晓得他喜欢哪些运动、饮食偏好、人品和价值观。认识一个人的过程是不断获取信息、分析信息,时间久了,你熟悉了,就可以预测这个人的想要哪些、会作出哪些行为。机器也在与每一个用户构建从陌生人发展到熟悉同学的过程。一个快手的新用户,在冷启动时,机器首先会按照用户的注册资料、手机型号、地理位置和周边用户等情况快手热门算法,对用户做一个标签剖析。一旦用户有了使用行为,浏览了内容后,快手的机器会按照用户的观看行为,升级用户标签库,从而给用户匹配更精准的内容。目前快手用户的手机机型有5万多种,快手的自研AI引擎会适应每种型号的硬件配置,快手的用户标签库早已高达数百亿条。带有大量标签的用户,可以总结出特点,便于更好地让系统了解用户。
用户的特点分为常年特点、中期特点、短期特点三块。
其中,常年特点是出生年月、地区(IP地址、POI/AOI)、性别等,这些你长时间不会变的特点。
中期特点是兴趣爱好。
最难辨识的是短期特点,例如一个人搜索“苹果”,明天可能是想吃苹果,今天可能是想买一个苹果手机。这样的特点是顷刻万变的,也很难辨识和判定,所以机器须要记录用户大量的使用行为,构建深度学习的模型来不断训练,从中产生用户大致的画像(我们叫用户向量),因而更好地判定用户究竟喜欢哪些,以及和其他用户的关系。人与内容的互动编者按:互动数据最难的是须要时间沉淀、用户量积累和用户活跃度。就是指的是用户之间的点赞、关注和评论等行为。基于刚才的解释,你很容易明白,互动相关的数据有助于机器预估一个人的兴趣爱好。好多刚玩快手,就有个觉得,都给我推的哪些东西呀?!好多缘由是由于你曝露给机器的标签还不够多,机器还不认识你。实际上,它的颗粒度早已做得十分细了。例如我自己喜欢古典街舞,使用一段时间后快手热门算法,我的推送里并非都是类似舞蹈的现代舞种,而是中国古典舞的分类。互动数据最难的是须要时间沉淀、用户量积累和用户活跃度。人群沉淀的价值也很显著,在快手上,一个天天垂钓的帐号,几十条上百条内容全部一样的,就一个人坐在那儿垂钓,而他的粉丝有数十万,这种老铁们都喜欢天天看他垂钓。所以我刚才说,快手是在找“人”的价值,通过这样的方法找到志同道合的老铁。在快手平台的排序引擎中,不得不指出的它社区机制里的基尼系数概念。
基尼系数通常是拿来评判一个国家或地区市民收入差别的指标,国家借此控制民众的贫富差别不要太大。快手用它来实现一个“公平”的理念,杜绝背部小号流量,把流量分给更多的普通内容生产者,让每位人都能得到一定的关注。
对于专业的内容生产者而言,这个机制其实是一种苦恼。你以团队之力,在内容制做上大力投入,生产精湛的作品,粉丝量快速下降,很快还会发觉,粉丝数越多,上热门的概率就越小。
但换个角度想,这未尝不是一件好事。构想,假如这个平台真弄成了只有脸部小号获得关注,普通用户发的视频无人问津,于是只能当听众,那平台都会弄成一个中心化的精英媒体。而现在快手能让老铁们都“生活”其中,快手粉丝的黏度极高,背后都有这个机制的贡献。
所以在帐号越变越大的过程中虽然越来越艰辛,但沉淀的粉丝价值也是越来越高的。适应环境的能力,是每一种生物才能存活的核心能力,我想作为内容生产者也是这么。初步了解快手这个世界的规则和价值观后,你应当也能从实际操作角度反推一二了。