爱收集资源网

微博转发数据分析,你了解多少?

网络 2023-08-02 23:03

首先说明一下本人不是王一博粉丝,也不厌恶王一博,只是近来在学习python数据剖析,就随意找了一条微博转发量来剖析一下,只是恰好抽中了王一博哈~

但是有些时侯的确令人费解,为什么wyb随随便便发一条微博(不管是推广还是自拍)都可以有一百万加的转发量,这有点强哈~~~所以昨晚我们就选一条微博爬取其转发用户数据剖析一下。

本人本着客观的心态剖析,如果不正确的地方欢迎批评见谅。

文章目录 3 粉丝画像最后的话 1 数据说明

关于每位数组的含意,这里不详述(以后本人再写一篇关于微博数组的文章说明吧)

2 粉丝结构初步剖析

首先提出两个问题:

2.1 是否存在水军转发现象?

判断是否有水军,只能通过假定检验的方法(反证法),即先提出一个假定,再找寻特点来指责这个假定,若未能拒绝假定,只能说明这个命题无法证明。。

在这儿,我们可以假定没有水军,没有水军的情况下数据表现下来的特点是:

因此若数据有以下特点之一,可以判定为有水军参与转发的嫌疑:

我们先来看一下3万转发量中的性别比列分布(如下图),女生数目为21657,男生数目为8975。女生偏多,符合我们通常的认知。

![王一博粉丝男女比列图](

process=image/watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L0VjaG9fbGl0dGxlc2hhbg==,size_16,color_FFFFFF,t_70)

qq转发量购买_qq说说转发量自助下单_买QQ说说转发量

再瞧瞧3万转发量的转发源统计(如下图)。iPhone客户端使用率是最高的,令人震惊的是微博国际版(微博国际版使用率早已那么高了吗???),而且居然好多是通过微博小程序转发的。。。噢你们都不下载APP了嘛???

![转发源统计](

process=image/watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L0VjaG9fbGl0dGxlc2hhbg==,size_16,color_FFFFFF,t_70)

我们再简略看一下转发文案的简略统计(如下图),图中文案前面的数字代表出现的该文案再3万条转发数据中出现的次数。可见“转发微博”出现次数最多4108次,因为这是微博默认转发文案,(是否可以说明刷流量或做数据的成份较大。。。)。从这个简略统计中还可以看出有个别号的再转发量较大,比如有很多转发都是始于@王一博数据组、@一笑给叔叔搓澡、@王一博专属bot等等号,进一步显示3万多转发量中粉丝做数据的成份较大。且在转发文案统计中没有见到奇奇怪怪的文案。

![在这儿插入图片描述](

process=image/watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L0VjaG9fbGl0dGxlc2hhbg==,size_16,color_FFFFFF,t_70)

目前来看,数据呈现的特征都没有太离谱,所以直观上不能判定粉丝是否掺假,我们不妨给假粉丝一个愈发明晰的定义。

综合上述的男女比列分布、转发源、转发文案这三个特点,数据呈现出的结果都处于合理的和可接受范围内,因此并不能拒绝“转发量数据中没有水军参与”这个假定,即按照目前数据我们无法证明该转发量是水军伪造,只能稍稍看出多多少少有些粉丝做数据的嫌疑(即粉丝为了提升转发量多次转发同一条微博)

注意:“粉丝多次转发”与“有水军”是两个概念。水军通常指的是通过一定钱订购的大量陌生用户转发微博以营造广泛传播的表象,而且这种转发使用的帐号通常有很多是低级别的僵尸号

但是这就引出另一个问题了:三万多的转发量中有多少是粉丝为了打榜刷流量而重复转发的呢?

2.2 实际参与的粉丝统计

既然粉丝可以多次转发同一条微博,那么参与这3万次转发的实际粉丝数目是多少呢?我们将3万多数据的用户id去重并统计出现次数,结果如下:

![在这儿插入图片描述](

qq转发量购买_买QQ说说转发量_qq说说转发量自助下单

process=image/watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L0VjaG9fbGl0dGxlc2hhbg==,size_16,color_FFFFFF,t_70)

可见有很多重复转发的,实际参与转发的帐号只有5125个(包括小号和消耗),这么说,少于或等于5125个粉丝创造了三万多的转发量。因此实际上最多只有五千多位粉丝在转发并不是三万多粉丝转发,信息的实际传播量仅仅是数据显示的1/6

根据帐号转发次数估算频数,得到下边的频数图,从图中可以看出,超过三千的帐号只转发了微博一次,有500多帐号转发微博两次,大致两百多用户转发微博三次。剩下接近两千的粉丝转发几十次到一百次,硬生玄参拉高了平均转发量~

![在这儿插入图片描述](

process=image/watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L0VjaG9fbGl0dGxlc2hhbg==,size_16,color_FFFFFF,t_70)

画一个饼状图可以愈发直观地观察结果,如下图所示:

![在这儿插入图片描述](

process=image/watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L0VjaG9fbGl0dGxlc2hhbg==,size_16,color_FFFFFF,t_70)

3 粉丝画像

说实话,现在得到的结果是我没有预想到的。。。本以为可以得到推论是一堆假粉或水军转发,没想到真正的推论是没见到显著的水军,是有个别疯狂的粉丝实在是太努力刷流量。那我们干脆就用尝试借助这五千多个粉丝做一个粉丝画像剖析吧~

先瞧瞧参与转发的帐户的真正男女比列结构(如下图),总共5125个帐号,女生4074个,占比约80%:

![在这儿插入图片描述](

process=image/watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L0VjaG9fbGl0dGxlc2hhbg==,size_16,color_FFFFFF,t_70)

qq转发量购买_qq说说转发量自助下单_买QQ说说转发量

统计这五千多个帐号的转发源,发现有17.9%都是从名星实力榜转发的,进一步验证了疯狂的粉丝为了打榜多次转发微博的推论。

![在这儿插入图片描述](

process=image/watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L0VjaG9fbGl0dGxlc2hhbg==,size_16,color_FFFFFF,t_70)

那么同样是王一博的粉丝,他们的微博爱称会不会有共同特点呢?我们可以使用动词+词云图看一下:

![在这儿插入图片描述](

process=image/watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L0VjaG9fbGl0dGxlc2hhbg==,size_16,color_FFFFFF,t_70)

这个词云图。。。真的一看就晓得来自于王一博粉丝。粉丝的微博帐户名称中使用率最多的几个词是“王一博”、“85”、“甜甜”、“百里”、“摩托”、“酷盖”等等。“85”这个数字我之前仍然想不懂跟王一博有哪些关系,查了一下才晓得原先王一博生日是0805,所以词云中也包含了0805、9785、970805这种关键词。

看一下她们微博账号写的简介“王一博”这个关键词占了绝大多数,然后是跟王一博相关联的成语“平安”“喜乐”“唯粉”等等。还有不少的正面积极成语,例如“努力”、“守护”、“加油”、“不负”等等,看得出来王一博给粉丝的正面影响还是挺大的。

![在这儿插入图片描述](

process=image/watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L0VjaG9fbGl0dGxlc2hhbg==,size_16,color_FFFFFF,t_70)

我们再关注一下粉丝的其他基本数据,计算得出这五千多个粉丝的平均粉丝数为581,平均关注量为274.

![在这儿插入图片描述](

process=image/watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L0VjaG9fbGl0dGxlc2hhbg==,size_16,color_FFFFFF,t_70)

买QQ说说转发量_qq说说转发量自助下单_qq转发量购买

对她们的主页背景统计一下,发现不仅微博的默认背景外,其他几乎都是使用王一博相关的图作为背景:

![在这儿插入图片描述](

process=image/watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L0VjaG9fbGl0dGxlc2hhbg==,size_16,color_FFFFFF,t_70)

其中下边这张是使用最多的(75频次)

![在这儿插入图片描述](

process=image/watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L0VjaG9fbGl0dGxlc2hhbg==,size_16,color_FFFFFF,t_70)

最后的话

王一博微博转发量剖析就到这啦。总的来看,王一博给粉丝的能量还是挺积极的,有某些粉丝为了给王一博刷流量比较疯狂,但整体上看还好。

初学Python数据剖析,而且这是本人第一次写这些类型的剖析文章,有不对的地方欢迎批评见谅,也欢迎留言讨论,谢谢你们阅读~

喜欢的点个赞呗~

想要博主写其他内容也可以留言哦~

附上剖析数据以及jupyter文件:

链接:

提取码:r36r

买QQ说说转发量