爱收集资源网

图2.4关键词查询示例图2.5上图对应直播片段出处

网络整理 2024-02-01 20:11

主要功能:(未删节的)直播回放、原装弹幕及辨识的字幕,其中字幕可以搜索及定位;同时有切块功能

图2.1主界面。其中标“本地源”的录播视频来自于网站自身的资源,通常无删节。

图2.2上图中7.19直播的回放及字幕库界面。可见原版直播弹幕。

图2.3切块工具

从收录的主播列表可以看见,主要是虚拟主播相关。由于视频是直接通过B站获取,在保留了原版弹幕的同时,也提供了完全没有删节的直播回放备份(部份历史数据仍在整理中)。这极大地便捷了核实考据工作。相比之下,无论是主播自己还是录播组的录播,都有可能存在删节的行为。举个事例,虚拟主播团体A-SOUL三年多的录播中,无论是“账号已注销499455”(原名“贾布加布”)还是历任“A-SOUL二创计画”的录播,都不时会有一些片断(出于舆论影响审视?)被删掉。字幕库的录播因此提供了一个安全的备份。

不过更重要的是字幕库的字幕查询功能。网站的字幕库是手动辨识直播内容生成,想要查找某位主播哪三天在直播中说过哪些话,只须要在搜索栏输入关键词查询即可,如图。查找的结果可以精确到秒,并有相应的直播回放以供定位。同时,字幕库亦有“模糊搜索”功能,可以一并显示同音字的结果,以最大限度防止语音手动辨识中形成的错误。

图2.4关键词查询示例

图2.5上图对应直播片断出处

除此以外,网站还有录播切块的功能。目前,网站早已收录了A-SOUL、VR、EOE、四禧丸子、明前奶绿、绊爱等主播/团体的直播,并仍在不断扩展中。

3.奶绿live(stats.nailv.live)

作者匿名

主要功能:直播数据查询,包括产值、观众人数、弹幕数目等。

图3.1主界面

具体来说,可分为两种:

(1)累计数据。在索引-主播主页-总览中,可以看见任意时间段内相应直播数据的总和以及变动曲线,包括产值、弹幕数、(活跃)观众数等等,以及粉丝和舰团(大航海)人数的变化。这儿“观众数”指的是所有观看(入场)的人数,而“活跃听众”指弹幕发言或付费的用户。

图3.2查询示例,主播“明前奶绿”的主页

图3.3上图下方的近几次直播数据概况,使用的是弹幕库的数据(见图5.4)

图3.4上图3.2右上方“总览”进入后的页面

图3.5总览页面截图之二:产值及弹幕曲线,其中绿线为总弹幕,红线为时均弹幕

(2)单场直播的详尽数据,即直播过程中,不同时间区间内(例如,每5分钟/10分钟,等等)弹幕、活跃用户和产值数据(分为舰团、SC和礼物三种)的变化曲线,但并未如下文弹幕库一样收录弹幕和SC的详尽内容。

图3.6单场直播数据,此处选定近来一场直播,即7.22

图3.7单场直播数据截图之二。活跃用户指参与互动(发弹幕)或付费的用户

图3.8单场直播数据截图之三:产值,包括总量(绿)、舰团(蓝)、礼物(橙)、SC(紫)

除此之外,对好胜心较强(喜欢“踩头”)的同学来说,网站还可以拿来进行“斗虫”,即比较不同主播特定时间段内,或则同一主播在不同时期的各项直播数据。

已知问题:网站的直播弹幕、营收等数据来自弹幕库,粉丝和舰团数则来自06观测站(注:奶绿live的作者疑似将域名打错了,笔者猜想应当指的是06观测站),因而这两个网站存在的问题也会彰显在奶绿live前面。关于收录的主播,奶绿live和弹幕库大致相同,数据比自动收录的06观测站更全。但06未收录主播的粉丝和舰团数据,奶绿live自然也没有。

图3.9网站的简介

4.MatsuriICU(matsuri.icu)

作者:brainbush(GitHub/TG同名)

主要功能:直播弹幕列表及关键词统计

图4.1主界面

图4.2查询示例,一直是明前奶绿的直播数据,注意左上角域名:matsuri.icu/channel/加UID。可以看见,弹幕数目与弹幕库数据(图5.4)以及使用其数据的图3.3、6.2等有一些细微差异。

图4.3一直是明前奶绿7.22直播的数据,可以看见有弹幕关键词频率统计

图4.4上图下方的弹幕列表,支持关键词搜索

与前述网站不同,在MatsuriICU可以查询每场直播具体的弹幕列表。原理大致是,网站通过API获取直播弹幕列表,并将其返回的用户UID与其用户名匹配。除此之外,网站还统计了弹幕热门关键词在直播不同时段的出现频度,并以折线图的形式呈现。收录的主播主要是虚拟区,但也可自动添加。

不过使用API爬弹幕列表也相应存在一些问题,例如流量过大时会发生遗漏,这在下文弹幕库的部份有更详尽的说明。

图4.5网站的简介

用户向:

5.弹幕库DANMAKUS(danmakus.com)

作者匿名

主要功能:直播间数据及弹幕列表查询、用户观看直播(入场记录)及所发弹幕记录查询

弹幕库是一个功能相当齐全的网站。顾名思义,可以拿来查弹幕,但并不仅仅这么。事实上,这一网站的功能既有主播视角的,也有用户视角的,只不过由于查用户入场和弹幕的功能更常用,才被放在了“用户向”这里。但主播向的功能也值得非常介绍。

图5.1主界面

图5.2直播间搜索栏

图5.3主播的页面示例,左上角链接格式为danmakus.com/channel/加UID。一直用了明前奶绿的事例

图5.4上图下方的直播数据概况,可与Matsuri的数据(图4.2)对比

图5.5(依然是)上图中明前奶绿7.22直播的弹幕列表,可与图4.4对比

通常较常使用的是“直播间”和“查询”两个功能。在“直播间”一栏中,可以查询网站收录主播的直播数据,包括上映记录、营收、直播间弹幕记录等等。(产值是通过统计弹幕列表中的付费记录得出的,本质上还是弹幕的一部份。)根据网站作者的说法,弹幕库搜集的主播为自动收入,假如有未收录的主播,须要自动添加。但经笔者测试,笔者所了解的所有播出过的用户,无论体量大小,弹幕库均有收录。

其实同样是使用直播检测的相关插口,但与上文提及仅统计总和数据的06观测站和奶绿live不同,通过弹幕库可以查询每场直播的完整弹幕列表,其中包含了用户ID(爱称)及其所发弹幕、付费等记录,还设有关键词搜索,功能相当完备(原理:插口在返回弹幕数据时会附送发送者的UID,将其与对应用户名匹配即可)。同时,和MatsuriICU一样,也可以查到每次直播过程中弹幕、互动、收益等等的折线图。

图5.5用户弹幕记录查询及数据剖析的搜索栏,同时可见查帮会的入口

图5.6一个普通用户(我本人)的弹幕记录截图。左上角地址:danmakus.com/user/加UID。

更为熟知的是“查询”功能,也就是查用户弹幕的功能。该功能可以查询任何用户自2020年至今的直播入场、弹幕、付费等记录。这也就是通常语境下的“查成份”。值得一提的是,已注销用户(假如晓得其UID的话)也是可以查询的。同时,由于前面提及的弹幕与用户名匹配的机制是即时的,也可以查询到每位用户在不同时间步入不同直播间时的用户名,也就是其笔名(历史ID)。

除此之外,甚至还可以追踪用户的登陆(“上号”)记录。其中的原理有两种。用户在每晚初次登陆时,会获得一个硬币,若弹幕库所记录的硬币数发生变化,则代表该用户在这三天上过号。不过该途径只适用于不投币(或投好多币)的用户点赞关注网站,假如用户每晚正好投一个币,这些方式就不适用了。不过,给视频投币本身会提高用户的经验值,因而也可以通过对比用户前后的经验值变化来判定用户有无登入。但这些方式不适用于已满六级、经验值达到28800的用户。这两种途径常常须要配合使用,并且须要长时间持续追踪用户的情况。其实,对于持续有创作内容产出的用户(UP主)来说,这两种方式均不适用,由于投稿可以随时获得硬币,而这会同时转化为自己的硬币和经验。

已知问题:

有几点须要注意:

第一,和前述网站一样,弹幕库也存在初期的数据不完整的情况,这主要彰显在一些直播间数据记录存在空缺时段(可能是检测API死机所致)。因而倘若通过弹幕库的数据统计主播的产值等信息,须要注意此问题。

第二,用户的直播入场记录也时有疏失,这更多是因为B站自己的弹幕机制。我们晓得,步入直播间时,入场记录会呈现于弹幕列表的最下方,也可以看见其他用户的入场记录。但与普通弹幕不同,入场记录每秒只能显示两条(笔者记忆中这么,可能不确切),并且会有优先级,粉丝牌等级高的用户会优先显示。因而,对于人流量很大的直播间来说,有相当一部份入场记录会被遗漏。至于普通弹幕,受此影响虽然较小,但其实也并不能忽略。(注:笔者怀疑,直播间的“等级墙”,即对粉丝牌特定等级以下的用户进行禁言,对此也有影响。但目前我所知的开等级墙的直播间流量都较大,难以确切判定究竟是那个缘由造成的。)

第三,关于笔名。由于该功能是通过搜集汇总用户的直播入场及弹幕记录实现的,因而,假如用户在使用某个用户名期间没有步入任何直播间(包括其自己的直播间),或则所有入场记录均未被记录,则该笔名也不会被包括在内。和第二点一样,这属于机制问题,如今依然这么。

更新:查帮会。大概在5-6月时,弹幕库更新了查询主播/UP主所属直播帮会的功能,在“直播间”和“查询”两个界面均可以看见,也会在主播自己的界面显示。帮会的数据来自GitHub用户tiebarandomuser的vtuberguildqueue数据库。

(注:MatsuriICU和弹幕库使用的是不同的API,因而统计的弹幕数(以及由此衍生的总产值、观看人数和活跃用户数目)均可能形成差别。对于流量很大的直播间(每分钟弹幕100条以上),二者的数据会存在差别,尽管通常处于可忽视的范围(5%)内。对其他流量不太大的直播间而言,二者的数据通常是一致的。以上是我的观察总结,不一定确切,仅供参考。)

6.LAPLACE嘉园(laplace.live)

作者匿名

顾名思义,是明前奶绿的粉丝制做的网站,主要功能和使用方式都与弹幕库类似。事实上网站的数据正是获取自弹幕库,是一样的数据。弹幕库有的功能和问题,LAPLACE嘉园基本也都有。

图6.1直播间数据查询界面,默认为明前奶绿。地址laplace.live/stats/加UID。

图6.2明前奶绿的近几次直播数据概况,使用了弹幕库的数据(见图5.4)

图6.3主播“嘉然明天吃哪些”的直播数据。其中7.19直播产值为134188元,比06观测站的数据(图1.3)多出不少。

图6.3“用户视角”,某位已注销用户。注意不能从搜索栏步入,只能直接从链接地址步入,地址为laplace.live/user/加UID。(小恐龙你在干哪些啊小恐龙)

可查询的统计数据分为“主播视角”和“用户视角”两个方向,分别对应弹幕库的“直播间”查询和(用户数据)“查询”功能。其中,用户视角的查询须要在链接地址中输入目标用户UID(即laplace.live/user后加用户UID)。

7.(11.12更新:应网站作者出于安全问题的考虑,本段删掉)

(11.12更新内容)

8.哔哩哔哩工具箱(tools.rsplwe.com/danmaku-search)

作者:Rsplwe(B站/GitHub同名,见:;以及:)

主要功能:视频弹幕查询

图8.1网站的弹幕查询界面,这儿使用了B站罗翔2022年9月6日的视频,原视频总共有2万余条弹幕

如图,在网站右边列表中有“查询弹幕发送者”功能,可以查询任意视频中特定弹幕的发送者。在查询栏中输入目标视频的BV/AV号(BV号会被手动转为AV号),即可获取视频的弹幕。除此以外,假如在右边的弹幕关键字/词中输入关键词,还可以搜索到富含该关键词的弹幕。通常而言,对于弹幕数目好多的视频,须要通过指定关键词以缩小搜索范围,增强查找效率。

图8.2怎么查看某条弹幕对应发送者的UID

在查询的结果列表中,会显示相关弹幕的发送时间、在视频中的位置;同时,点击最右边“结果”一栏的“查看”,可以见到数个UID,其中即包含了发送者的UID,其余为无效UID或0级号(不能发弹幕)。到这一步点赞关注网站,就须要查询者自动步入对应UID帐号的空间(“家访”),以分辨真正的发送者。出现无关UID的缘由,可能是B站相关查询插口在回复查询恳求时,会随机加入一些无效编码,这种编码被解码后会对应无效UID(需验证)。

图8.3使用说明

另外,网站还有按UID查找弹幕的功能,若在搜索栏下方选择“切换为UID查询模式”(图8.1),即可查询相应视频中特定UID对应帐户所发布的所有弹幕。

已知问题:一个极其严重的问题是数据缺位,而这可能是B站自己的机制造成的。众所周知,B站网页端播放器在播放视频时,最多会加载2000条弹幕;假如视频弹幕数超过2000条,则会随机抽取一些显示,这不同于直播间弹幕列表。这就造成了几乎所有做视频弹幕查询的网站就会面临数据缺位的问题。另外,网站从去年4月起经历了将近半年的停运,直至10月才恢复,缘由未知,未来营运前景怎么也未可知。

9.B站弹幕发送者查询at彩虹工具网(tool.cccyun.cc/bili_danmu)

作者匿名

主要功能和(8)十分相像,都是查特定视频的弹幕,同样有关键词查询功能。如右图,点击结果栏左侧的“点击查询”可以直接显示(惟一的)相应UID,不像(8)那样须要查询者自动甄别。数据虽然也比(8)要更多一些,但二者互有出入,这说明数据不全的问题是普遍存在的。

图9.1使用与图8.1-8.2同样的视频和关键词进行查询,这儿总共显示了40条结果,而图8.1-8.2只有十几条结果

图9.2对比图8.2中1:00至2:28的结果,可见二者互有出入,这说明二者的数据都不全

图9.3点击一侧“点击查询”后可以看见对应UID,可直接跳转用户空间

不仅数据不全以外,在访问该网站时,笔者使用的浏览器(GoogleChrome)发出了安全警告,这也许说明网站可能存在安全问题,使用者应该注意。

点赞关注网站