用依和P的爬虫数据简单计算一下数学题
[爬12万条米游社评论后的惊人数据,究竟是谁在带节奏?-哔哩哔哩] https://b23.tv/so0WoAn▸
一个利用爬虫爬数据得出的结论:
统计了117555条评论,一共24094个账号,76%的评论是重复刷的2000条评论之一,其中4000个账号贡献了73%的评论,广东ip有3622个,是第二位的两倍,进而得出结论是粤的大手带的水军节奏。
所以问题在哪呢? 即便相信这个调查数据是完全正确的,其中4000个账号贡献了117555条评论中的73%,也就是85815条评论,平均到4000个账号头上也不过每个账号发布了20条评论,这符合水军的独轮车效率么?你们是不是把机器队看扁了啊?
即使把这4000个账号全部认为是“水军”,那么余下的20000个账号贡献了31739条评论,平均每人发布不足2条,那么这两万人该如何定义?
更何况这个所谓的爬虫,60万楼里只抽了11.7万楼是否有选择数据的情况? 而且60万在开启了评论仅自己可见之后,有多少个一般人只发一条的被忽略了?
如果认为这个数据具有代表性普适性,那么60万评论去掉73%的“水军刷屏”还剩下162000个评论,根据之前的计算非“刷屏评论”的每人不足2条,那么是不是证明米游社这次即使排干了所谓“水分”仍然有十万个普通玩家用户参加了这次米游社内爆?
手工不媚宅仙人
· 东京原神玩家业务和工作还是分的开的,这还是随便钓的鱼。
邪恶是美德2333
· 上海原神内鬼吧这种龟吧二游小鬼聚集地都有77万关注,里面全是逆天。原神本身全球有6千万到7千万之间的用户群体。当然也有上头冲锋的,都正常。但是自绿群体不就是龟吧那些逆天二游群体喜欢的玩意。另外贴吧二游群体大概也就250万到350万用户用量。不少极端二游小鬼都是重度反原倾向。如果说二游群体投个票,反原的堆上70万都不稀奇。有什么参考意义,贴吧二游小鬼用得着当人看吗?