补充说明:
1、关于坐标
横坐标为时间,统一为2015.7.25-2016.3.22. 横坐标并非均匀分布,而是按数据个数(即微博数)等距离划分。纵坐标为微博人气值,即按照48楼计算的结果。
2、关于部分数值偏大和偏小
楼主统计的都是每条微博的实际转发、评论和点赞。偏大数据形成的“擎天柱”是某条热门微博的结果,比如娜娜2016/1/21 20:46的微博,转发31715,评论11903,点赞20065,堪称奇葩。偏小数据有一个共同特点:连片偏小,那是微博访谈和粉丝互动的微博,转发、评论量都很小,点赞也相对偏小。
另外,TOP16的微博几乎都在同一段时间内有大幅上涨(时间段大概是去年9月和10月),然后迅速回落,楼主猜测这是运营买粉的结果。
3、关于数据波动
没有一个成员的微博人气能一直保持高位,这好比股市,有起有落才是正常,要是一直疯长,那说明问题快来了。
4、关于计算方法
48楼已经说得很明白,楼主的数据处理方法和原始数据高度吻合,比转、评、赞的简单相加更接近真实人气。如果各位大神有更好的建议,欢迎谈论。
5、关于原始数据
各位确定要看原始数据吗?楼主总共统计了5046条微博,共15138个数据,大家可以想象一下全部放出来的效果。
当然,如果各位有更好的数据表示方式,欢迎讨论。