生个女孩吧 关注:670,394贴子:37,652,945
  • 13回复贴,共1

【数据流】部分成员微博转发/评论/点赞的统计

取消只看楼主收藏回复

楼主统计了二选TOP16+几位其他成员二选后所有微博的转发、评论和点赞数。
总图镇楼


IP属地:广东1楼2016-03-23 12:11回复
    说明
    1、统计时间:2015.7.25-2016.3.22
    本来想统计所有微博的,但软件出了点问题,以后有机会再补上
    2、统计内容:上述时间段内成员所有微博的转发、评论、点赞数
    数据太多,楼主把数据做成曲线图,具体看下面


    IP属地:广东13楼2016-03-23 12:14
    收起回复
      关于转发、评论、点赞的说明:
      以曾艳芬的微博为例,先看图

      划重点:转发数<评论数<点赞数
      其他成员的数据比例和上图非常相似,所以不放出来了


      IP属地:广东29楼2016-03-23 12:18
      收起回复
        我简化一下横坐标,稍等


        IP属地:广东74楼2016-03-23 12:51
        收起回复
          补发一下29楼和48楼的图
          29楼

          48楼


          IP属地:广东85楼2016-03-23 13:11
          回复
            下面开始放图,按二选排名,每两位成员的数据放在一张图上
            1、赵嘉敏 vs 鞠婧祎


            IP属地:广东86楼2016-03-23 13:18
            收起回复
              2、李艺彤vs黄婷婷

              3、张语格vs万丽娜


              IP属地:广东89楼2016-03-23 13:22
              收起回复
                4、李宇琪vs易嘉爱


                IP属地:广东91楼2016-03-23 13:26
                收起回复
                  5、大力(曾艳芬vs陆婷)


                  IP属地:广东93楼2016-03-23 13:31
                  收起回复
                    6、赵粤vs冯薪朵


                    IP属地:广东96楼2016-03-23 13:34
                    收起回复
                      7、莫寒vs邱欣怡


                      IP属地:广东97楼2016-03-23 13:35
                      收起回复
                        8、戴萌vs孔肖吟


                        IP属地:广东98楼2016-03-23 13:36
                        收起回复
                          补充说明:
                          1、关于坐标
                          横坐标为时间,统一为2015.7.25-2016.3.22. 横坐标并非均匀分布,而是按数据个数(即微博数)等距离划分。纵坐标为微博人气值,即按照48楼计算的结果。
                          2、关于部分数值偏大和偏小
                          楼主统计的都是每条微博的实际转发、评论和点赞。偏大数据形成的“擎天柱”是某条热门微博的结果,比如娜娜2016/1/21 20:46的微博,转发31715,评论11903,点赞20065,堪称奇葩。偏小数据有一个共同特点:连片偏小,那是微博访谈和粉丝互动的微博,转发、评论量都很小,点赞也相对偏小。
                          另外,TOP16的微博几乎都在同一段时间内有大幅上涨(时间段大概是去年9月和10月),然后迅速回落,楼主猜测这是运营买粉的结果。
                          3、关于数据波动
                          没有一个成员的微博人气能一直保持高位,这好比股市,有起有落才是正常,要是一直疯长,那说明问题快来了。
                          4、关于计算方法
                          48楼已经说得很明白,楼主的数据处理方法和原始数据高度吻合,比转、评、赞的简单相加更接近真实人气。如果各位大神有更好的建议,欢迎谈论。
                          5、关于原始数据
                          各位确定要看原始数据吗?楼主总共统计了5046条微博,共15138个数据,大家可以想象一下全部放出来的效果。
                          当然,如果各位有更好的数据表示方式,欢迎讨论。


                          IP属地:广东105楼2016-03-23 14:10
                          回复
                            既然大家想看数据,我把导出Excel表好了


                            IP属地:广东116楼2016-03-23 14:47
                            收起回复