Unbending Notes

读李维老师【大数据挖掘:方崔大战一年回顾】有感

sz1961sy 发表于 2014/1/5 20:35:00 阅读全文() | 回复(0) | 引用通告() | 编辑

       2014年1月3日,李维老师在科学网博客发了【大数据挖掘:转基因中文网络的自动民调,东风压倒西风?】 (地址:http://blog.sciencenet.cn/blog-362400-755584.html  ) 一文,这是他之前【转基因大数据挖掘系列博文】的最新归纳。不过,今天,2014年1月5日18时11分 ,所发的【大数据挖掘:方崔大战一年回顾】(http://blog.sciencenet.cn/blog-362400-756180.html  )一文,从本人一直关注转基因中文网络趋势掌握的一些信息,觉得此文的数据更有可比性。因为:
       转基因网络争议是集团利益(捆绑、挷架民众)同觉悟的民众在公共知识分子的呼唤下的一场网络是非博弈,它背后是有错综复杂的原因。只有从这一场网络是非博弈的主角影响力变化,才能从中悟出网络民调的真正特点。下面,就李维老师【大数据挖掘:方崔大战一年回顾】一文的数据结果,写几点感受:

       首先,这是一个自称“打假”的“科普专家”海归(方舟子)同一个曾经全国政协委员、央视著名主持人、被方舟子称为“文傻”(崔永元)网上大PK,并带动主流媒体广为跟踪报道。

       其中,数据显示,这一场PK是“方(舟子)韩(寒)”大PK的“续集”。

      第三,崔永元是集“韩粉”与“崔粉”加上“方黑”(专事研究方舟子黑幕一群人)去同方舟子的“方粉”全方位PK,所以,阵营超过“方(舟子)韩(寒)”大PK及“挺转 Vs 反转”大PK。

      第四,由于崔永元是用“匪性”去同网络“科唬”(著名方黑亦明称方舟子的一个雅号)方舟子捣鼓,而且是典型的团队作战,所以,方舟子的团队(以本人从2011年“方肖大战”测算,这个团队一年不少于一千万元经费才能如此全媒体运作)有点日见势弱。

     第五,造成崔永元团队稳扎稳打的原因本人分析有几方面,一是小崔是“实话实说”代言人有良好的民众基础,二是从手法上小崔去了二次美国一次日本,其中在美国是请美国人做摄影,采访的是美国人(这一点同本人从2010年以来采访专家、只问老外的做法类似),老外的专家不会顾虑什么中国某某机构(部委)的批评,符合科学问题“实话实说”,三是方舟子团队急功近利,典型的转基因集团利益代言人口气,公众的认知度日见没落。

     第六,从数据看,这场由崔永元团队和方舟子团队网络到媒体PK,还反映了正直的中国媒体人敢于面对网络谣言挑战,借用自己的规范新闻调查手法,去同这些来自境外集团利益代言者(团队)拼争的精神,这是一股正气力量,它比由一些机构扶持的“五毛”更具有正能量,更易获得公众认可。

     其他细节,大家可以去细读李维老师【大数据挖掘:方崔大战一年回顾】一文。

     最后,感谢李维老师为大家提供了这么一个技术性“第三只眼睛”数据。

     沈阳(sz1961sy)
     20:35 2014-1-5  写了北京家中

附: 李维

李维老师【大数据挖掘:方崔大战一年回顾】

     已有 107 次阅读 2014-1-5 18:11 |个人分类:社媒挖掘|系统分类:博客新闻|关键词:大数据 挖掘 方舟子 小崔 转基因

以前小方小韩掐架的时候,做过方韩大战的社会媒体挖掘,结果显示两败俱伤。

据说由转基因之争引起的崔方大战是去年中文社会媒体的大事件,因此以小崔和小方两个话题的自动挖掘对照,应该可以反映这场大战的一个概貌,至少是一个侧面。

挖掘的数据来源是目前在我们现有的 index 中的中文简体的社会媒体(因与内容商协商仍在进行中,数据并不完整,但是数据对于两位是一视同仁的。如果有足够的兴趣,也可以继续做一个繁体中文的类似挖掘,看看海外社会媒体如Twitter对大战的反应如何。)另一个需要说明的是,挖掘系统仍处于 beta 阶段,bugs 在所难免,但是多次由第三方判别的质量检测(QA)显示,褒贬抽取的准确度均在 85% 以上。

挖掘区间是 2013 年元月五日 至 2014 年元月五号,整一年。

 

两位都是大名人,所以这次挖掘的相关数据量上相差不大,都在八万条左右。但一年来总体褒贬指数小崔(41度)远远高于小方(零下5度)。

 


把两位的一年舆情趋势(Timeline)放在一起对照如下。


 


      数据量上看,一直比较平稳上升,只是到年底突然呈现一个高峰。与两位相关的数据大体同步。下面的 Timeline 把两位的褒贬曲线在同一个座标里交叠比较,更容易做对比分析。

     最有意思的是两位的社会媒体形象曲线的对比。小方也有起伏,但是小崔的跌宕起伏的幅度远远大于小方。虽然小崔的总体评价远高于小方,但是去年五月到七月之间,突然一跌千丈(那个时段发生了什么状况?),陷入谷底(六月16日零下92度,此前的低谷有六月2日的零下88度)。在五月五号到六月30之间,小崔的社会媒体评价度低于小方,此后恢复正常。除了五月六月的小崔低谷,小崔在其他时段似乎一直表现不错,社会媒体形象高于小方。


 

由于双方的粉丝都很激烈,为免过度解读引起新的口水战,下面只提供数据,不再做解读。

共现主题词 
 


对二位的社会媒体情绪云图


 
 


褒贬理由的分布

 

 

喜欢的理由
 


不喜欢的理由

 

所调查的数据来源种类


 


所调查的数据分布


 


谁发声****


 

 

 


社交媒体样本


 


 

http://blog.sciencenet.cn/blog-362400-756180.html

发表评论:

    昵称:
    密码: (游客无须输入密码)
    主页:
    标题:
  收藏此页到365Key