Unbending Notes

分析:搜狐《中文博客调查报告》十大漏洞

sz1961sy 发表于 2005/10/14 15:08:00 阅读全文() | 回复(0) | 引用通告() | 编辑

       [引子]
       今年7月份笔者曾参加搜狐IT 中文博客调查,之后在一次IT沙龙聚集上听上海艾瑞市场咨询公司杨总介绍说他们的报告己完成即将公布。
        新浪10月12日“博客研讨会”(http://blog.sina.com.cn/m/talkblog )艾瑞市场咨询公司的侯涛经理也讲了一堆不带数据的《中文博客调查报告》(http://blog.sina.com.cn/u/46d1be770100007b),当时的感觉是“艾瑞咨询有关博客的现场报告很糊弄人”:这是笔者1978年读大学之后接触生物统计学知识、2001年以来也听好几场CNNIC的《中国互联网络发展状况统计报告》会,第一次听到如此“调查报告”的,10月13日花了几个小时细读在: 
       IT频道 > 互联网 > 国内互联网 > 首届全球中文博客调查报告发布会 (http://it.sohu.com/s2005/blogdiaocha.shtml )上内容,今天早上也从“搜狐博粹&搜狐IT”收到一邮件,内附有三份文件:
        1、《中国博客用户研究报告》(版权声明:该报告的所有图片、表格及文字内容的版权归sohu IT频道及上海艾瑞市场咨询有限公司所有。约11000字)。
        2、《搜狐IT第一届中文Blog大型摸底调查报告》(约7000字)。
        3、《我国博客群体的现状和特点——基于首届搜狐IT频道中文Blog大型摸底调查》
        本文根据这些公开数据及报告内容,找出笔者个人认为有漏洞十大问题,供下一次做Blog大型摸底调查的机构或者公司参考。
        本文不是“帮sina打击狐狸”,也明白iResearch只是“做数据整理”,它只是就数据来源到数据整理结果说事,而且仅代表个人观点,本文更不是“能挣钱”的,它只是一种草根观点,因为现在己是We Media,Weblog!

        [漏洞一:名称不太客观]
        《搜狐IT第一届中文Blog大型摸底调查报告》引言介绍:blog的出现在中国历史上第一次提供了这样一个信息平台:即普通民众有可能拥有和专家明星对等的话语权,为了更好地了解这一潮流的现状,和公众一起把握这个潮流,并对Blog的未来作出一定的预测,搜狐IT频道于2005年7月份针对中文Blog进行了一次大型调查(http://it.sohu.com/s2005/bob.shtml),这是国内第一届关于该内容的调查,...。
        分析:
        首先,“调查”分“届”不太多见,因为没有注明“多久一届”,若用“次”似乎更符合汉语专业表达(?)。
        其次,报告名称不太客观---“搜狐IT第一届中文Blog大型摸底调查报告” ,如果叫“搜狐IT杯”   “第一届(次)中文Blog大型摸底调查报告”  可能会更为中性(客观)一些,让人更乐意参与调查。
        最后,从统计数据中几乎不见2005年3月推出的新浪Blog、更没有在2003年己推出的网易部落便见一斑。即有一些“门第之见”,更进一步的分析见下面。

        [漏洞二:取样片面性问题严重]
        正如《我国博客群体的现状和特点——基于首届搜狐IT频道中文Blog大型摸底调查》“绪言”所写说明:
        本次调查为网上调查,持续时间为2005年7月1日至22日,共三周。在此期间,Chinaren, 搜狐社区,焦点房地产,17173,中国搜索等以文字链接的方式对本次调查作了推广(持续时间1~2周不等);而搜狐IT频道首页在调查期间作了全程推广。
        此外,本次调查也得到了众多博客服务提供商的大力支持,和讯博客、中国博客网、博客中国(现博客网)、博客动力、歪酷博客以及其他一些博客托管商都对本次调查进行了推广。而众多个人博客也通过相互推荐、告知的方式,对本次调查予以支持。
        本次调查共计收回问卷10517份,剔除重复提交和明显不合要求的问卷,最后有效问卷9639份,其中66%为博客书写者所提交的问卷,17%的有效问卷提交者虽没有写过博客但是浏览过别人的博客;约8%的有效问卷提交者既没写过也没看过别人的Blog,但是表示很想试一试;另有约9%的有效问卷提供者还不了解blog(博客)是什么东西。
       由于本次调查属于非概率抽样,因此,理论上言,尽管样本量很大,其描述性结果却无法推广到整个中文Blog的情况,本分析报告也无法提供有关数据在推广到中文博客总体情形时的可能误差;换言之,有关描述统计部分,都只是就参与调查的网民群体所作的总结。
       但另一方面,本分析报告由于侧重对博客写作和阅读行为相关变量的交叉分析,并非简单的描述性分析,因此,其对变量间关系的揭示,对于我们深入了解博客这一新媒体时代重要的社会现象,应该还是富有启发意义的。另外,本调查的样本也比较大,在一定程度上也增加了分析结果的可信性。

        分析:“绪言”所写说明及最后一句“本调查的样本也比较大,在一定程度上也增加了分析结果的可信性。”是自相矛盾。大家记得某避孕套厂商借“网上调查”得出中国人一生平均性伴侣数跃居全球榜首的“网上调查”“可信性”事件吧。下面就用进一步数据分析再与大家一齐讨论。

        [漏洞三:BSP网站排名很搞笑]
        报告之第四点“关于blog服务商”出现了结论:
        “根据描述性统计结果,被本次调查参加者使用最多的前十位是:中国博客网、博客公社、歪酷博客、微软的space、自己独立的空间、和讯博客、博客动力、中国教育人博客、天涯博客、斗牛士。下表为对这十个blog服务商的满意度排名情况,其中a~k项为单项指标,第S项为总体满意度。(注意:这里只对上述10家blog服务商之间进行排名,并未考虑其他blog服务商与这十家服务商之间的排名先后)。”
         分析:被本次调查参加者使用最多的前十位中,“中国教育人博客”、“斗牛士”、“自己独立的空间”、“歪酷博客”用户在2005年7月1日至22日之间应该是10万以下,能进BSP前十位中让人觉得此排名很搞笑。下一个数据更让人怀疑。

        [漏洞四:使用评价最多的前十位天涯排第一]
        这次调查Blogger群体的省份差异中,各省(市、自治区、特别行政区)Blogger人数占总数的比例由高到低依次如下:北京17.95%、上海13.81%、广东9.13%、浙江6.69%、江苏5.81%、(以下不足5%)...海南0.27%,而主要使用的Blog服务商选择它们的blogger人数比例分别是:中国博客网26.18%、博客公社19.80%、......天涯博客1.67%(第十),此(第十)天涯博客们在依据下列指标评价:
        稳定可靠、访问速度快、空间大、功能强大、界面简洁、没有广告、个性化做得很好、较多的附加功能、和我有联系的人较多使用、可以找到较多的新朋友、人气最旺、牛人最多、用久了习惯了不打算换其它的、其它
        共14项评价中,天涯博客总体满意度(S)********(10分)。和讯博客排名第十(仅1分)。
        分析:据《搜狐IT第一届中文Blog大型摸底调查报告》说明:回答本题的被调查者共有6027人。
        即此数据占有效问卷9639份的62.53%,比本次被调查者中“我已经开始写Blog了”比例占66.01% 低3.48%,报告没有对此误差进行说明,更没有对低3.48%是否构成差异显著作统计学判别。
        统计学理论上讲,天涯博客仅占1.67%群体,它与中国博客网26.18%、博客公社19.80%群体数据己存在很大差异性。或者说:而有效问卷9639份的3.48%即335份,比回答本题的被调查者共有6027人中的天涯博客仅占1.67%群体即101份己存在十分大差异性。可信度很低。

        [漏洞五:男女性Blogger比例矛盾]
        报告中“博客用户背景情况”之博客用户的性别情况结论是:调查发现博客用户男性较多,占调研中博客用户的57.3%,而女性占调研中博客用户的42.7%。两者有一定的差距。
         分析:根据“中国博客网”董事长胡之光、CEO耿俊强先生介绍,“中国博客网”占中国****博客用户比例,而且是女性较男性多。因此,此报告中此数据的可信度值得怀疑。
        这个原因也是来自本次调查属于非概率抽样。

        [漏洞六:有效问卷仅91.65%说明什么]
        《搜狐IT第一届中文Blog大型摸底调查报告》引言介绍:
        此次网络调查共计收回问卷10517份,其中有效问卷9639份,有效率达91.65%。
        分析:笔者也亲历参与填表,但是发现一些设计流程及文字表述确实很易让人填错。这是本调查报告设计的严谨性问题引起的。
       
        [漏洞七:Blog 书写者和非blog书写者差异性判断] 
        《中国博客用户研究报告》有好几项注明“标本描述:N=7999”即占有效问卷9639份的82.99%,《我国博客群体的现状和特点——基于首届搜狐IT频道中文Blog大型摸底调查》“绪言”说明:最后有效问卷9639份,其中66%为博客书写者所提交的问卷,换句话说,本《中国博客用户研究报告》把“博客用户行为深入挖掘-博客用户对网络广告的看法”归纳了“我已经开始写Blog了(66.01%)”+“没有写过Blog,但是我浏览过别人的Blog(16.97%)”=82.98%(与82.99%差异不显著)。
        分析:博客用户确实是双重性,既可能是“书写者”也同时是“浏览者”。问题是这些分析一部分结论把“没有写过Blog,但是我浏览过别人的Blog(16.97%)”也加进去,不合理,造成此原因与“漏洞六”一样。

        [漏洞八:学生占49.66%的数据推算]
        《搜狐IT第一届中文Blog大型摸底调查报告》一文中Blogger群体的职业状况--“学生49.66%”,换句话说,接近一半问卷数据来自在校学生。
         分析:但是在《中国博客用户研究报告》中,凡是注明“标本描述:N=7999,N=6363”即占有效问卷9639份的82.99%及66.01%的数据,并未分出“学生”群体的比例,因为有些数据推算明显存在现实不太可能说服人。下一个问题就更准确些。

        [漏洞九:Blogger群体的月平均收入]
        《搜狐IT第一届中文Blog大型摸底调查报告》一文中“7.Blogger群体的月平均收入”:“无收入22.69%”、“500元以下20.43%”,两项合计占43.12%(占有效问卷9639份的4156份,但是Blogger群体显然只能是“我已经开始写Blog了的有效问卷9639份66.01%即6363份,因此本项只能是6363份的43.12%为2744份),再分析“5.Blogger群体的受教育程度”:
        初中以下0.39% ,初中2.64%,中专、高中、技校14.36% ,大专 16.22%,大学本科56.48%,硕士8.72%,博士及以上 1.19%。
        分析:显然,“无收入22.69%”、“500元以下20.43%”,两项合计占43.12%与“Blogger群体的受教育程度”群体的匹配问题可信度不太准确,或者说“不可信”。估计一些数据处理出现差错所致。

        [漏洞十:占Blogger用户67.7%使用不足一年]
        《搜狐IT第一届中文Blog大型摸底调查报告》一文中报告数据显示,“第一个Blog已经注册多久了”中,不到1个月9.08%,1个月到半年27.43%,半年到1年30.85%。即占Blogger用户67.7%使用不足一年。
        分析:这也是本调查报告最让人哭笑不得的地方。本调查一年前(2004年7月1日至22日)中国各个BSP各自吹嘘有多少用户了?印象中是说有300万吧,那么按此调查报告Blogger用户67.7%使用不足一年,则一年来新增Blogger用户己有443万吧,合计300+443=743万了。下面引用另一个数据作对比:
        2005年6月30日止的《中国互联网络发展状况统计报告》数据显出:
        用户经常使用的网络服务/功能(多选题):
        电子邮箱:    91.3%
        浏览新闻: 79.3%
        搜索引擎: 64.5%
        浏览网页(非新闻类):57.2%
        在线音乐(含下载):45.6%
        即时通讯: 44.9%
        论坛/BBS/讨论组等:40.6%
        在线影视(含下载):37.8%
        网上校友录:28.5%
        文件上传下载(不包含音乐、影视下载):25.8%
        网络游戏:23.4%
        网络聊天室:20.7%
        网上购物:19.6%
        个人主页空间:16.6%
        网上银行:14.1%
        网上招聘:12.2%
        网上教育:10.6%
        博客(Blog,网络日志):10.5%
        博客服务是本次新增加的调查内容,发现有10.5%的人经常使用,这说明博客在2005年上半年有比较大的发展和影响力。

        [小结]
        1、不论笔者出于什么目的,本文只是从用词及数据严谨性角度给大家提供另一个思路对待公众调查结论。因为尽管网络很开放、可以充分表达信息及观点,但是出自专业调查公司的专业报告必须具备一定的专业要求。否则咱们中国人谁也承担不了一生有超过10个性伴侣的“玩性不公”结论。这是一种公信力问题,而不是什么著名公司或者知名专家能一言以代之的事。
        2、尽管本文笔者举出了如此“十大漏洞”问题,但是笔者对搜狐《中文博客调查报告》所有参与者、支持方都表示敬意,因为它己有一个缩影,让我们比以往任何时间更为理智地了解由博客服务形成的博客服务产业机会与趋势。
       
        欢迎对本文有不同观点朋友交流。

         本文可以不删节转载,作者对文责自负,有任何不明之处请与作者联络:shenyang@sz1961sy.com
 
         沈阳 2005年10月14日 15时08分 写于北京家中

          [本文作者为《中国域名经济(2002-2003年版)》主编、《中国域名经济(丛书)》总策划兼编委之一、中国版权协会(CSC)个人会员]

发表评论:

    昵称:
    密码: (游客无须输入密码)
    主页:
    标题:
  收藏此页到365Key