2011年06月26日 15:01 来源:北京晚报
5月和6月,中国社科院相继发布报告,称中国城市居民整体上比较幸福,幸福感呈持续上升趋势。但第二个报告称多数大城市的居民对生活质量感到不满意。
一边是幸福,一边是不幸福,难不成一个月之间,人们的幸福感突然发生了转变?
“被幸福”是哪出的错
想象你的面前摆着一个箱子,里面装满了1分、2分和5分硬币,你知道硬币的总数——10万——你如何知道每种硬币的数量?
一个复杂但精确的方法是,把硬币倒在你的面前,一个一个数上一遍。但如果你不需要这么精确的答案,那么还有另外一种简单得多的方法:抓出1000个硬币,数出每种硬币的数量,再按照比例计算出答案。
此时,你只是做了一个简单的假设——抽出硬币的种类比例,与箱子中所有硬币的种类比例大致相同。
乍一听,这样的方法似乎很不精确,不过这正是统计学最常用的统计方法,它有一个更为学术的名字——抽样统计。
幸福感的统计也不例外,无论得出的结果如何,研究人员显然没有询问每一个人的幸福感——13亿人的幸福感,统计起来可不那么幸福——而是从人群之中,选出一部分“样本”,正是这些样本帮助你完成了“幸福感”的统计。
这听起来多少有些不幸,我们名正言顺地“被代表”了,可这并不能解释,为什么我们的感受总与统计部门的数据相背离?为什么我们总是“被增长”、“被幸福”的那一个?
这就要从有“偏差”的抽样说起了,就如你随手抓出那1000个硬币,随机抽取的样本未必会真正随机,统计者采取的手段和偏好,乃至错误的提问方式,都能导致抽样数据本身偏离现实。
一个例子可以说明“偏差”如何出现,设计一项简单的网络调查,你可以随机挑选几个问题,最后附加一道单项选择:“你乐意回答此调查问卷吗?A是,B不是。”
笔者无法预测其他题目的答案,不过最后一道题笔者敢大胆预测,你一定会得到超高比例的“A”,偏差必将出现了,为什么?
逃不开的抽样偏差
即便是对抽样统计一窍不通的人,也能瞧出其中的法门——那些厌恶网络投票,也就是会选择B的网民,压根不会将时间浪费在你的调查问卷中。现实统计中,这样的抽样偏差屡见不鲜,甚至在某些严肃的领域,同样会出现这样的问题。
一个广为传播的例证出现在1936年的美国总统大选。彼时的一家统计部门,收集了1000万个电话用户和美国著名期刊《文学文摘》订户的选举数据,并得出了候选人兰登与罗斯福之间370:161的票数比预测。
后来的结果尽人皆知,在预测中不被看好的罗斯福最终获胜,连任美国总统,最终成为美国史上在任时间最长的总统。
为何如此巨大的抽样量(1000万),还是得到了错误的结果?之后不断有学者进行研究,最终得出的结论印证了抽样偏差的存在。1936年的美国,拥有能力购买电话或愿意阅读《文学文摘》的受调查者,实际上是一群经济条件较好的特殊群体。虽然样本量巨大,但这样的群体,显然不能代表彼时美国人的全部利益(实际上他们多偏向共和党,因此支持兰登)。存在如此巨大的偏差,预测失误也就在所难免了。
如果说这样的偏差属于无心之失,那么也有许多偏差的出现,则是有意为之。例如企业常常会使用这样的“统计技巧”,向长期使用企业产品的用户发放调查问卷,最后得出“绝大多数用户信赖本企业产品”的调查结论。
你是个诚实的样本么
把样本存在的偏差,全怪在统计数据编制者身上并不客观。事实上,我们人人都可能成为样本偏差的起因,因为我们远没有自己想象中那样诚实。
请再次发挥你的想象力,这一次,你正拿着圆珠笔,在一张调查问卷上勾选,身边的调查员用善意的目光关切着你。你们两人正站在一家商城的进门大厅处,发扬绅士风度,你答应了他占用十分钟的要求。
正在此时,一道调查题目进入视线:“请在以下选项中勾选您的月薪:A、2000以下,B、2000-5000,C、5000-8000,D、8000以上”。
上个月,你的老板刚刚承诺你加薪,虽然没有兑现,不过你仍然相信,5000元的月薪即将到手。环顾四周,走过自己身边的人们,一个个衣着光鲜,调查员还在等待着你的答案,你会如何选择?
你勾选了选项C,并为自己的虚荣暗自羞愧,不过别担心,几乎人人都会作出与你相同的选择。想要说真话,实在不是一件简单事。
造成不诚实的原因有很多,受到调查时的情绪、对调查事物本身的偏见、无处不在的虚荣心,乃至对陌生调查员的不信任,都能造成不诚实。有了这样的不诚实,想要得到一份完全客观的数据可以说是难上加难。
统计——误差持久战
到这里,“被幸福”与“不幸福”之间,我们终于可以给出答案:至少有一组统计者,采用了错误的统计方法,得出了错误的数据。
推而广之,我们甚至可以说,完全没有偏差的统计数据,压根就不存在,统计不啻于一场与误差的持久战。
如此说来,我们“被增长”、“被幸福”的命运就无法摆脱了?
想要得到准确客观的统计数据,就要保证调查总体中的每一个个体,都拥有相同的几率被选入样本。虽然如此做的成本高,难度大,但并不意味着难以完成。
如果样本总是停留在西装革履的白领,而不去寻找隐匿在楼宇间,衣衫褴褛的装修工人,不去寻找挥汗如雨的建筑工人,那么我们的工资就永远“被增长”。
如果样本总是停留在和颜悦色的受访者,而不去寻找那些面带怒气,对调查不屑一顾的人,那么我们的幸福感就只会“越来越高”。
说到底,统计部门的专业水平与用心程度,才是问题的最后关键。
本报记者 吴楠J210SourcePh" style="display:none">
分享到: |