枪手的诡计
美国有这么一个流传已久的笑话:一位老德克萨斯枪手曾用诡计来欺骗他的朋友,让朋友对他的枪法产生深刻印象。这位枪手在牛棚的门上打出一串枪眼后,围着这些枪眼画出了靶子。“看见了吗?伙计。每次我都正中靶心!”
把这些枪眼说成是自己瞄准的结果,这显然是笑话,然而让人讶异的是,现实中真的有许多人或者机构就是这么干的。他们会在大量的数据中小心地挑选出对自己有利的证据,而不使用那些对自己不利的数据。例如:某机构为了证明自己尽到了职责,到处宣传自己拨出了XXXX的善款,却只字不提自己公款消费的奢侈无度。
先决定了自己的立场(靶心),然后才开始找证据,并且只找对自己有利的,而对于那些对自己不利的就选择性忽略。这在逻辑学中被称为“德克萨斯神枪手谬误”,这种谬误在我们的生活中几乎随处可见。
媒体的不实报道
警察暴力一直是美国的一个严重问题,不过,这个问题被媒体夸大了。
纽约时报:“黑人只占美国人口的12%,但在被警察射杀的人中有30%是黑人。”
华盛顿邮报:“黑人只占美国人口的12%,但却在被警察射杀的手无寸铁的人中占40%。”
乍一看,黑人被警察射杀的几率确实高于白人,不过在这背后又有哪些数据没有告诉读者呢?
首先,美国一共有三亿人口,而在2015年被警察当场射杀的人不到1000人,这两个数据差距太大,根本没有必要联系,也无法用来作对比。
其次,被美国警察射杀的人中,半数都是白人,黑人只占百分之二十到三十,其中百分之七十的人都持有致命武器,而这些数据都被忽略了。
广告中的可疑数据
一些广告为了支持自己的论点,会强行把两个不相关的数据拼凑到一块。比如:某家制造含糖饮料的公司说,有研究提到:世界上含糖饮料消费量最高的五个国家,有三个在“世界上最健康的10个国家”的名单里,因此含糖饮料本身是健康的。
还有一些广告,只采用对他们有利的数据,而对那些不利的数据却只字不提。如:根据婚恋网站 Date.com 的匹配结果,Sally和Billy 是很适合的一对,因为他们有4个共同的喜好:电影、意大利餐、跑步、旅行。但婚恋网站没有告诉Sally和 Billy,其实他们还有20个不同的地方,足以让他们各奔东西……
迷恋p值的科学家
p值是一个统计学中常用的数据,是用来判定假设检验结果的一个参数。科学家中有许多p值的粉丝,他们只相信p值,不考虑其他,结果出现了p值黑客(或p值操纵)现象,即通过操作科学数据,从而使结果看上去具有统计学意义的行为。
有两种方式会引起统计结果的明显改变,一是选择样本不随机性。在样本入组时,有太多的人为因素和主观因素,样本不是按照随机原则入组的。另外一个就是p值篡改,研究人员使用不同的统计方法和数据,选择那些会产生符合自己意愿的数据,不断地统计直到结果满意。
可以引起p值篡改的行为有:记录了很多变量,但是统计后根据p值进行取舍;统计分析后发现结果不满意,然后删除一些变量再统计直到结果满意;统计分析后把一些指标进行合并或者拆分;统计结果发现p值有意义就停止收集数据。