看到“数据统计”的时候,要多打几个问号,然后再深入研究

admin 11 0

我再次真诚地给你一个建议:

当你看到很多看似合理、严谨、科学的统计数据时,三思而后决定是否接受这个结论。

因为周末发了一条微博,评论里有人搬出了“统计”。我只是想让你知道统计结果是可以手动操作的。即使数据正确,计算过程正确,结论也可以随意操纵。

例如:

我相信90%以上的入室盗窃发生在门锁上的时候。那么,我们能否得出这样的结论:锁门比不锁门更危险?因为只有10%的入室盗窃发生在门没锁的时候。

这个不用我说。你也知道这个结论肯定是不正确的。

这个结论是不正确的,因为上锁和不上锁的门的基数是不同的。如果99%的门是锁着的,1%的门是开着的。然而,1%未上锁的门导致了10%的盗窃率。你对比一下这个就明白——锁门是安全的。

这很明显。但是换个场景,很多朋友都是被脑子里的感情支配,没那么理智。

要想得出结论,必须全面考察数据。

例如,如果你想研究条件A和条件B在最终结果中具有相似的比例,那么你需要看看所有样本中A和B的比例是否相同。如果条件A在所有样本中所占比例非常大,条件B在所有样本中所占比例非常小,但结果是条件A和条件B相似,那么显然,条件B更容易触发结果。

再比如,你要研究同一个样本,当它是条件a时,触发结果的比例是多少。变成条件B时,触发结果的比例是多少?也就是说,在同一个个体上,A和B的比例是否相同。

还有,你要研究一下外界对A和b的反应,比如一个人走在两边都关着门的走廊里,他可能根本就不想进去偷钱。但是,当一扇门打开,满地都是钱,房间里没有人,走廊里没有摄像头,你觉得好人变成小偷的概率会增加吗?

也就是说,当诱惑出现在正常人面前时,正常人做出的动作是不一样的。当诱惑足够大的时候,好人内心的魔鬼就可能被唤醒。

条件a和条件b都可能触发结果。这并不意味着它们触发相同比例的结果。因此,我们应该考虑以下几个方面:

第一,A和B在总样本中的比例是否相同?如果A的比例远大于B,导致类似的结果,那么B触发结果的概率就高。

第二,对于同一个样本,a和b状态触发结果的概率是否相同?这个很重要。

第三,A、B状态会导致外部因素变化吗?锁着的门和开着的门哪一个更危险,会把钱弄得满屋子都是?再次,状态的改变会导致外部因素的改变。你不必相信这些。

且不说流传的一些数据是真是假。即使有这样的报道,他们是否详细研究了上述问题?如果不是,有什么只能用一些选定的数据来解释?

我一直强调的不是A状态不会触发结果(A状态和B状态都会触发一些外部因素),也不是B状态是否会提高触发结果的概率这一客观事实。

我不想讨论前面的话题。累了。我只想说,如果看到“统计”,就多打几个问号,然后再深入研究。所以,人生应该如此。

作者:ETF拯救世界

来源:微博