★ 位置:
★ 真品网会员

概率悖论和其他统计异常

□ 时间:2018-4-10 □ 来源: 环球科学



       △概率统计学有时候会得出令人费解的结果。Shutterstock

    想要理解我们身处的世界,统计学是非常有用的工具。但是在解释那些特性曲线时我们的直觉常常使我们出错。在本辑中我们将讨论一些我们常犯的错误以及如何在使用统计、概率和风险时避免这些错误。

    当下,研究人员可以获取丰富的软件包。这些软件包可以帮助人们轻松地分析数据并且得出复杂的统计结果。虽然这些资源非常强大,但如果使用者没有完全掌握统计学,那么就有可能曲解数据集的一些细微之处,并且由此得出相当扭曲的结论。

    接下来是一些常见的统计谬误和悖论,以及它们如何导出反直觉的结果。当然很多情况下,这些结果就是错的。

    ★ 辛普森悖论是什么?

    它是指当数据组合并时出现在不同分组中的趋势就会消失。这种现象发生时总体数据的趋势甚至有可能和每个分组的趋势都对立。
举个例子,一种治疗方法对于所有分组中的患者都是有害的,但是一旦将分组合并就有可能表现出总体上有益。

    ○ 如何发生?

    当分组的规模不均衡时辛普森悖论就会发生。疏于调控(或者刻意伪造)患者分组人数可能使有害的疗法看起来有疗效。
案例

    想象下述待上市药物疗法的双盲实验。一组中120个患者(被划成10人、20人、30人和60人的分组)接受治疗,另一组中同样120人(被划成相应的60人、30人、20人和10人分组)不接受治疗。

    总体得出的结果是接受治疗的患者比未接受治疗的痊愈率更高,也就是说该疗法似乎对患者有效。 
 

       △图源:The Conversation, CC BY-ND

    不过,再往下深入发掘该研究中组成队列的不同分组,勘查患者所有分组时,你就会发现没有接受治疗的患者痊愈率更高而且高出50%。 
 

       △图源:The Conversation, CC BY-ND

    但是请注意每个组中接受治疗和未接受治疗的患者的人数和年龄分布是不同的。这也是是数据歪曲的原因。在这个案例中,

资讯作者: 源信息发布时间: 2017/5/9 编辑:金阳
您对这个品牌的印象如何?
很好 一般 差劲
评论
    • 一楼
欢迎您的光临 欢迎朋友们参与讨论
您可以选择登录浏览
用户名
密码 记住登录信息
验证码 1235
您可以选择匿名评论

提请您注意留言的真实性和准确性。您发表的言论,真品网站有权在网站内转载或引用。

留言只代表个人看法,不代表真品网观点。

法规&标准

more