Please enable JavaScript.
Coggle requires JavaScript to display documents.
简单统计学 (第19章:何时相信,何时怀疑 总结章节 (被模式诱惑:如果没有合理的解释,模式只是模式而已,每一个合理的模式都应该接受新数据的检验。…
简单统计学
第19章:何时相信,何时怀疑
总结章节
被模式诱惑:如果没有合理的解释,模式只是模式而已,每一个合理的模式都应该接受新数据的检验。
具有误导性的数据:自选择偏差,幸存者偏差,记录数据和写程序时的认为的偏差。
变形的图像
缺乏思考的计算
寻找混杂因素
均值回归
要警惕研究人员只报告一部分统计检验
当心经过修剪的数据
缺乏理论的数据仅仅是数据而已,同时缺乏数据的理论也仅仅是理论
第2章:不再神奇的超级畅销书
输入垃圾、输出垃圾:人们往往过度相信计算机生成的结果,不会对输入进行审慎的思考
自选择偏差:当数据涉及到人们的选择时,就会出现
自选择偏差
。因为做出选择的人本身可能就是不同的。
回溯性研究往往存在
幸存者偏差
:当我们在回溯过去的时候,我们只能够看到幸存者。老年人的历史医疗记录里排除没有活到老年的个体。
它无法完整描述整个问题的情况。
我们会自然而然地根据我们看到的现象得出结论,也应当考虑到我们没有看到的事情。
第1章:模式、模式、模式
我们在解释眼前事物的内在愿望导致了
两种认知错误
:
我们很容易被模式以及解释模式的理论所引诱;
我们紧盯支持理论的数据,忽视与之相矛盾的证据
我们通常倾向于寻找模式并且相信我们所观察到的模式是有新意的。
我们需要一个符合逻辑、具有说服力的解释,并且需要用新数据进行验证。
第3章:被误传的谋杀之都
永远不要低估暗示的力量
百分比变化具有误导性
:当将小型事物的百分比变化和某大型事物的百分比变化进行比较时
比较是实证研究的生命线:但是要关心的是肤浅的比较,大数和小数百分比的比较;对于除了时间增长外无其他共同点的事物的比较;无关数据的比较。
第4章:洋基队的门票真的划算吗
可视化
要注意0点,不要将本来变化不大的数据趋势变得更大
在观察增长的情况下,需要注意横坐标时间、如果是长时间收入增长的化,可以考虑通货膨胀、总人口
第7章:辛普森悖论
处理混杂因素时,需要对数据进行细分
吸烟对健康的影响:性别可以做区分;
收入对生育的影响:年龄和宗教信仰可以做区分