您的位置:主页 > 养身 > 饮食 >

如何使用统计信息谎言(对自己)

2019-08-10     来源:广汽丰田         内容标签:如何,使用,统计,信息,谎言,对,自己,威廉,布里,

导读:威廉·布里格斯(WilliamBriggs)有一个很好的例子,就是说你自己认为你已经找到了两个因素之间的联系是多么容易:告诉你误导是多么容易你自己用逐步程序,我做了以下模拟。

威廉·布里格斯(WilliamBriggs)有一个很好的例子,就是说你自己认为你已经找到了两个因素之间的联系是多么容易:

告诉你误导是多么容易你自己用逐步程序,我做了以下模拟。我为y和50x(当然每100个观察中的每一个)生成了100个观察结果。所有观察结果都是由数字组成,每个都没有给出关于另一个的信息。没有然后,计算机应该告诉我,最好的模型根本就没有模型。但是这里找到的是:逐步程序给了我一个最好的组合模型,原始的50x中有7个但是这些x中只有4个符合保留在模型中的通常标准(下面解释),所以我的最终模型是这个:解释.p值Pr(betax|data)&gt;0x70.00530.991x210.0460.976x270.000450.996x430.00630.996在经典统计中,如果具有p值,则解释变量保留在模型中e<0.05。在贝叶斯统计中,当该变量(其系数为非零)的概率大于(例如)0.90时,解释变量保留在模型中。不要担心,如果你不明白这是什么意思-只要知道这个:这个模型将通过任何经典或现代的测试,因为它是好的。该模型甚至调整后的R2为0.26,在许多领域(如营销或社会学;R2是0到1之间的数字,更高的数字更好)被认为是优秀的。没有人或很少会注意到这个模型是完全弥补的。原因在于,在现实生活中,这些x中的每一个都会附加一个名称。例如,如果y是一年中旅行所花费的金额,则某些x可能是x7=“已婚或未婚”,x21=“孩子数”,依此类推。在事实之后编写一个合理的故事太容易说:“当然,x7应该在模型中:毕竟,已婚人士的假期与单身人士不同。”你甚至可能继续发表一篇文章。“酒店趋势杂志”中的论文显示了结婚与旅行模式之间存在“统计上显着”的关系。你会相信。但是,在你向我展示你的模型如何对一组新数据进行表达之前,我不会相信你。,从明年的旅行数据说。但这种情况很少发生,我还没有碰到它的一个例子。什么是最后一次有人阅读社会学,心理学等期刊的文章,其中使用真正独立的数据来展示以前建立的模型如何表现良好或失败?如果我的任何一位读者都看过这个,请给我留言:你将取得相当于一个密码学的发现。实际上,产生这些虚假模型是毫不费力的。我没有通过100次模拟来找到一个看起来特别具有误导性的模拟。我做了一次模拟。使用这种逐步程序实际上可以保证你会找到一个“具有统计意义”但又虚假的模型。

这就是为什么我们“研究表明几乎所有东西都会杀了你-不,等等!他们会”让你永远活着!

文章链接地址:http://www.drabidi.com/yangshen/yinshi/201908/2121.html

上一篇:健康改革会削减医疗保险福利吗?
下一篇:没有了

饮食相关文章