常见统计估计概念和区别
一、 常见检验
1. 独立性检验针对于类别型变量,基于频数表或者列联表来判断两个因素之间的独立性。原假设是两个因素相互独立,P(AB) = P(A)*P(B)。如果得到的P值比较大,说明原假设不独立,可以进而计算Phi系数,列联系数和Cramer\’s V系数等来判断相关性
2. 相关性的显著性检验是针对定量变量,对定量变量计算出相关系数之后,来计算对于原来的假设,变量间不相关(即总体的相关系数为0),来进行检验的工具,R中自带的工具为cor.test()
3. T检验是一种针对正态分布的参数方法,和1,2两种检验解决解决的问题不同,它是针对均值的检验
举例:
当有四组数据性别,地区,年龄,血糖
1. 当想要研究相别,地区与年龄关系,由于性别和地区是类别型变量可以使用独立性检验
2. 当要研究某一地区内男性的年龄和血糖的关系,由于年龄和血糖变量是定量变量,可以计算相关性然后用相关性检验
3. 当要研究某一年龄段,不同地区男性之间的血糖是否处于同一水平可以采用T检验
二、P值的意义
基本原理:
1、一个命题只能证伪,不能证明为真
2、在一次观测中,小概率事件不可能发生
3、在一次观测中,如果小概率事件发生了,那就是假设命题为假
证明逻辑就是:我要证明命题为真->证明该命题的否命题为假->在否命题的假设下,观察到小概率事件发生了->否命题被推翻->原命题为真->搞定。
结合这个例子来看:证明A是合格的投手-》证明“A不是合格投手”的命题为假-》观察到一个事件(比如A连续10次投中10环),而这个事件在“A不是合格投手”的假设下,概率为p,小于0.05->小概率事件发生,否命题被推翻。
可以看到p越小-》这个事件越是小概率事件-》否命题越可能被推翻-》原命题越可信
作者:吉米多维奇
链接:https://www.zhihu.com/question/23149768/answer/31704861
来源:知乎
著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。