统计学:卡方检验
Contents
卡发检验定义:卡方检验是假设检验的一种方法。主要是比较两个分类变量的关联性分析。
卡方值的计算:
- 设 A 代表某个类别的观察频数,E 代表基于 _H_计算出的期望频数,A 与 E 之差称为残差;
- 残差可以表示某一个类别观察值和理论值的偏离程度,但如果将残差简单相加以表示各类别观察频数与期望频数的差别,则有一定的不足之处。因为残差有正有负,相加后会彼此抵消,总和仍然为 0,为此可以将残差平方后求和;
- 残差大小是一个相对的概念,相对于期望频数为 10 时,期望频数为 20 的残差非常大,但相对于期望频数为 1 000 时 20 的残差就很小了。考虑到这一点,又可以将残差平方除以期望频数再求和,以估计观察频数与期望频数的差别。
所以,其计算公式就变成:
其中,_A__i _为 i 水平的观察频数,_E__i _为 i 水平的期望频数。
当观察频数与期望频数完全一致时,χ值为 0;观察频数与期望频数越接近,两者之间的差异越小,χ值越小;反之,观察频数与期望频数差别越大,两者之间的差异越大,χ值越大。
换言之,大的 χ值表明观察频数远离期望频数,即表明远离假设。小的 χ值表明观察频数接近期望频数,接近假设。因此,χ是观察频数与期望频数之间距离的一种度量指标,也是假设成立与否的度量指标。
如果 χ值“小”,研究者就倾向于不拒绝 _H_;如果 χ值大,就倾向于拒绝 _H_。至于 χ在每个具体研究中究竟要大到什么程度才能拒绝 _H_,则要借助于卡方分布求出所对应的 P 值来确定。
卡方检验的使用场景
卡方检验一般使用在两个及以上的定性(或者说分类变量)上:
- 检验某个分类变量各类的出现概率是否等于指定概率。比如:掷硬币时,正反两面出现的概率是否均为 0.5;
- 检验某两个分类变量是否相互独立。比如:吸烟(二分类变量:是、否)是否与呼吸道疾病(二分类变量:是、否)有关;
- 检验控制某种或某几种分类因素的作用以后,另两个分类变量是否相互独立。比如:控制性别、年龄因素影响以后,吸烟是否和呼吸道疾病有关;
- 检验某两种方法的结果是否一致。如采用两种诊断方法对同一批人进行诊断,其诊断结果是否一致;采用两种方法对客户进行价值类别预测,预测结果是否一致。
案例一(行列的卡方检验)
问题:掷 50 次硬币,正反两面出现的概率是否均为 0.5,也就是说硬币是否均衡?假设是不均衡的。
计算表格(2*2) | 正面 | 反面 |
---|---|---|
理论频次(E) | 25 | 25 |
观察频次(A) | 28 | 23 |
- 求卡方值:
- 求自由度:
- 95% 置信度,对比 P 值:查表可以得知,卡方值 0.72 小于自由度为 1 的临界值。所以假设不成立,硬币是均衡的。
案例二(四格表的卡方检验)
问题:男生女生性别和在线上买菜是否有关系?假设有显著关系。
【观察数据】
男生 | 女生 | 总计 | |
---|---|---|---|
线下买菜 | 67 | 33 | 100 |
线上买菜 | 55 | 60 | 115 |
总计 | 122 | 93 | 215 |
通过【观察数据】算出理论数据。
【理论数据】
男生 | 女生 | 总计 | |
---|---|---|---|
线下买菜 | 57 | 43 | 100 |
线上买菜 | 65 | 50 | 115 |
总计 | 122 | 93 | 225 |
理论数据计算:
- 已知男生、女生总计 215 人,线下买菜概率:100 / 215 = 0.47
- 那男生线下买菜期望值: 0.46 * 122 = 57
- 以此类男生下商买菜、女生线上买菜、女生线下买菜理论值
计算卡方值判断:
- 求卡方值:
- 求自由度
- 95% 置信度,对比 P 值:查表可以得知,卡方值 7.62 大于自由度为 1 的临界值。所以假设不成立,性别和是否线上线下买菜有显著关系。