卡方检验的理论知识

卡发检验定义:卡方检验是假设检验的一种方法。主要是比较两个分类变量的关联性分析。

卡方值的计算:

  1. 设 A 代表某个类别的观察频数,E 代表基于 _H_计算出的期望频数,A 与 E 之差称为残差;
  2. 残差可以表示某一个类别观察值和理论值的偏离程度,但如果将残差简单相加以表示各类别观察频数与期望频数的差别,则有一定的不足之处。因为残差有正有负,相加后会彼此抵消,总和仍然为 0,为此可以将残差平方后求和;
  3. 残差大小是一个相对的概念,相对于期望频数为 10 时,期望频数为 20 的残差非常大,但相对于期望频数为 1 000 时 20 的残差就很小了。考虑到这一点,又可以将残差平方除以期望频数再求和,以估计观察频数与期望频数的差别。

所以,其计算公式就变成:

其中,_A__i _为 i 水平的观察频数,_E__i _为 i 水平的期望频数。

当观察频数与期望频数完全一致时,χ值为 0;观察频数与期望频数越接近,两者之间的差异越小,χ值越小;反之,观察频数与期望频数差别越大,两者之间的差异越大,χ值越大。

换言之,大的 χ值表明观察频数远离期望频数,即表明远离假设。小的 χ值表明观察频数接近期望频数,接近假设。因此,χ是观察频数与期望频数之间距离的一种度量指标,也是假设成立与否的度量指标。

如果 χ值“小”,研究者就倾向于不拒绝 _H_;如果 χ值大,就倾向于拒绝 _H_。至于 χ在每个具体研究中究竟要大到什么程度才能拒绝 _H_,则要借助于卡方分布求出所对应的 P 值来确定。

卡方检验的使用场景

卡方检验一般使用在两个及以上的定性(或者说分类变量)上:

  • 检验某个分类变量各类的出现概率是否等于指定概率。比如:掷硬币时,正反两面出现的概率是否均为 0.5;
  • 检验某两个分类变量是否相互独立。比如:吸烟(二分类变量:是、否)是否与呼吸道疾病(二分类变量:是、否)有关;
  • 检验控制某种或某几种分类因素的作用以后,另两个分类变量是否相互独立。比如:控制性别、年龄因素影响以后,吸烟是否和呼吸道疾病有关;
  • 检验某两种方法的结果是否一致。如采用两种诊断方法对同一批人进行诊断,其诊断结果是否一致;采用两种方法对客户进行价值类别预测,预测结果是否一致。

案例一(行列的卡方检验)

问题:掷 50 次硬币,正反两面出现的概率是否均为 0.5,也就是说硬币是否均衡?假设是不均衡的。

计算表格(2*2) 正面 反面
理论频次(E) 25 25
观察频次(A) 28 23
  1. 求卡方值:

  1. 求自由度:

  1. 95% 置信度,对比 P 值:查表可以得知,卡方值 0.72 小于自由度为 1 的临界值。所以假设不成立,硬币是均衡的。

image.png

案例二(四格表的卡方检验)

问题:男生女生性别和在线上买菜是否有关系?假设有显著关系。

【观察数据】

男生 女生 总计
线下买菜 67 33 100
线上买菜 55 60 115
总计 122 93 215

通过【观察数据】算出理论数据。

【理论数据】

男生 女生 总计
线下买菜 57 43 100
线上买菜 65 50 115
总计 122 93 225

理论数据计算:

  1. 已知男生、女生总计 215 人,线下买菜概率:100 / 215 = 0.47
  2. 那男生线下买菜期望值: 0.46 * 122 = 57
  3. 以此类男生下商买菜、女生线上买菜、女生线下买菜理论值

计算卡方值判断:

  1. 求卡方值:

  1. 求自由度

  1. 95% 置信度,对比 P 值:查表可以得知,卡方值 7.62 大于自由度为 1 的临界值。所以假设不成立,性别和是否线上线下买菜有显著关系。