自由度的两个维度理解。

抽样推断的维度

自由度(degree of freedom, df)是指当以样本的统计量来估计总体的参数时,样本中独立或能自由变化的数据的个数,称为该统计量的自由度。

案例:
有 4 个数据  的样本,其平均值  等于 5,即受到  的条件限制,在自由确定4、2、5三个数据后,第 4 个数据只能是 9,否则 。因而这里的自由度

所以,简单理解自由度是:

任何统计量的自由度  = 这些观测中存在必要联系的数目  - 限制条件的个数

卡方检验的维度

卡方检验主要是比较两个及两个以上样本率以及两个分类变量的关联性分析。在计算卡方值的过程中,会涉及到自由度。

案例
在 22 表格中,Category A 和 Category B 的值,一旦确定其中一个值,其他值也随之确定。所以,这个 22 表格的自由度是 1 。
image.png
在 32 表格中,Category A 和 Category B 的值,一旦确定其中两个值,其他值也随之确定。所以,这个 32 表格的自由度是 2 。

所以推出来卡方检验的自由度公式。对于一个  行和  列的表格,自由度 =

image.png