统计学:正态分布的3大分布类型——卡方分布、t分布、F分布
卡方分布定义
设随机变量 相互独立,且 服从标准正态分布 N(0,1),则它们的平方和 服从自由度为 n 的 x²分布。
图为 x² 分布示意图。可以看出:图像分布在第 1 象限内,卡方值都是正值,呈右偏态,随着参数 n 的增大,分布趋近于正态分布。随着自由度 n 的增大,向正无穷方向延伸(这是因为均值 n 越来越大),分布曲线也越来越低(因为方差 2n 越来越大)。
细节:
- 当 n=1 或者 2 时:卡方分布先高后低的平滑曲线,检验统计量等于较小值的概率远远大于较大值的概率,即观察频数有可能接近期望频数;
- 当 n 大于 2 时:卡方分布先低后高再低,其外形沿着正向扭曲。
卡方分布应用和检验步骤
卡方分布指出观察频数与期望频数之间差异显著性,和其他假设一样,这取决于显著性水平。
- 显性水平α进行检验(常用的显著性水平 0.05);
- 检测标准:卡方分布检验是单尾检验且是右尾,右尾被作为拒绝域。于是通过查看检验统计量是否位于右尾的拒绝域以内,来判定期望分布得出结果的可能性;
- 卡方概率表的使用;
- 分类变量的卡方检验。
卡方分布假设检验步骤
- 确定要进行检验的假设(H0)及其备择假设(H1)
- 求出期望 E 和自由度 n
- 确定用于做决策的拒绝域(右尾)
- 计算检验统计量
- 查看检验统计量是否在拒绝域内
- 做出决策
PS:卡方分布检验其实就是假设检验的特殊形式。
t分布定义
假设随机变量 ,,且 X 与 Y 相互独立,那么:
其分布称为t分布。记为t(n),其中 n 为自由度。
图为t分布示意图。图像整体以 0 为中心,左右对称的单峰分布;t分布是一簇曲线,可发现其形态变化与n(即其自由度)大小有关。自由度n越小,t分布曲线越低平;自由度 n 越大,t分布曲线越接近标准正态分布曲线,当自由度无限大时,t分布就成了正态分布。
t分布应用
t检验流程:
- 建立假设、确定检验水准α
H0:μ = μ0 (零假设)
H1:μ ≠ μ0(备择假设)
双侧检验,检验水准:α=0.05 - 计算检验统计量
- 查相应界值表,确定P值,下结论
ps:t检验适用于两个变量均数间的差异检验
F分布定义
假设随机变量 Y 与 Z 相互独立,且 Y 和 Z 分别服从自由度为 m 和 n 的 x² 分布,随机变量 X 有如下表达式:
则称 X 服从第一自由度为 m,第二自由度为 n 的 F 分布,记为F(m,n)。
F分布应用
方差比例检验,方差分析、回归分析和方差齐性检验。