正态分布的3大分布类型:卡方分布、t分布、F分布。

卡方分布定义

设随机变量  相互独立,且  服从标准正态分布 N(0,1),则它们的平方和  服从自由度为 n 的 x²分布。

image.png
图为 x² 分布示意图。可以看出:图像分布在第 1 象限内,卡方值都是正值,呈右偏态,随着参数 n 的增大,分布趋近于正态分布。随着自由度 n 的增大,向正无穷方向延伸(这是因为均值 n 越来越大),分布曲线也越来越低(因为方差 2n 越来越大)。

细节:

  • 当 n=1 或者 2 时:卡方分布先高后低的平滑曲线,检验统计量等于较小值的概率远远大于较大值的概率,即观察频数有可能接近期望频数;
  • 当 n 大于 2 时:卡方分布先低后高再低,其外形沿着正向扭曲。

卡方分布应用和检验步骤

卡方分布指出观察频数与期望频数之间差异显著性,和其他假设一样,这取决于显著性水平。

  • 显性水平α进行检验(常用的显著性水平 0.05);
  • 检测标准:卡方分布检验是单尾检验且是右尾,右尾被作为拒绝域。于是通过查看检验统计量是否位于右尾的拒绝域以内,来判定期望分布得出结果的可能性;
  • 卡方概率表的使用;
  • 分类变量的卡方检验。

卡方分布假设检验步骤

  1. 确定要进行检验的假设(H0)及其备择假设(H1)
  2. 求出期望 E 和自由度 n
  3. 确定用于做决策的拒绝域(右尾)
  4. 计算检验统计量
  5. 查看检验统计量是否在拒绝域内
  6. 做出决策

PS:卡方分布检验其实就是假设检验的特殊形式。

t分布定义

假设随机变量 ,且 X 与 Y 相互独立,那么:

其分布称为t分布。记为t(n),其中 n 为自由度。
image.png
图为t分布示意图。图像整体以 0 为中心,左右对称的单峰分布;t分布是一簇曲线,可发现其形态变化与n(即其自由度)大小有关。自由度n越小,t分布曲线越低平;自由度 n 越大,t分布曲线越接近标准正态分布曲线,当自由度无限大时,t分布就成了正态分布。

t分布应用

t检验流程:

  1. 建立假设、确定检验水准α
    H0:μ = μ0 (零假设)
    H1:μ ≠ μ0(备择假设)
    双侧检验,检验水准:α=0.05
  2. 计算检验统计量
  3. 查相应界值表,确定P值,下结论

ps:t检验适用于两个变量均数间的差异检验

F分布定义

假设随机变量 Y 与 Z 相互独立,且 Y 和 Z 分别服从自由度为 m 和 n 的 x² 分布,随机变量 X 有如下表达式:

则称 X 服从第一自由度为 m,第二自由度为 n 的 F 分布,记为F(m,n)。

image.png

F分布应用

方差比例检验,方差分析、回归分析和方差齐性检验。