6  假设检验

6.1 标准流程

  1. 建立假设和确定显著性水平
    • null hypothesis:\(H_0\)
    • alternative hypothesis:\(H_1\)
    • 显著性水平/犯第\(Ⅰ\)类错误(拒绝真\(H_0\))的概率/拒绝域的概率:\(α\)
  2. 选择检验方法和计算检验统计量
    • \(t\)检验,\(z\)检验,\(\chi^2\)检验,\(F\)检验,非参数检验等
  3. 根据P值做出统计推断
    • p≤α,拒绝\(H_0\),接受\(H_1\)
    • p>α,不拒绝\(H_0\)

6.2 功效分析

https://www.statmethods.net/stats/power.html

  1. \(Ⅰ\)类错误:拒绝真\(H_0\),犯第Ⅰ类错误的概率\(\alpha=P(reject\ H_0|H_0\ is\ True)\)

  2. \(Ⅱ\)类错误:不拒绝假\(H_0\),犯第Ⅱ类错误的概率\(\beta=(not\ reject\ H_0|H_1\ is\ True)\)

  3. 功效 \(power=1-β=P(reject\ H0|H1 \ is\ True)\)

  4. 效应值 effect size 备择假设下的效应值

  5. 样本量 sample size

6.3 假设检验与区间估计

如果参数\(θ\)\((1-α)×100\%\)置信区间CI包含参数\(\theta_0\)所有的估计值,那么不拒绝\(H_0\);

如果参数\(θ\)\((1-α)×100\%\)置信区间CI不包含参数\(\theta_0\)任意一个估计值,那么拒绝\(H_0\);

p value 和 CI 对于统计推断同等重要,尤其是大样本量。