假设检验
标准流程
- 建立假设和确定显著性水平
- null hypothesis:\(H_0\)
- alternative hypothesis:\(H_1\)
- 显著性水平/犯第\(Ⅰ\)类错误(拒绝真\(H_0\))的概率/拒绝域的概率:\(α\)
- 选择检验方法和计算检验统计量
- \(t\)检验,\(z\)检验,\(\chi^2\)检验,\(F\)检验,非参数检验等
- 根据P值做出统计推断
- p≤α,拒绝\(H_0\),接受\(H_1\)
- p>α,不拒绝\(H_0\)
功效分析
https://www.statmethods.net/stats/power.html
第\(Ⅰ\)类错误:拒绝真\(H_0\),犯第Ⅰ类错误的概率\(\alpha=P(reject\ H_0|H_0\ is\ True)\)
第\(Ⅱ\)类错误:不拒绝假\(H_0\),犯第Ⅱ类错误的概率\(\beta=(not\ reject\ H_0|H_1\ is\ True)\)
功效 \(power=1-β=P(reject\ H0|H1 \ is\ True)\)
效应值 effect size 备择假设下的效应值
样本量 sample size
假设检验与区间估计
如果参数\(θ\)的\((1-α)×100\%\)置信区间CI包含参数\(\theta_0\)所有的估计值,那么不拒绝\(H_0\);
如果参数\(θ\)的\((1-α)×100\%\)置信区间CI不包含参数\(\theta_0\)任意一个估计值,那么拒绝\(H_0\);
p value 和 CI 对于统计推断同等重要,尤其是大样本量。