20 诊断性测试
20.1 混淆矩阵
20.2 灵敏度(Sensitivity)
真阳性率:指在所有真实状况为阳性的样本中,被正确识别出阳性的比例。
\[ Se=\frac{TP}{TP+FN} \]
其中TP 是真阳性的数量,FN 是假阴性的数量。
20.2.1 假阴性率(FNR) /漏诊率
\[ FNR=1-Se \]
20.3 特异度(Specificity)
真阴性率:指在所有真实状况为阴性的样本中,被正确识别出阴性的比例。
\[ Sp=\frac{TN}{TN+FP} \]
其中 TN 是真阴性的数量,FP 是假阳性的数量。
20.3.1 假阳性率(FPR) /误诊率
\[ FPR=1-Sp \]
Show the code
# 构建列联表
observed_sensitivity <- matrix(c(28, 11, 37, 2), nrow = 2, byrow = TRUE,
dimnames = list('检验方式' = c('尿糖检验', '血糖检验'),
'结果' = c('检出阳性', '未检出阳性')))
observed_sensitivity
#> 结果
#> 检验方式 检出阳性 未检出阳性
#> 尿糖检验 28 11
#> 血糖检验 37 2
# 进行卡方检验
s <- chisq.test(observed_sensitivity,correct = F)
# 输出结果
s
#>
#> Pearson's Chi-squared test
#>
#> data: observed_sensitivity
#> X-squared = 7.4769, df = 1, p-value = 0.006249
# 构建列联表
observed_accuracy <- matrix(c(29, 11, 38, 2), nrow = 2, byrow = TRUE,
dimnames = list('检验方式' = c('尿糖检验', '血糖检验'),
'结果' = c('检准', '不准')))
# 进行卡方检验
accuracy <- chisq.test(observed_accuracy,correct = F)
# 输出结果
accuracy
#>
#> Pearson's Chi-squared test
#>
#> data: observed_accuracy
#> X-squared = 7.4397, df = 1, p-value = 0.00638
20.4 Youden’s Index
\[ J=Se-FPR =Se+Sp-1,J[1,-1] \]
J 越大诊断有效性越高
J=1 表示完美的诊断性能,因为Se,Sp都是1。
J≤0 表示没有诊断价值
20.5 Likelihood Ratio
20.5.1 正似然比
\[ LR+=\frac{Se}{FPR}=\frac{Se}{1-Sp} \]
LR+越大表示患病测出阳性结果的优势越大
LR+=1表示诊断无效
20.5.2 负似然比
\[ LR-=\frac{FNR}{Sp}=\frac{1-Sp}{Sp} \]
LR-越小表示患病测出阴性结果的优势越小
LR-=1表示诊断无效
20.6 预测值
Show the code
m
#> truth
#> predict + -
#> + "TP" "FP"
#> - "FN" "TN"
阳性预测值(Positive Predictive Value, PPV):在所有被测试为阳性的样本中,真正的阳性比例。
\[ PPV=\frac{TP}{TP+NP} \]
阴性预测值(Negative Predictive Value, NPV):在所有被测试为阴性的样本中,真正的阴性比例。
\[ PPV=\frac{TN}{TN+FN} \]
配对样本设计
\(\chi^2\)配对检验
完全随机设计
\(\chi^2\)检验
20.7 一致性(agreement)
准确度(Accuracy):指测试正确地分类(阳性或阴性)的样本占总样本的比例。
\[ Accuracy=\frac{TP+TN}{N} \]
kappa 系数
\[ \kappa =\frac{Accuracy-[(a+b)(a+c)+(c+d)(b+d)]/N^2}{1-[(a+b)(a+c)+(c+d)(b+d)]/N^2} \]
κ=1表示完全一致
κ=-1表示完全不一致
κ=0表示一致性与偶然一致性Pe相同
通常κ>0.7即可以认为两种诊断方法有较好的一致性
20.8 ROC曲线(Receiver Operating Characteristic Curve)
ROC曲线(Receiver Operating Characteristic Curve):是一个图形工具,用于展示不同阈值下灵敏度和特异度之间的关系。曲线下面积(AUC)越接近1,表示测试的性能越好。
Show the code
20.8.1 AUC
A=P(X>Y)
\[ S(X,Y)= \begin{cases} 1,\ \ \ \ X>Y\\ 1/2,X=Y\\ 0,\ \ \ \ X<Y\\ \end{cases} \]
\[ \hat A=\frac{1}{n_0n_1}\sum_1^{n1}\sum_1^{n_0}S(X, Y) \]
20.8.2 分组AUC的比较
完全随机设计
\[ Z=\frac{\hat A_1-\hat A_2}{\sqrt{Var(\hat A_1)+Var(\hat A_2)}} \]
配对样本设计
\[ Z=\frac{\hat A_1-\hat A_2}{\sqrt{Var(\hat A_1)+Var(\hat A_2)-2Cov(\hat A_1,\hat A_2)}} \]