AUC的相关知识及K

首页 > 教育 > 正文 2021-06-04

发表自话题:k曲线怎么看

1. AUC的直观解释

大家都知道AUC是ROC下方的面积,ROC是什么?ROC怎么画呢?
首先看一张图:

TP、FN、FP、TN如图:

图中的TP FP FN TN 如何理解?

如何计算画ROC曲线,我们将所有所有数据按照预测概率有小到大排列:

TRR = ( T P T P + F N ) \left(\frac{TP}{TP+FN}\right) (TP+FNTP) 又称真正率
FPR = ( F P F P + T N ) \left(\frac{FP}{FP+TN}\right) (FP+TNFP) 又称负正率或假正率

ROC曲线的横轴为FPR,纵轴为TPR。

我们设置阈值为0.1 ,小于等于0.1的判定为假,label为0, 大于0.1判断为真,label为1。可以计算此时的TPR和FPR;同理接下来设置阈值为0.35、0.4、0.8,分别求出TPR和FPR,在图中画出,再和(0,0)(1,1)相连,则画出ROC曲线。


我们先建立坐标系,纵轴为真正率,横轴为负正率,恒过(0,0)和(1,1),为什么?

在ROC曲线图时,在不同阈值下,TPR和FPR是不一样的。

当阈值为0时,则代表将所有数据判断为正样本,则没有数据被判断为负样本,则:FN和TN为0,故TPR=FPR=1,过(1,1)点;同理,当阈值为1时,我们把所有数据判断为负,则:TP和FP为0,那么TPR=FPR=0,过(0,0)点。

AUC则为ROC下方面积,AUC的物理意义和计算公式接下来讲解。

2. AUC的物理意义

AUC?

AUC这个指标想表达的含义,简单来说其实就是随机抽出一对样本(一个正样本,一个负样本),然后用训练得到的分类器来对这两个样本进行预测,预测得到正样本的概率大于负样本概率的概率。
AUC=P(P正>P负)

AUC的计算公式:

参考:https://blog.csdn.net/qq_22238533/article/details/78666436

共两种形式,其中注意第二种如下:


如何去理解呢?

参考:https://blog.csdn.net/lmm6895071/article/details/102511017#1_AUC__3

从小到大排序后,第一个正样本的位置(序号,序号从0开始),就是其比负样本得分大的个数;对于第二个正样本,前面有已经1个正样本了,所以负样本个数为位置减去1,同理,第三个正样本前面的负样本个数为位置减去2,……,对于第M个正样本,匹配的负样本个数为位置序号减去M-1。 故而,分子就变成 所有正样本的位置序号和,减去(0+1+2+……+M-1)=sum()-M*(M-1)/2. 若序号从1开始,则,=sum()-M -(0+1+2+……+M-1)=sum()-M(M+1)/2.

3. K-S曲线和K-S值(模型区分度指标)

K-S(Kolmogorov-Smirnov)中文名洛伦兹曲线,KS值的取值范围是[0,1] 。
K-S(Kolmogorov-Smirnov):KS用于模型风险区分能力进行评估, 指标衡量的是好坏样本累计分部之间的差值。
好坏样本累计差异越大,KS指标越大,那么模型的风险区分能力越强。
KS曲线是两条线,其横轴是阈值,纵轴是TPR(上面那条)与FPR(下面那条)的值,值范围[0,1] 。两条曲线之间之间相距最远的地方对应的阈值,就是最能划分模型的阈值即K-S值

K-S曲线的纵轴是表示TPR和FPR的值,就是这两个值可以同时在一个纵轴上体现,横轴就是阈值。

K-S值计算公式:K-S=max(TPR-FPR)

K-S值

标签组:[auc] [阈值

上一篇怎么分析股票 k 线

下一篇从一篇新英格兰文章看懂K

相关阅读

相同话题文章

推荐内容

热门阅读