发表自话题:k曲线怎么看
大家都知道AUC是ROC下方的面积,ROC是什么?ROC怎么画呢?
首先看一张图:
TP、FN、FP、TN如图:
如何计算画ROC曲线,我们将所有所有数据按照预测概率有小到大排列:
TRR =
(
T
P
T
P
+
F
N
)
\left(\frac{TP}{TP+FN}\right)
(TP+FNTP) 又称真正率
FPR =
(
F
P
F
P
+
T
N
)
\left(\frac{FP}{FP+TN}\right)
(FP+TNFP) 又称负正率或假正率
ROC曲线的横轴为FPR,纵轴为TPR。
我们设置阈值为0.1 ,小于等于0.1的判定为假,label为0, 大于0.1判断为真,label为1。可以计算此时的TPR和FPR;同理接下来设置阈值为0.35、0.4、0.8,分别求出TPR和FPR,在图中画出,再和(0,0)(1,1)相连,则画出ROC曲线。
我们先建立坐标系,纵轴为真正率,横轴为负正率,恒过(0,0)和(1,1),为什么?
在ROC曲线图时,在不同阈值下,TPR和FPR是不一样的。
当阈值为0时,则代表将所有数据判断为正样本,则没有数据被判断为负样本,则:FN和TN为0,故TPR=FPR=1,过(1,1)点;同理,当阈值为1时,我们把所有数据判断为负,则:TP和FP为0,那么TPR=FPR=0,过(0,0)点。AUC则为ROC下方面积,AUC的物理意义和计算公式接下来讲解。
AUC这个指标想表达的含义,简单来说其实就是随机抽出一对样本(一个正样本,一个负样本),然后用训练得到的分类器来对这两个样本进行预测,预测得到正样本的概率大于负样本概率的概率。
AUC=P(P正>P负)
参考:https://blog.csdn.net/qq_22238533/article/details/78666436
共两种形式,其中注意第二种如下:
如何去理解呢?
参考:https://blog.csdn.net/lmm6895071/article/details/102511017#1_AUC__3
从小到大排序后,第一个正样本的位置(序号,序号从0开始),就是其比负样本得分大的个数;对于第二个正样本,前面有已经1个正样本了,所以负样本个数为位置减去1,同理,第三个正样本前面的负样本个数为位置减去2,……,对于第M个正样本,匹配的负样本个数为位置序号减去M-1。 故而,分子就变成 所有正样本的位置序号和,减去(0+1+2+……+M-1)=sum()-M*(M-1)/2. 若序号从1开始,则,=sum()-M -(0+1+2+……+M-1)=sum()-M(M+1)/2.
K-S(Kolmogorov-Smirnov)中文名洛伦兹曲线,KS值的取值范围是[0,1] 。
K-S(Kolmogorov-Smirnov):KS用于模型风险区分能力进行评估, 指标衡量的是好坏样本累计分部之间的差值。
好坏样本累计差异越大,KS指标越大,那么模型的风险区分能力越强。
KS曲线是两条线,其横轴是阈值,纵轴是TPR(上面那条)与FPR(下面那条)的值,值范围[0,1] 。两条曲线之间之间相距最远的地方对应的阈值,就是最能划分模型的阈值即K-S值。
K-S曲线的纵轴是表示TPR和FPR的值,就是这两个值可以同时在一个纵轴上体现,横轴就是阈值。
K-S值计算公式:K-S=max(TPR-FPR)
K-S值
上一篇:怎么分析股票 k 线
下一篇:从一篇新英格兰文章看懂K
2021-04-25
2021-06-04
2021-04-26
2021-05-25
2021-06-04
2021-06-04
上财的会计专硕学费为什么那么高,值么;另外上财有针对专硕的奖学金么?
2021-04-26
2021-05-25
2021-04-26
2021-04-26