适合初学者的神经网络 实战 理论 实践(6)
[易懂]如何理解论文中的那些评估方法性能指标概念名词{召回率 ROC AUC 交叉验证}
首发于:知乎专栏《适合初学者的机器学习神经网络理论到实践》
假设现在我们论文是要识别垃圾邮件。将邮件分类为垃圾邮件和非垃圾邮件。
好了接下来通过垃圾邮件这个例子说明别人论文中常常出现的评估方法性能的概念名字是什么意思。
假如我输入了5个数据到模型,那么模型会有相应5个分类结果出来。
邮件编号 模型分类结果 实际标签
邮件1 垃圾邮件 垃圾邮件
邮件2 非垃圾邮件 垃圾邮件
邮件3 垃圾邮件 非垃圾邮件
邮件4 垃圾邮件 垃圾邮件
邮件4 非垃圾邮件 非垃圾邮件
TP FP TN FN
这个四个词都是表示的是数字,四种情况下的样本数目。比如True Positive (TP)表示邮件分类正确了,并且模型判断它是垃圾邮件(Positive)样本的个数。统计这些数目就可以统计准确率和召回率这些比率。一定要先理解这个再看后面的准确率和召回率。
这四个词每个词都是两个单词的首字母缩写而成。其中第一个字母{T代表True、F代表False},这个是表明是分类对了还是分类错了。第二个字母{P代表Positive、N代表Negative},这个代表模型它输出结果是什么。
在当前案例中标签“垃圾邮件”=“Positive”,“非垃圾邮件”=“Negative”。
邮件编号 模型分类结果 实际标签

这篇博客适合初学者,通过垃圾邮件识别的例子解释了机器学习中评估模型性能的指标,如召回率、ROC曲线、AUC以及交叉验证的概念。召回率关注正确分类正例的比例,精度则关注模型预测为正例的正确率。ROC曲线和AUC用于衡量模型的辨别能力,AUC值越大表示模型准确性越高。交叉验证帮助我们评估不同阈值设置下的模型性能。
2万+

被折叠的 条评论
为什么被折叠?



