CV目标检测学习打卡04

最新推荐文章于 2026-03-20 13:59:42 发布

原创最新推荐文章于 2026-03-20 13:59:42 发布 · 386 阅读

0 ·

本内容遵循CC 4.0 BY-SA版权协议

本文介绍了目标检测的学习过程，包括模型训练的关键参数设置，如batch_size和学习率策略，以及NMS非极大值抑制算法在后处理中的应用。同时，探讨了VOC数据集的评价指标，如精度、召回率和F1 Score，帮助理解模型性能。

学习教程链接：http://datawhale.club/t/topic/499
感谢各位助教，编写了十分完整，有条理的教程，感谢队长。

3.6.1 模型训练
1.在训练过程中设定的batch_size一定要与电脑状况相适应，一般设定为32，64高配置才能跑动，跑不动时电脑会报错。
2.设定降低学习率一般为总epoch的80%，开始衰减，每次递减一般为0.1
3.训练时，使用默认的先验框大小，效果最好，自己调整过先验框大小，反而会降低准确度。

3.6.2 后处理
1.NMS非极大值抑制算法（许多两步式算法使用）
实际的处理方式，简单来说即是设定IOU阈值，筛选除去小于阈值的框。
2.代码实现
借鉴faster-rcnn的代码，与前面我们计算IOU的部分，代码有重合部分，先使用（x1,y1,x2,y2）四点代入框的位置，利用maximum及minimum函数算出相应的IOU，与阈值进行比较，留下最终的验证框。

3.6.4 VOC数据集评测

map指标
1.样本的分类为4类TP,TN,FP,FN——一级指标
1）真实值是positive，模型认为是positive的数量（True Positive=TP）
2）真实值是positive，模型认为是negative的数量（False Negative = FN）：这就是统计学上的第二类
错误（Type II Error）
3）真实值是negative，模型认为是positive的数量（False Positive = FP）：这就是统计学上的第一类错
误（Type I Error）
4）真实值是negative，模型认为是negative的数量（True Negative = TN）

2.混淆矩阵（confusion matrix）又称可能性表格或错误矩阵，统计了各类的个数。
二级指标：
1）准确率（Accuracy）-----针对整个模型
2）精确率（Precision）
3）灵敏度（Sensitivity）：就是召回率（Recall）
4）特异度（Specificity）
在这里插入图片描述

3.三级指标
①F1 Score = 2PR / P+R
F1-Score指标综合了Precision与Recall的产出的结果。F1-Score的取值范围从0到1,1代表模型的输出最好，0代表模型的输出结果最差。

②P-R曲线的总体趋势是，精度越高，召回越低，当召回到达1时，对应概率分数最低的正样本，这个时候正样本数量除以所有大于等于该阈值的样本数量就是最低的精度值。另外，P-R曲线围起来的面积就是AP值，通常来说一个越好的分类器，AP值越高。
P-R曲线中，P与R的值都不应降为0，若是降为0时，模型训练出现了问题。