19、决策理论与模型选择详解

最新推荐文章于 2025-07-23 10:13:45 发布

原创最新推荐文章于 2025-07-23 10:13:45 发布 · 77 阅读

0 GEO检测

标签

#决策理论 # 模型选择 # PR曲线

收录于

概率机器学习入门精要专栏收录该内容

83 篇文章 ¥499.90

订阅专栏¥69.90

会员秒杀 ¥9.9 重磅福利

超级会员免费看

决策理论与模型选择详解

1. PR曲线与F分数

1.1 PR曲线

精度（Precision）可以表示为：
[Prec = \frac{TP}{TP + FP} = \frac{P \cdot TPR}{P \cdot TPR + N \cdot FPR} = \frac{TPR}{TPR + \frac{1}{r}FPR}]
当(\pi \to 1)且(r \to \infty)时，(Prec \to 1)；当(\pi \to 0)且(r \to 0)时，(Prec \to 0)。例如，从平衡问题（(r = 0.5)）转变为不平衡问题（(r = 0.1)，正样本更罕见）时，每个阈值下的精度会下降，而召回率（即TPR）保持不变，因此整体的PR曲线会下移。所以，当处理具有不同患病率的多个二分类问题时，在平均精度时需要谨慎。

1.2 F分数

F分数也受类别不平衡的影响，可重写为：
[\frac{1}{F_{\beta}} = \frac{1}{1 + \beta^2} \frac{1}{P} + \frac{\beta^2}{1 + \beta^2} \frac{1}{R}]
[ = \frac{1}{1 + \beta^2} \frac{TPR + \frac{N}{P}FPR}{TPR} + \frac{\beta^2}{1 + \beta^2} \frac{1}{TPR}]
[F_{\beta} = \frac{(1 + \beta^2)TPR}{TPR + \frac{1}{r}FPR + \beta^2}]