纵向联邦学习原理之Logistic Regression
纵向联邦学习(LR)
在线性回归 y = w x y = wx y=wx 基础上要求
- y = 1 y = 1 y=1 的概率随 w x wx wx 增加而增加
- 当 w x wx wx 的值是 0 0 0 时, y = 1 y = 1 y=1 的概率是 0.5 0.5 0.5
逻辑函数满足上述性质
1 1 + e − z \frac{1}{1 + e^{-z}} 1+e−z1
代入 z = w x z = wx z=wx
y = 1 1 + e − w x y = \frac{1}{1 + e^{-wx}} y=1+e−wx1
y = 1 y = 1 y=1 的概率
P ( y = 1 ∣ x ) = 1 1 + e − w x \mathbb{P}(y=1|x) = \frac{1}{1 + e^{-wx}} P(y=1∣x)=1+e−wx1
y = − 1 y = -1 y=−1 的概率
P ( y = − 1 ∣ x ) = 1 − P ( y = 1 ∣ x ) = e − w x 1 + e − w x = 1 1 + e w x \mathbb{P}(y=-1|x) = 1 - \mathbb{P}(y=1|x) = \frac{e^{-wx}}{1 + e^{-wx}} = \frac{1}{1 + e^{wx}} P(y=−1∣x)=1−P(y=1∣x)=1+e−wxe−wx=1+ewx1
把二者统一起来
P ( y ∣ x ) = 1 1 + e − y w x \mathbb{P}(y|x) = \frac{1}{1 + e^{-ywx}} P(y∣x)=1+e−ywx1
代入最大似然函数
L ( w ) = ∏ i = 1 n P ( y ∣ x ) L(w) = \prod \limits_{i=1}^{n}\mathbb{P}(y|x) L(w)=i=1∏nP(y∣x)
由于 0 < P ( y ∣ x ) < 1 0 < \mathbb{P}(y|x) < 1 0<P(y∣x)<1,因此在理想情况下(对所有训练样本都能够输出接近 1的概率), L ( w ) L(w) L(w) 最大值会无限接近 1,因此模型训练目的是求满足条件的 w w w 使得该似然函数尽量接近 1,为方便计算,两边取对数,不影响单调性
ln L ( w ) = ∑ i = 1 n ln P ( y ∣ x ) = ∑ i = 1 n ln 1 1 + e − y w x = − ∑ i = 1 n ln ( 1 + e − y w x ) \begin{aligned} \ln L(w) &= \sum_{i=1}^{n}{\ln \mathbb{P}(y|x)} \\ &= \sum_{i=1}^{n}{\ln \frac{1}{1 + e^{-ywx}}} \\ &= -\sum_{i=1}^{n}{\ln {(1 +e^{-ywx})}} \end{aligned} lnL(w)=i=1∑nlnP(y∣x)=i=1∑nln1+e−ywx1=−i=1∑nln(1+e−ywx)
要想使得 ln L ( w ) \ln L(w) lnL(w) 最大,也就是 − ln L ( w ) -\ln L(w) −lnL(w) 最小, − ln L ( w ) -\ln L(w) −lnL(w) 描述了 模型与真实数据的误差
L o s s = − ln L ( w ) = ∑ i = 1 n ln ( 1 + e − y w x ) Loss = -\ln L(w) = \sum_{i=1}^{n}{\ln {(1 +e^{-ywx})}} Loss=−lnL(w)=

本文详细介绍了纵向联邦学习在逻辑回归中的应用,通过最大似然函数构建损失函数,并讨论了模型训练过程,包括梯度计算、优化器的应用以及训练停止条件。同时,解释了在不同参与者之间的数据交互和安全计算策略。
3356

被折叠的 条评论
为什么被折叠?



