10、神经网络中的对比学习、受限玻尔兹曼机与自由能原理

原创于 2025-08-17 15:21:00 发布 · 63 阅读

0 GEO检测

收录于

当前文章被以下社区和专栏收录：

梯度与期望：预测的神经之源专栏收录该内容

24 篇文章 ¥499.90

订阅专栏¥69.90

会员秒杀 ¥9.9 重磅福利

超级会员免费看

神经网络中的对比学习、受限玻尔兹曼机与自由能原理

1. 对比赫布学习（CHL）

对比赫布学习的核心在于通过比较不同系统状态下的参数来更新网络权重。通过对比方程 4.18 和 4.21 可得：
[
\frac{\partial D_{KL}(Q_0^D \parallel Q_g^D)}{\partial w_{jk}} = - \frac{\partial \langle \ln(p_g(s_d)) \rangle_{d \in D}}{\partial w_{jk}}
]
无论是最大化对数似然（(\Delta w_{jk} = \lambda \delta)）还是最小化 KL 散度（(\Delta w_{jk} = - \lambda (- \delta))），权重修改规则是相同的：
[
\Delta w_{jk} = \lambda \delta = \lambda \left( \langle x_j^{(d)} x_k^{(d)} \rangle_{d \in D} - \langle x_j^{(a)} x_k^{(a)} \rangle_{a \in S} \right)
]
在实际神经网络操作中，使用小批量数据 (D’) 和部分状态 (S’)，权重更新规则变为：
[
\Delta w_{jk} = \lambda \left( \langle x_j^{(d)} x_k^{(d)} \rangle_{d \in D’} - \langle x_j^{(a)} x_k^{(a)} \rangle_{a \in S’} \right)
]
这个规则构成了对比赫布学习（CHL）的基础，权重更新