二元交叉熵损失梯度推导

原创于 2018-12-01 15:28:20 发布 · 1.1w 阅读

·

12

·

本内容遵循CC 4.0 BY-SA版权协议

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

收录于

AI

Python3.8

Python 是一种高级、解释型、通用的编程语言，以其简洁易读的语法而闻名，适用于广泛的应用，包括Web开发、数据分析、人工智能和自动化脚本

二元交叉熵损失（logistic 损失）定义如下：
$Llogistic(y^,y)=−ylogy^−(1−y)log(1−y^) L_{\text{logistic}}(\hat{y},y) =-ylog\hat{y}-(1-y)log(1-\hat{y})$
其中
$y∈{0,1}y\in\{0,1\}$ , $y^=σ(yˉ)\hat{y}=\sigma(\bar{y})$ , $σ(yˉ)=11+e−yˉ\sigma(\bar{y})=\dfrac{1}{1+e^{-\bar{y}}}$ , $∂σ∂yˉ=σ(1−σ)\dfrac{\partial \sigma}{\partial \bar{y}}=\sigma(1-\sigma)$ ，
$yˉ=w⋅x+b=∑jwjxj+b\bar{y}=\bold{w}\cdot \bold{x} + b =\displaystyle\sum_jw_jx_j+b$ , $∂yˉ∂wj=xj\dfrac{\partial \bar{y}}{\partial w_j}=x_j$
样本 $x=(x1,⋯ ,xj,⋯ ,xn)\bold{x}=(x_1,\cdots,x_j,\cdots,x_n)$ 共包含n个特征，权重向量 $w=(w1,⋯ ,wj,⋯ ,wn)\bold{w}=(w_1,\cdots,w_j,\cdots,w_n)$ 共包含n个权重，与特征一一对应，则
$\begin{aligned} \dfrac{\partial L}{\partial w_j} &= -y \dfrac{1}{\sigma}\dfrac{\partial \sigma}{\partial \bar{y}}\dfrac{\partial \bar{y}}{\partial w_j} -(1-y)\dfrac{-1}{1-\sigma}\dfrac{\partial \sigma}{\partial \bar{y}}\dfrac{\partial \bar{y}}{\partial w_j} \\ &=\dfrac{\sigma - y}{\sigma(1-\sigma)}\dfrac{\partial \sigma}{\partial \bar{y}}\dfrac{\partial \bar{y}}{\partial w_j} \\ &=\dfrac{\sigma - y}{\sigma(1-\sigma)}\sigma(1-\sigma)x_j \\ &=(\sigma -y)x_j \\ &=[\sigma(\bold{w}\cdot \bold{x} + b)-y]x_j \end{aligned}$

您可能感兴趣的与本文相关的镜像

Python3.8

Python3.8

Conda

Python

Python 是一种高级、解释型、通用的编程语言，以其简洁易读的语法而闻名，适用于广泛的应用，包括Web开发、数据分析、人工智能和自动化脚本

标签

#交叉熵 #损失函数 #梯度推导 #机器学习 #人工智能

博客等级

码龄8年

120
原创

123
点赞

219
收藏

477
粉丝

关注

私信

TA的精选

新 The Bitter Lesson 苦涩的教训
41 阅读
新 [2021] [RMA] [RMA: Rapid Motor Adaptation for Legged Robots]
68 阅读
热 Python根据字典的值查询出对应的键
36132 阅读
热人类历史上第一个推荐系统
8220 阅读
热使用NLTK将自然语言查询转化为SQL查询
6678 阅读

TA的历史创作历程

分类专栏

一起来学强化学习付费 19篇
NLP Papers 付费 54篇
AI Platform 付费 5篇
Deep Learning 3篇
Recommender Systems 2篇
Jax
PyTorch 1篇
TensorFlow 2篇
Spark 2篇
信号处理 1篇
Recommend
NLP 60篇
笔记
AI 71篇
Python 2篇
Development Tools 3篇
Big Data 3篇
Cloud 8篇
Tools 3篇
IR 2篇
Windows 2篇
Algorithm 6篇
ML 5篇

展开全部收起

上一篇：: Minimum Edit Distance 算法原理及实现

下一篇：: Softmax求导及多元交叉熵损失梯度推导

官方同款运行环境

Python3.8

Python 是一种高级、解释型、通用的编程语言，以其简洁易读的语法而闻名，适用于广泛的应用，包括Web开发、数据分析、人工智能和自动化脚本

Conda

Python

显存大小

24GB

CPU

10核心

内存

120GB

系统盘/数据盘

40GB

无需本地环境部署，可直接运行

· AI 阅读助手

目录

展开全部

收起

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。