熵:如果一个随机变量X的可能取值为X={x1,x2,…xn},每种取值的概率为p(xi),那么这个随机事件的发生,能够给我们带来的信息量的期望(熵)是:

信息熵其实是一个随机变量信息量的数学期望。
条件熵:在X给定条件下,Y的条件概率分布的熵 对X的数学期望:
![]()
由于是相对于X的数学期望,因此前面要乘以一个p(x)。
举个例子:有如下一个数据集,我们问,在长相(帅与不帅)的条件下,女孩嫁与不嫁(Y)的熵。




本文深入探讨了信息论中的核心概念——信息熵与条件熵。详细解释了信息熵作为随机变量信息量的数学期望,以及条件熵在给定条件下对随机事件信息量的衡量。通过实例说明了在特定条件下的熵计算。
熵:如果一个随机变量X的可能取值为X={x1,x2,…xn},每种取值的概率为p(xi),那么这个随机事件的发生,能够给我们带来的信息量的期望(熵)是:

信息熵其实是一个随机变量信息量的数学期望。
条件熵:在X给定条件下,Y的条件概率分布的熵 对X的数学期望:
![]()
由于是相对于X的数学期望,因此前面要乘以一个p(x)。
举个例子:有如下一个数据集,我们问,在长相(帅与不帅)的条件下,女孩嫁与不嫁(Y)的熵。




1万+
3万+
2444
7648
3231
5732

被折叠的 条评论
为什么被折叠?