边缘概率与条件概率

本文介绍了概率论中的基本概念——边缘概率和条件概率。边缘概率是指在联合概率分布中,忽略其中一个变量的概率。对于连续型变量,通过积分求得。条件概率则是在已知某一事件发生的前提下,另一事件发生的概率。链式法则揭示了多维随机变量的联合概率可以通过条件概率乘积来表示。此外,还讨论了随机变量的独立性和条件独立性的概念及数学表示。

1、边缘概率

P(x,y)P(x, y)P(x,y)的每个值被写在由每行表示不同的xxx值,每列表示不同的yyy值形成的网格中时,对网格中的每行求和是很自然的事情,然后将求和的结果P(x)P(x)P(x)写在每行右边的纸的边缘处。

对于连续型变量,我们需要用积分替代求和:

p(x)=∫p(x,y)dy. p(x) = \int p(x, y)dy. p(x)=p(x,y)dy.

2、条件概率

在很多情况下,我们感兴趣的是某个事件,在给定其他事件发生时出现的概率。这种概率叫做条件概率。
我们将给定x=x\rm x = \it xx=x 时,y=y\rm y = \it yy=y发生的条件概率记为P(y=y∣x=x)P(\rm y= \it y | \rm x=\it x)P(y=yx=x)
这个条件概率可以通过下面的公式计算:
P(y=y∣x=x)=P(y=y,x=x)P(x=x) P(\rm y= \it y | \rm x=\it x) = \frac {P(\rm y= \it y , \rm x=\it x)}{P(\rm x = \it x)} P(y=yx=x)=P(x=x)P(y=y,x=x)
条件概率只在P(x=x)>0P(\rm x \it = x)>0P(x=x)>0时有定义。
我们不能计算给定在永远不会发生的事件上的条件概率。

2.1 条件概率的链式法则

任何多维随机变量的联合概率分布,都可以分解成只有一个变量的条件概率相乘的形式:
P(x(1),…,x(n))=P(x(1))Πi=2nP(x(i)∣x(1),…,x(i−1)) P(x^{(1)}, \ldots, x^{(n)}) = P(x^{(1)}) \Pi_{i=2}^n P(x^{(i)} \mid x^{(1)}, \ldots, x^{(i-1)}) P(x(1),,x(n))=P(x(1))Πi=2nP(x(i)x(1),,x(i1))

这个规则被称为概率的链式法则或者乘法法则。例如,使用两次定义可以得到

$$
P(a, b, c) = P(a \mid b, c) P(b, c)

P(b, c) = P(b \mid c) P©

P(a, b, c) = P(a \mid b, c) P(b \mid c) P©
$$

3、条件的独立性

两个xxxyyy,如果它们的概率分布可以表示成两个因子的乘积形式,并且一个因子只包含xxx另一个因子只包含yyy,我们就称这两个随机变量是相互独立的:

∀x∈x,y∈y,p(x=x,y=y)=p(x=x)p(y=y). \forall x \in x, y \in y, p(x = x, y = y) = p(x = x)p(y = y). xx,yy,p(x=x,y=y)=p(x=x)p(y=y).

如果关于xxxyyy的条件概率分布对于zzz的每一个值都可以写成乘积的形式,那么这两个随机变量xxxyyy在给定随机变量zzz时是条件独立的:

∀x∈x,y∈y,z∈z,p(x=x,y=y∣z=z)=p(x=x∣z=z)p(y=y∣z=z) \forall x \in x, y \in y, z \in z, p( x=x, y=y \mid z=z) = p(x = x \mid z = z) p(y = y \mid z = z) xx,yy,zz,p(x=x,y=yz=z)=p(x=xz=z)p(y=yz=z)

我们可以采用一种简化形式来表示独立性和条件独立性:x⊥yx \bot yxy表示xxxyyy相互独立,x⊥y∣zx \bot y \mid zxyz表示xxxyyy在给定zzz时条件独立。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值