概率机器人学习记录1：贝叶斯定律

原创已于 2024-04-16 17:10:19 修改 · 890 阅读

21 ·

本内容遵循CC 4.0 BY-SA版权协议

标签

#概率论 #机器人 #概率机器人

于 2024-04-08 18:01:41 首次发布

概率机器人学习笔记专栏收录该内容

3 篇文章

订阅专栏

1 贝叶斯定律

是机器人中应用概率最常见的一个定律，所以先把这个搞透。
在这里插入图片描述

在这里插入图片描述

【个人理解】：希望由传感器的测量值y作为已知，推导得到各个x的概率，概率最大的就最可能，于是由y->x。
但前提是：先知道确定的每个x时，测量值y应该是多少。

在这里插入图片描述

2 贝叶斯滤波

在这里插入图片描述
理解：以导航为例，

$x_{t-1}$ 是前一计算时刻的位置，实际位置周边各个位置都有一定的可能性，其分布为 $bel(x_{t-1})$
根据odom信息可以估算出当前位置当前各个位置的可能性： $\overline{bel}(x_{t})$ 。
再用贝叶斯定律，得到当前测量 $z_{t}$ 下的各个位置的可能性 $bel(x_{t})$ 。其中 $p\left \{ z_{t} | x_{t} \right \}$ 是在 $x_{t}$ 位置获得该测量的概率，比如在该位置看到的地图与扫描的地图一致的概率。
如果还不好理解，书中机器人开门的例子比较简单，可以参考。

【链接】狄氏分布

作业：

1

在这里插入图片描述

在这个问题中，我们有一个可以测量0-3m距离的传感器，但传感器可能会故障。
当传感器正常工作时，测量值在0-3m之间均匀分布；当传感器故障时，无论实际距离是多少，输出值都小于1m。
我们知道传感器故障的先验概率是0.01。现在，我们要计算当机器人连续查询传感器N次，每次测量值都小于1m时，传感器故障的后验概率。

假设：
P(F) 是传感器故障的先验概率，P(F) = 0.01
P(N) 是传感器正常的先验概率，P(N) = 1 - P(F) = 0.99
P(M<1|F) 是传感器故障时测量值小于1m的概率，P(M<1|F) = 1（因为故障时总是小于1m）
P(M<1|N) 是传感器正常时测量值小于1m的概率，P(M<1|N) = 1/3（因为0-3m均匀分布，小于1m的概率是1/3）

现在我们要来计算这个后验概率。
对于N=1到10，传感器故障的后验概率分别为：
N=1: 0.0294117647058824
N=2: 0.0833333333333333
N=3: 0.214285714285714
N=4: 0.45
N=5: 0.710526315789474
N=6: 0.880434782608696
N=7: 0.956692913385827
N=8: 0.985135135135135
N=9: 0.994995450409463
N=10: 0.998326232501522

这些后验概率表示了当机器人连续查询传感器N次，每次测量值都小于1m时，传感器故障的可能性。随着查询次数的增加，后验概率迅速上升，表明连续多次的测量结果都小于1m时，传感器故障的可能性变得越来越大。

上面的公式是根据贝叶斯定理推导出来的。
贝叶斯定理是一个描述条件概率之间关系的定理，它允许我们根据新的信息更新某个事件发生的概率。
在这个问题中，我们要更新的是传感器故障的概率，根据连续多次测量值都小于1m这一新的信息。

贝叶斯定理的一般形式是：
$\frac{P(B|A) \times P(A)}{P(B)}$
其中， $P (A ∣ B)$ 是在事件B发生的条件下事件A发生的概率， $P (B ∣ A)$ 是在事件A发生的条件下事件B发生的概率， $P (A)$ 和 $P (B)$ 分别是事件A和事件B发生的概率。

在这个具体问题中，我们有以下事件：
A：传感器故障（F）
B：测量值小于1m（M<1）

我们要求的是 $P(A|B^N)$ ，即在连续N次测量值都小于1m的条件下，传感器故障的概率。

根据贝叶斯定理，我们有：
$P(A|B^N) = \frac{P(B^N|A) \times P(A)}{P(B^N)}$

其中， $P(B^N|A)$ 是在传感器故障的条件下，连续N次测量值都小于1m的概率。
由于每次测量是独立的，所以 $P(B^N|A) = P(B|A)^N = 1^N = 1$ （因为当传感器故障时，每次测量值都小于1m的概率是1）。

$P (A)$ 是传感器故障的先验概率，已知为0.01。

$P(B^N)$ 是在连续N次测量值都小于1m的总概率，它可以分解为两种情况的概率之和：传感器故障且连续N次测量值都小于1m的概率，加上传感器正常但连续N次测量值都小于1m的概率。
即：
$P(B^N) = P(B^N|A) \times P(A) + P(B^N|N) \times P(N)$
其中， $P(B^N|N)$ 是在传感器正常的条件下，连续N次测量值都小于1m的概率，由于每次测量是独立的且测量值小于1m的概率是1/3，所以 $P(B^N|N) = (1/3)^N$ 。
$P (N)$ 是传感器正常的先验概率，已知为0.99。

将上述所有值代入贝叶斯定理的公式中，即可得到：
$P(A|B^N) = \frac{1 \times 0.01}{1 \times 0.01 + (1/3)^N \times 0.99}$

这就是上面给出的公式。它允许我们根据连续N次测量值都小于1m这一新的信息，来更新传感器故障的后验概率。

4

在这里插入图片描述

( a ) 先验 $p (x)$ 和测量 $p (z ∣ x)$ 的概率密度函数：

先验 $p (x)$ 是一个高斯分布，其均值是 $x_{\text{init}} = 1000m$ ，方差是 $\sigma_{x}^2 = 900m^2$ 。因此，其概率密度函数为：

$\frac{1}{\sqrt{2\pi\sigma_{x}^2}} \exp\left(-\frac{(x - x_{\text{init}})^2}{2\sigma_{x}^2}\right)$

测量 $p (z ∣ x)$ 也是一个高斯分布，其均值是 $x$ （因为 GPS 测量的是位置 $x$ ），方差是 $\sigma_{z}^2 = 100m^2$ 。因此，其概率密度函数为：

$\frac{1}{\sqrt{2\pi\sigma_{z}^2}} \exp\left(-\frac{(z - x)^2}{2\sigma_{z}^2}\right)$

( b ) 使用贝叶斯准则计算后验 $p (x ∣ z)$ ：

贝叶斯准则告诉我们：

$\frac{p(z|x)p(x)}{p(z)}$

其中 $p (z)$ 是归一化常数，可以通过对 $p (z ∣ x) p (x)$ 关于 $x$ 的积分得到。由于我们关心的是 $p (x ∣ z)$ 的形状而不是其确切值，我们可以忽略这个归一化常数。

将先验和测量的概率密度函数代入贝叶斯准则中，我们得到：

$\propto p(z|x)p(x)$
$\propto \exp\left(-\frac{(z - x)^2}{2\sigma_{z}^2}\right) \exp\left(-\frac{(x - x_{\text{init}})^2}{2\sigma_{x}^2}\right)$
$\propto \exp\left(-\frac{1}{2}\left(\frac{(z - x)^2}{\sigma_{z}^2} + \frac{(x - x_{\text{init}})^2}{\sigma_{x}^2}\right)\right)$

这是一个高斯分布的指数部分，因此 $p (x ∣ z)$ 也是一个高斯分布。为了找到其均值和方差，我们需要通过完成平方的方法，将先验和测量的指数部分合并成一个新的二次函数。这样，我们就可以确定后验分布是一个高斯分布，并找到它的参数

( c ) 测量 $X_{\text{GPS}} = 1100m$ 如何得出先验和 GPS 接收器的误差概率信息：

测量值 $X_{\text{GPS}} = 1100m$ 是 GPS 接收器给出的位置估计。这个测量值本身并不直接给出先验或误差概率信息；它只是一个数据点。先验 $p (x)$ 是我们对位置 $x$ 的初始信念，而误差概率信息（即方差 $\sigma_{z}^2$ ）是 GPS 接收器提供的关于其测量准确性的度量。

当我们使用贝叶斯准则结合先验和测量时，我们实际上是在利用这两个信息源来更新我们对位置 $x$ 的信念。先验告诉我们 $x$ 可能在哪里（以 $x_{\text{init}}$ 和 $\sigma_{x}^2$ 的形式），而测量告诉我们 GPS 接收器认为 $x$ 在哪里（以 $X_{\text{GPS}}$ 和 $\sigma_{z}^2$ 的形式）。通过结合这两个信息源，我们可以得到一个更精确的位置估计（即后验 $p (x ∣ z)$ ）。