MVG读书笔记——单应矩阵估计这件小事(一)

本文详细介绍了在计算机视觉中,如何通过DLT算法和四点法来估计单应矩阵H的参数,包括数学推导和求解过程,以及在多于四点情况下的最小二乘解。

参数估计是计算机视觉中经常遇到的一个问题,为较好的估计参数,人们发明了各种各样的算法。这里我们就以单应矩阵H的估计为例,一个个介绍这些常用算法。

DLT算法

DLT(direct linear transform)算法是一个用于解决包含尺度的最小二乘问题的算法。可以解决的问题包括相机内参估计、单应矩阵估计、基础矩阵估计等。

以单应矩阵H的估算为例。由于H为3×33\times33×3的矩阵,除去尺度的影响之后有8个自由度。需要4对对应点来求解。假设某一对对应点xi,xi′\textbf x_i,\textbf x_i'xi,xi,则
xi′=Hxi=[h1Txih2Txih3Txi]\textbf x_i'=H\textbf x_i=\begin{bmatrix}h^{1T}\textbf x_i\\h^{2T}\textbf x_i\\h^{3T}\textbf x_i\end{bmatrix}xi=Hxi=h1Txih2Txih3Txi
其中hjTh^{jT}hjT代表H的第j行。

假设xi′=(xi′,yi′,wi′)T\textbf x_i'=(x_i',y_i',w_i')^Txi=(xi,yi,wi)T。对等式叉乘一个xi′\textbf x_i'xi我们得到

xi′×Hxi=[yi′h3Txi−wi′h2Txiwi′h1Txi−xi′h3Txixi′h2Txi−yi′h1Txi]=0\textbf x'_i \times H\textbf x_i = \begin{bmatrix}y_i'h^{3T}\textbf x_i-w'_ih^{2T}\textbf x_i\\w'_ih^{1T}\textbf x_i-x'_ih^{3T}\textbf x_i \\x'_ih_{2T}\textbf x_i-y_i'h^{1T}\textbf x_i\end{bmatrix} = 0xi×Hxi=yih3Txiwih2Txiwih1Txixih3Txixih2Txiyih1Txi=0

(1)[0T−wi′xiTyi′xiT wi′xiT0T−xi′xiT −yi′xiTxi′xiT0T][h1h2h3]=0\begin{bmatrix}0^T&-w'_i\textbf x^T_i&y_i'\textbf x^T_i \\\ w'_i\textbf x_i^T&0^T&-x'_i\textbf x_i^T \\\ -y'_i\textbf x_i^T&x'_i\textbf x^T_i&0^T\end{bmatrix} \begin{bmatrix}\textbf h^1 \\ \textbf h^2 \\ \textbf h^3\end{bmatrix} =0\tag{1}0T wixiT yixiTwixiT0TxixiTyixiTxixiT0Th1h2h3=0(1)
可以记为Aih=0A_ih=0Aih=0。其中A是一个3×93\times93×9的矩阵,h是一个9维向量,它的元素对应H中的元素。即
h=[h1h2h3],H=[h1Th2Th3T]h=\begin{bmatrix}h^1\\h^2\\h^3\end{bmatrix},H=\begin{bmatrix}h^{1T}\\h^{2T}\\h^{3T}\end{bmatrix}h=h1h2h3,H=h1Th2Th3T

可以看到,Aih=0A_ih=0Aih=0是一个关于h的线性方程,AiA_iAi可以由对应点坐标得到。同时A的第三行其实可以由前两行线性表出。由此每对点实际上是给出了H的两个约束。简化A可以得到一个2×92\times 92×9的矩阵。

四点法

取四对点,将它们的线性方程系数矩阵进行叠加我们就得到了一个8×98\times 98×9(去除线性相关的行)或者12×912\times 912×9的矩阵,不论如何这个矩阵的秩都为8。于是我们可以从线性方程Aih=0A_ih=0Aih=0的一维零空间中得到h。这样的h有无穷多,彼此相差一个尺度,一般为求得唯一的解我们假设∣∣h∣∣=1||h||=1h=1

这种解法也称为最小解,因为它使用的点数最少。
###多于四点的情况
当两幅图像中的对应点大于4对时,由于噪声的存在,矩阵A的秩为9,得到的线性方程只有零解。我们称这种方程为超定方程,此时可以求它的最小二乘解。即min∣∣Ah∣∣min||Ah||minAh。对它的求解同样可以使用SVD分解。这将在后面进一步进行介绍。

退化

在使用四点法时,如果其中3点共线,就会发生退化。(很容易理解,3点共线=一点可以由其他两点线性表出=缺秩)从而得到无穷多解。这种在多于4点的情况也可能发生。

直线与混合情况下的求解

根据对偶原理,显然也可以根据两幅图像中的对应直线对。由li=HTli′l_i=H^Tl_i'li=HTli可以进行求解,在此不多赘述。
混合情况下,3个直线对和三个点对互相等价(三角形),从而可以转换成纯点或纯直线的求解。2个直线对、2个点对的情况,和它的对偶情况无法求解,因为这相当于5个点对,其中有4个点共线点情况。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值