【论文笔记】ICRA2019 视觉里程计的损失函数:Beyond Photome

Loss for Self- Ego-
港科大 , 腾讯优图 , 香港珠穆朗玛峰创新科技()
本文对现有的视觉历程计方法使用的损失函数进行了总结 , 并提出了一种基于几何一致性的损失函数 。
现有里程计方法
主要分为两类:
间接法:
SLAM系统常用 , 首先计算出一些鲁棒的特征点边缘集合或者是光流信息 , 然后用滑窗或者全局BA最小化几何误差 。直接法:
VSLAM常用 , 直接优化对应像素的光度误差 。光度误差的前提是光度一致假设 , 这种做法因为受到动态目标、相机自动曝光自动白平衡以及反射表面的影响 , 鲁棒性较差 。多见于自监督学习方法中 。本文方法
先介绍下现有的损失函数:
1、光度误差(图像重建误差、合成图像误差)
图像I2中的像素点P2在I1中的投影为:
p 1 ~ K 1 [ R 12 ^ ∣ t 12 ] D 2 ^ ( p 2 ) K 2 ? 1 p 2 p_{1} \sim K_{1}\left[\hat{R_{12}} \mid t_{12}\right] \{D_{2}}\left(p_{2}\right) K_{2}^{-1} p_{2} p1?~K1?[R12?^?∣t12?]D2??(p2?)K2?1?p2?
其中K为相机内参 , D为所预测的深度图 , R t为预测的两帧之间的相对位姿 。
讲投影的I1与I1相减得到合成图像损失:
L i m g = ( 1 ? α ) ∥ I 2 ? I 2 1 ~ ∥ 1 + α 1 ? S S I M ( I 2 ? I 2 1 ~ ) 2 \{L}_{i m g}=(1-\alpha)\left\|\{I}_{2}-\{\{I}_{2}^{1}}\right\|_{1}+\alpha \frac{1-S S I M\left(\{I}_{2}-\{\{I}_{2}^{1}}\right)}{2} Limg?=(1?α)∥∥∥?I2??I21??∥∥∥?1?+α21?SSIM(I2??I21??)?
第一项为光度误差 , 第二项为结构相似性度量(从统计学角度衡量两张图像的相似性)
这个损失公式应该伴随一个平滑项来解决运动估计中的梯度局部性问题 , 并在低纹理区域消除所获得深度的不连续性
因此有一项平滑损失:
图 像 的 平 滑 区 域 对 深 度 图 损 失 值 的 影 响 更 大 L= ∑ p ∣ ? D ( p ) ∣ T ? e ? ∣ ? I ( p ) ∣ 图像的平滑区域对深度图损失值的影响更大 \{L}_{\text {}}=\sum_{p}|\nabla D(p)|^{T} \cdot e^{-|\nabla I(p)|} 图像的平滑区域对深度图损失值的影响更大?=p∑?∣?D(p)∣T?e?∣?I(p)∣
主要用于约束深度图的预测 。
2、基于对极几何的几何误差
这是本文提出的损失函数 。
对于两幅图像中的匹配点对 , 满足对极几何约束:
q i T F 12 p i = ( K 2 ? 1 q i ′ ) T R 12 [ t 12 ] × ( K 1 ? 1 p i ′ ) = 0 q_{i}^{T} F_{12} p_{i}=\left(K_{2}^{-1} q_{i}^{\prime}\right)^{T} R_{12}\left[t_{12}\right]_{\times}\left(K_{1}^{-1} p_{i}^{\prime}\right)=0 qiT?F12?pi?=(K2?1?qi′?)TR12?[t12?]×?(K1?1?pi′?)=0
“F12 is the,p′i and q′itheof the i-th, and K1 and K2 are their.”
其中 ,  l 12 ( i ) = F 12 p i l_{12}^{(i)}=F_{12} p_{i} l12(i)?=F12?pi?定义了qi所在极线的方程 , 因此可以用qi到这条极线之间的距离来构建损失:
L g e o = ∑ i dist ? ( l 12 ( i ) , q i ) dist ? ( a x + b y + c = 0 , ( x 0 , y 0 ) ) = ∣ a x 0 + b y 0 + c ∣ a 2 + b 2 \{L}_{g e o}=\sum_{i} \{dist}\left(l_{12}^{(i)}, q_{i}\right) \\ \{dist}\left(a x+b y+c=0,\left(x_{0}, y_{0}\right)\right)=\frac{\left|a x_{0}+b y_{0}+c\right|}{\sqrt{a^{2}+b^{2}}} Lgeo?=i∑?dist(l12(i)?,qi?)dist(ax+by+c=0,(x0?,y0?))=a2+b2?∣ax0?+by0?+c∣?
3、弱几何监督

【论文笔记】ICRA2019 视觉里程计的损失函数:Beyond Photome

文章插图
使用位姿真值构建损失的方法 , 主要有直接法和间接法两种:
4、光度损失的补偿
由于动态目标、光度变化等因素 , 直接使用光度损失误差较大 , 需要一个mask来决定那些区域的像素是可靠的 。本文使用一种简单的方法来动态生成mask:定义一个光度误差阈值 , 光度误差超过该阈值的则认为是动态区域 , 不计入损失函数 。