声明:本文只是个人学习记录,侵权可删。论文版权与著作权等全归原作者所有,小王自觉遵守《中华人民共和国著作权法》与《伯尔尼公约》等国内外相关法律,其他个人或者组织等转载请保留此声明!!
摘要
基于抽象视觉的同步定位与建图(VSLAM)是机器人技术中一个成熟的问题.大多数VSLAM系统是基于特征的方法,但产生的稀疏地图,对进一步的导航任务的应用有限.最近,直接对图像强度进行操作的直接方法已经被引入,能够以更高的处理能力为代价重建更丰富的地图.
在本研究中,提出了一种基于边缘的单目SLAM系统(SE-SLAM):边缘作为点特征具有良好的定位,同时实现了半稠密地图重建.然而,边缘不容易随着时间的推移而关联、跟踪和优化,为了解决这些问题,本文提出了一种帧间边缘一致匹配的方法;解决优化问题的一种可行策略,因为在处理边缘时其尺寸会迅速增加;以及非线性优化技术的使用.所得到的系统与基于特征和稠密/半稠密系统的先进状态相比精度相当,同时内在地构建了环境的结构半稠密重建,为进一步的导航算法提供了相关的结构数据.
介绍
基于视觉的同步定位和建图(VSLAM)是一个被广泛研究的问题,也是计算机视觉和机器人技术的关键。SLAM是大多数需要自我运动和场景几何意识的系统的核心针对VSLAM问题提出了许多解决方案。基于特征的算法依赖于点地标随时间的识别和跟踪。这些方法具有较强的鲁棒性和较高的精度,但由于重构后的地图稀疏,其实际应用价值较低。在没有文本的环境中,它们也存在问题,在这种环境中,点特征很难获得。直接方法直接对图像强度进行操作,在每个图像像素的选定子集中重建深度。这些方法避免了特征提取的代价,但目前的方法需要对光度照相机模型进行估计和校正,以处理光照变化和遮挡问题,从而导致更加复杂的优化问题。然而,这些系统的重构输出通常会产生更丰富的地图,比基于特征的方法更适合导航,但这是有代价的具有较高的处理能力
在这种情况下,基于边缘的系统在前者之间出现了一个有趣的中间点。一方面,边缘提取具有很强的鲁棒性和高度并行性,在计算机视觉中得到了广泛的研究,在生物视觉系统中也有应用。此外,边缘是可跟踪的特征,这意味着几何重投影误差可以像经典的基于特征的系统那样被利用。此外,在传统特征提取困难的无纹理场景中,可以提取边缘。最后,edgemap通常包含物体边界,因此它的重建提供了丰富的被观察场景的结构信息,可以在稠密重建和语义解释中发挥作用。
尽管有潜在的好处,使用边缘的SLAM系统并不常见,大多数使用直线作为经典特征的补充,以在基本方法失效时增强鲁棒性。直到最近才提出了一种基于边缘的系统。这可能是由于边缘不容易随着时间的推移而关联、跟踪和优化,因为它们缺乏描述符。
本文提出了一种新的基于边缘的SLAM系统(SE-SLAM),该系统依赖于边缘检测作为唯一输入,除了闭环步骤。跟踪和数据关联是通过跟踪以往的发展,这是一种新颖的基于半稠密结构边缘的单目SLAM系统。SE-SLAM的精度可与基于特征和稠密/半稠密系统相媲美,但在除循环闭包之外的所有阶段中都使用边缘作为唯一的输入,在几种情况下实现实时操作。该系统基于边缘的特性不仅有助于在无纹理的环境中进行导航,而且在本质上构建了适合进一步导航算法的环境结构半稠密重构。这要感谢以下贡献:
一种以一致的方式将帧和相对远的关键帧之间的边缘关联起来的方法,使传统上用于点特征的技术得以应用。利用边缘的性质,使优化问题可处理的参数化、剩余和变量选择和边缘化策略,因为如果将现有方法应用于边缘,其规模会迅速增加一种能更好地适应基于边缘的输入的非线性优化方法实验
本系统以EuRoC数据集为基准,该数据集被广泛用于评价SLAM方法,以及来自TUMVI数据集和ICL-NUIM数据集的室内序列.
测试了两种版本的方法,即SESLAM1和SESLAM3,即每帧分别进行一次和三次优化迭代。
1EuRoC数据集的结果EuRoC第一组是一个大型机器大厅的五个序列,具有不同程度的动态运动和光照变化。第二组是在两个装有VICON跟踪系统的房间内拍摄的,虽然覆盖的空间较小,但在高动态运动方面更具挑战性。这整个数据集的目标是立体视觉惯性算法,因此运行纯单目系统带来了额外的困难,特别是在纯相机旋转的情况下,其中整个edgemap是更新没有运动
表1中展示了机厅和Vicon室的序列,对SE-SLAM进行了对比广为人知的算法:OBSLAM2[2]代表基于SLAM系统的特征,L-DSO[40]代表直接的.两种方法在单目SLAM方面都是最先进的,并使用作者提供的配置运行.它可以看出SE-SLAM与两种方法呈现出相似的精度,特别是sesam-3只在困难的序列中引入了显著的改进,其中高动态运动为每帧引入了大量的新数据.在最具挑战性的数据集失败的原因是由于强烈的强度变化和大的运动与图像模糊丢失跟踪.系统无法从这种情况下恢复,因为它缺乏一个重定位机制,
需要强调的是,与基于边缘的SLAM相比,ORB-SLAM2和LDSO都是各自领域长期增量工作的结果.根据在这些序列中的SE-SLAM竞争结果,很明显,这种方法是非常有前途的,并有改进的空间.
图6(a,b)显示了MH03和V序列最终轨迹的自顶向下视图。
2TUMVI数据集的结果TUMVI数据集包括许多室内和室外序列集。这是一个具有挑战性的数据集,旨在评估立体视觉惯性算法,在长序列的动态运动和照明变化。选择房间序列进行评估,因为它们是整个序列中唯一具有地面真实数据的序列。测试结果如表II所示,这可以再次看到,即使SE-SLAM是一个单目系统,但产生具有竞争的结果.
图6(c)描绘了序列Room1的完全优化轨迹。
3ICL-NUIM数据集的结果最后,在ICL-NUIM合成数据集的Office4序列中运行SE-SLAM,与[13]中提出的基于边缘的算法进行比较.结果如表III所示.
值得注意的是,ICL是RGBDSLAM和重建系统的目标数据集。[13]所采用的办公室轨迹是具有慢动作的短序列。考虑到大约20%的序列花费在初始化上,作者认为这不是评估此类SLAM系统的最佳方式。不过,我们的系统的性能优于[13],除非出现跟踪失败的情况
4重建结果重构输出是该方法的一个关键方面。示例如图1、7和8所示。相对于稀疏系统,在提供结构信息方面的优势是显而易见的。值得注意的是,在发生了几个循环的情况下,系统如何在2.24分钟的时间跨度内保持Room2序列的一致性。
5运行时间考虑到SE-SLAM是一种优化图像中每个重要边缘点的半稠密方法(每帧提取的边缘点约为5K到12K),计算量要比稀疏的方法。而且,运行时间很大程度上取决于每个特定的场景结构。尽管如此,系统在大多数数据集中表现出良好的性能。这是由于它的PKF选择策略,分层优化利用第一和第二的稀疏和并行。测量的运行时间报告在表IV。
6尺度漂移和闭环最后,图9显示了EuRoCMH01序列上增量和完全优化轨迹的估计速度误差.在增量情况下,系统由于尺度漂移的增加而低估了速度.当闭环发生时,PGO执行一个完整的轨迹优化,收敛到一致的规模.
结论
本文提出了一种新颖的半稠密结构基于边的单目SLAM系统,该系统在具有挑战性的数据集上取得了与其他先进系统相比较的竞争结果。基于边缘的系统本质上构建了一个半稠密的环境重建,为进一步的导航算法提供相关的结构数据,甚至在无纹理环境中利用最相关的图像信息.
最后,SE-SLAM在广泛使用的EuroCMAV、新TUMVI和ICL-NUIM数据集中进行了基准测试。从结果部分可以看出,该系统的精度与基于特征和稠密/半稠密系统相当
-END-预览时标签不可点收录于话题#个上一篇下一篇