快捷分类

一种基于深度相机的机器人室内导航点云地图生成方法

更新时间：2016-07-05

地图是人类空间认知的工具，无论早期的纸质地图还是如今的电子地图，都在人类的日常生活中发挥着重要作用[1]。随着以无人车、无人机为典型代表的智能机器人平台逐渐进入人们的视野，智能机器人的自主导航成为当前的研究热点，而作为导航基础的地图生成方法更是成为智能机器人自主导航的关键。

点云是智能机器人导航地图的一种有效表示形式。目前智能机器人的点云获取主要有激光点云与图像点云两种主要方式。三维激光扫描仪能够直接快速地获取高精度的三维激光点云，在城市建模[2]、文物与古建筑修复[3-4]等领域得到了成功的应用。三维激光扫描仪造价高昂，体积较大，常常需要车载或机载配合使用；所获取的点云数据量较大，处理较为复杂，需要人工对点云数据进行编辑。

图像点云的生成主要有SfM与SLAM两种方法。计算机视觉领域的SfM(Structure from Motion)方法通过对大量无序图片的离线处理，恢复相机的运动轨迹并重建相应的图像点云，进而恢复三维场景结构[5-6]。经过几十年的发展，SfM方法相对较为成熟，并且有PhotoScan与Pix4D等成熟的商业软件可供选用。由于SfM方法大多使用单目相机作为图像获取手段，因而在处理过程中不容易获得三维场景结构的真实尺度，且其离线处理方式使其不适用于实时性要求较高的应用场景。

徐穆实打破了中文冗长分散的句子结构拆分成短小部分，结合直译方法将具有浓重宗教仪式感的风葬习俗展现给西方读者。最后，徐穆实采用“The Last Quarter of the Moon”的意译形式的标题获得了良好的“译后”翻译效果。一些研究者评论道，正是徐穆实和出版机构共同的努力才使得英译本《右岸》在欧美主流世界俘获口碑[6]。

机器人领域的SLAM(Simultaneous Localization and Mapping)问题自20世纪80年代提出，至今已经过近30年的发展[7]。早期的SLAM研究主要以激光、声纳等测距类传感器为主。随着传感器技术以及计算机视觉技术的发展，特别是多视图几何技术[8]的逐渐成熟，简单轻便的单目、双目以及深度(RGBD)相机等图像类传感器越来越受到研究者的青睐。

深度相机可同时获得彩色图像与深度图像。深度图像得到相机坐标系内每个像素点所对应的空间三维点坐标。设t-1时刻，彩色图像的图像特征点集合为pt-1，特征点所对应的空间三维点集合为时刻，彩色图像的图像特征点集合为pt，通过特征点匹配得到pt-1与pt之间的匹配集合p，则与之间的投影误差为

为了能够实时精确地生成机器人室内导航所需的点云地图，本文提出一种基于深度相机的视觉特征与ICP相融合的点云地图生成方法。

1 算法设计

本文提出一种基于深度相机的机器人室内导航点云地图实时生成方法：①利用ORB(Oriented FAST and Rotated BRIEF)算子对深度相机所拍摄的彩色序列图像进行视觉特征的快速提取与匹配，结合ICP算法，实时估计相机位姿；②在相机位姿优化操作中添加ICP误差约束，应用图优化算法[15]对深度相机所获取的彩色图像的投影误差以及深度图像的反投影误差进行联合优化，得到相对精确的相机位姿与三维稀疏点云；③利用估计得到的相机位姿对关键帧所对应的稠密图像点云进行拼接融合，得到稠密点云表示的机器人室内导航点云地图。算法流程如图1所示。

1.1 相机模型

由深度相机可以同时获得彩色图像IRGB→R3与深度图像ID→R。设标准针孔相机的焦距为f，相机投影中心沿图像x轴与y轴的偏移分别为cx与cy，将三维空间中某点P=(X,Y,Z)T映射为图像像素位置p=(u,v)的投影函数π[8]定义为

左权县建立健全以管护责任人落实、水费收取、维修养护专项资金筹集为重点的管护机制，增强农村饮水工程管护主体自身“造血功能”，确保农村饮水工程良性运行和长久发挥效益；中阳县出台《农村饮水安全工程运行管理办法》，县财政投入148万元，提供公益性岗位248个，实现饮水工程全部有专人负责管理，做到建得起、管得住、用得好。

(1)

陶贵周(1959-)，男，主任医师，二级教授，研究方向：冠心病的基础与临床研究，尤其是冠心病的介入治疗。

(2)

相机刚体变换[16]定义为

g=[R|t]∈SE(3).

(3)

其中R∈SO(3)为正交旋转矩阵，t∈R3为平移矩阵。

将相机位姿定义为刚体变换矩阵，并使用曲线坐标系(twist coordinate)表示：

给定图像像素坐标p=(u,v)T 以及所对应的深度值Z(p),重建空间三维点的反投影函数π-1可定义为

ξ=(v1,v2,v3,w1,w2,w3)T.

(4)

其中，[v1,v2,v3]∈R3表示相机的线性速度，[w1,w2,w3]∈R3表示相机的角速度。

(三)首次提出改革党和国家领导制度，坚持和发展中国特色社会主义制度，为改革开放的持续伟业奠定了根本制度基础

由李群与李代数的运算规则，相机在空间中的刚体变换(位姿)可表示为

g=exp(ξ).

(5)

图1 算法流程

1.2 相机跟踪

将第一帧图像所对应的相机位姿 ξ0=(0,0,0,0,0,0)T定义为世界坐标系的原点，通过相邻两帧图像之间的相对变化估计相机位姿，并描述相机在三维空间中的运动。

以微软Kinect代表的深度相机可同时获取彩色图像与深度图像，为室内模型构建与机器人导航地图的生成提供了新工具。KinectFusion[9]通过ICP(Iterative Closest Point)算法实现点云数据之间的配准，估计相机在空间中的运动；基于体素格网实现室内物体的表面重建，所有的测量直接融合为体素表示。KinectFusion可实时计算，但由于算法的复杂性，需要高性能显卡的支持，且体素的表达方式内存占用较大，仅适用于小范围场景。Kintinuous[10]通过移动带有当前相机位姿的体素格网动态改变融合区域，改进KinectFusion的内存占用问题，采用基于BoW(Bag of Words)[11]的环路检测算法降低了位姿估计误差的累积影响，通过CUDA运算实现相机位姿的实时估计与图像点云的实时拼接，但位姿估计的精度有待进一步提高。RGBD-SLAM[12]是为开源社区广泛使用的实时SLAM系统，通过相邻图像帧之间的视觉特征提取与匹配估计相机运动，并通过ICP算法对估计得到的相机运动进行验证以保证相机位姿估计的正确性，而位姿估计的实时性与精度有待进一步提高。DVO[13-14]通过直接方法(Direct-Method)利用像素强度实现相邻图像帧的配准并估计相机位姿。相比于ICP算法，DVO可通过CPU实现实时运算。DVO适用于窄基线场景(相机运动变化较小)，对于相机运动变化较大的情况鲁棒性不高，且直接方法受光照条件的影响较大，因而对所使用的相机有较高的要求。

(6)

其中：为特征点pk所对应的空间三维点坐标。

轩辕明在神像旁边发现了一个木牌，木牌上标着：南方第二列山系，从柜山到此漆吴山共十七座山，共长七千二百里。

通过优化彩色图像的投影误差，可以得到相机位姿为

(7)

为了提高相机跟踪的鲁棒性，在图像特征点匹配失效，无法利用彩色图像估计相机位姿的情况下，利用t与t-1时刻的深度图像与通过ICP算法估计相机位姿并利用估计得到的相机位姿在特征点集合pt-1与pt之间查找匹配的特征点。

1.3 关键帧处理

本来是一家的女儿，翠姨她们两姊妹却像有钱的人家的小姐，而那个堂妹妹，看上去却像乡下丫头。这一点使她得到常常到我们家里来住的权利。

银行内部的绩效考核和激励机制也在一定程度上造成银行不敢贷、不愿贷。陈惠莲说，从基层银行的现状看，一些银行在综合收益率等指标考核上没有对民营企业贷款予以倾斜，银行内部资金转移价格未及时调整，专项激励费用未安排到位，同时尽职免责尚难落实。“虽然监管部门对从业人员有尽职免责的规定，但在实际操作上，很难划清尽职免责和从业道德风险的边界。更重要的是管理机制未完全跟上，现在基层行放款，如果没有上级行在管理模式、工作方式、服务创新、产品设计、风险定价等方面的配套创新，基层信贷机构和人员难有更大的作为。”

(8)

式中：W是一个对角矩阵，表示ξji中每个参数的权重。如果当前帧与上一个关键帧Ki-1之间的距离超过所设定的阀值时，则创建新的关键帧Ki。

3)计算并注册新关键帧的BoW向量，以用于后续操作的快速搜索与匹配。

4.1.4 加工产品品控难由于缺乏行业标准和检测技术不到位,目前国内甘薯淀粉原料市场混乱,为降低价格,甘薯淀粉原料中常掺杂各类廉价淀粉,如木薯粉、玉米淀粉、马铃薯淀粉等．当前的技术水平下,这些廉价淀粉的比例很难实行常规化的监测把控．淀粉原料市场混乱导致下游粉丝粉皮加工环节品控难．

1)三角化匹配的特征点生成3D地图点。为了尽可能多地生成3D地图点，对于跟踪中未成功匹配的所有特征点，沿极线在相邻关键帧中查找更多的匹配。

2)执行数据关联操作融合重复的地图点，并剔除误差较大的地图点。

在SLAM点云地图中并不会保存所有的图像帧，而是选择保存满足一定条件的关键帧。将两帧图像之间的相对距离定义为相机位姿的平移与旋转的权重组合：

对关键帧的处理：

而王维不同。苏轼在《东坡题跋·书摩诘蓝田烟雨图》里说：“味摩诘之诗，诗中有画；观摩诘之画，画中有诗。”在王维的山水诗中，吸取中国画空间意识的作品不可胜数。中国画采用“散点透视”法，能将视线内外的景物容纳到一个画面上来，展现千里之景，四时之色。王维是水墨画的开创者，在诗歌中可以见到其绘画理论的实践。下面以王维诗《终南山》为例作一简要分析，可证此言非虚。

4)进行局部优化，优化相机位姿与3D地图点坐标。

对新添加的关键帧K，通过BoW向量快速检索与关键帧K共享相同视觉单词(Visual Words)的关键帧构成局部关键帧集合KL，同时与关键帧集合KL相对应的3D地图点集合。对关键帧集合KL以及相对应的3D地图点集合进行投影误差与反投影误差的联合优化，以提高关键帧所对应的相机位姿以及3D地图点坐标的估计精度。

㉓参见［英］恩斯特·拉克劳、查特·墨菲《领导权与社会主义的策略》，尹树广、鉴传今译，黑龙江人民出版社2003年版，第129页。

其中，是Dt中第k个地图点的像素坐标反投影得到的空间三维点。

(9)

设t时刻所获取的彩色图像与深度图像分别为 It与Dt，t-1时刻所获取的彩色图像与深度图像分别为It-1与Dt-1，t时刻相对于t-1时刻的相机变换为则Dt与Dt-1之间的反投影误差为

彩色图像的投影误差为

(10)

对彩色图像的投影误差与深度图像的反投影误差进行联合优化：

(11)

其中wrgb为彩色图像投影误差的权重参数。

1.4 环路检测与地图优化

由于估计误差的不断累积，在视觉SLAM中相机跟踪漂移是不可避免的。为了有效地抑制误差累积的影响，得到更好的全局一致地图，在SLAM处理流程中引入基于BoW[11]的环路检测。

在关键帧处理阶段，为新生成的关键帧注册BoW向量。在环路检测阶段，对于当前关键帧，在已构建的BoW向量数据库中检索与当前关键帧共享相同视觉单词的关键帧作为环路候选项，计算其与当前关键帧的相似度，并选择相似度超过一定阀值的关键帧作为环路候选项。为了提高系统的鲁棒性与环路检测的准确性，仅选择其相邻帧作为环路候选项，并使用RANSAC方法计算其与当前关键帧的变换关系，选择满足一定数量的关键帧作为环路关键帧，确保与当前关键帧的几何一致性。

在检测到SLAM环路之后，执行数据关联操作融合重复的地图点，利用位姿图优化方法对构成环路的关键帧以及所对应的3D地图点进行投影误差与反投影误差的联合优化，提高SLAM位姿估计精度，得到全局一致地图。

2 实验结果

2.1 机器人测试

使用Turtlebot作为机器人平台，搭载Asus Xtion Pro深度相机，并使用安装有Intel Core I5-3230 CPU，8G内存，64位Debian Sid系统的笔记本电脑作为主控计算机，负责Turtlebot机器人的运行控制与SLAM信息处理，通过手动遥控方式控制机器人在室内行走，构建机器人室内导航点云地图。

对深度相机所拍摄的序列图像进行视觉特征提取，通过相邻图像帧之间的特征点匹配集合实时估计相机位姿，得到相机在空间中的运动轨迹，如图2所示。

图2 相机估计轨迹

利用所获取的深度图像，对相邻图像帧之间的特征点匹配集合执行三角化操作，重建图像像素点所对应的空间三维点坐标，得到稀疏三维点云，如图3所示。

图3 三维稀疏点云

由关键帧对应的彩色图像与深度图像可得到该关键帧所对应的三维点云，利用估计得到的相机位姿对关键帧所对应的三维点云进行拼接融合，得到以稠密点云表示的三维空间场景结构，如图4所示。

图4 稠密点云表示的室内三维场景

为了对所生成的稠密点云进行有效的管理与使用，使用八叉树对稠密点云进行剖分与管理，所得到结果如图5所示(分辨率0.01 m)。

推进最严格的水资源管理制度落实。抓好实行最严格水资源管理制度有关规定的落实和考核工作，开展中水回用项目建设规划、水资源保护规划和水中长期供求规划工作，完成地下水的调查评估，划定禁采区和限采区，并向社会公告。

图5 稠密点云的八叉树表示

为了测试本文方法的效率，对关键步骤进行速度度量，结果如表1所示。

由定位速度的测试结果可以看出，本文方法中的相机跟踪平均耗时为23.5 ms，即可以实现每秒42帧的处理速度，由程序性能度量以及实际的机器人测试结果来看，本文方法可满足机器人室内导航点云地图生成的实时性需求。

4.要将企业劳动保护工作作为一项系统工程来推进。企业劳动保护工作涉及管理的诸多层级和关系，企业工会需依法履行劳动保护职责，如充分行使《劳动法》、《安全生产法》、《工会法》等授予工会组织在劳动保护工作中的参与权、代表权、知情权和监督权，在企业宣传普及安全劳动保护知识，以及监督国家有关劳动保护、安全技术、环境卫生等法律法规在企业的贯彻落实情况，及时解决影响职工健康和安全的各类问题等。同时，还要与安全监察部门开展协调监管工作，尤其是探索出新时期劳动保护、广泛监督的工作内容、发展思路和方式方法。

表1 性能测试结果

调用次数最小用时/ms平均用时/ms最大用时/ms总用时/s地图构建17517.6341.0602.559.7相机跟踪37845.523.585.089.0

2.2 数据集测试

为了评估本文方法位姿估计的精确性，应用TUM-RGBD数据集[17]进行精度评估测试，度量估计得到的相机轨迹与相机轨迹真值之间绝对轨迹误差(ATE)，并与典型的KinectFusion[9] 以及RGBD-SLAM[12]的精度测试结果进行对比，以绝对轨迹误差(ATE)作为度量指标，如表2所示。由测试结果可以看出，本文方法估计得到的相机位姿精度与鲁棒性优于另外两种方法。

表2 绝对轨迹误差(ATE)对比 m

数据集本文方法RGBD-SLAMKinectFusionfr1/xyz0.0110.0140.026fr1/rpy0.0290.0260.133fr1/desk0.0190.0230.057fr1/desk20.0220.0430.420fr1/room0.0580.0840.313fr1/3600.0170.0790.913fr1/teddy0.0440.0760.154fr1/plant0.0130.0910.598fr2/desk0.072--fr3/office0.010-0.064

本文方法估计得到的相机轨迹与数据集相机轨迹真值之间的对比如图6所示。由对比结果可以看出，本文方法估计得到的相机轨迹可以很好地接近数据集的相机轨迹真值。

图6 相机轨迹估计值与真值对比

3 结束语

通过处理深度相机所拍摄的序列图像实时估计相机位姿，利用图优化算法，综合考虑深度相机所获取的彩色图像的投影误差与深度图像的反投影误差，对相机位姿与稀疏三维点云进行联合优化；利用优化后的相机位姿对关键帧所对应的图像点云进行拼接融合，从而得到表示三维空间场景结构的稠密点云地图。通过机器人实验以及标准数据集测试，验证本文方法的有效性、精确性与实时性。

参考文献：

[1] 高俊. 地图学寻迹[M]. 北京：测绘出版社, 2012.

[2] 康永伟. 车载激光点云数据配准与三维建模研究[D]. 北京：首都师范大学, 2009.

[3] 赵煦, 周克勤, 闫利,等. 基于激光点云的大型文物景观三维重建方法[J]. 武汉大学学报(信息科学版), 2008, 33(7): 684-687.

[4] 詹庆明, 张海涛, 喻亮. 古建筑激光点云-模型多层次一体化数据模型[J]. 地理信息世界, 2010(4):6-11.

[5] SNAVELY N, SEITZ S, SZELISKI R. Photo Tourism: Exploring Image Collections in 3D. ACM Transactions on Graphics[J]. ACM Transactions on Graphics, 2006.

[6] SNAVELY N, SEITZ S M, SZELISKI R. Modeling the world from internet photo collections[J]. International Journal of Computer Vision, Springer, 2008, 80(2): 189-210.

[7] BAILEY T, DURRANT-WHYTE H. Simultaneous localization and mapping(SLAM): Part I[J]. IEEE Robot. Autom. Mag., 2006.

[8] HARTLEY R I, ZISSERMAN A. Multiple View Geometry in Computer Vision[M]. 第2版. Cambridge University Press, ISBN: 0521540518, 2004.

[9] NEWCOMBE R A, IZADI S, HILLIGES O, et al. KinectFusion: Real-time dense surface mapping and tracking[C]//Mixed and augmented reality (ISMAR), 2011 10th IEEE international symposium on. IEEE, 2011: 127-136.

[10] WHELAN T, KAESS M, FALLON M, et al. Kintinuous: Spatially extended kinectfusion[C]. National Conference on Artificial Intelligence. 2012.

[11] GLVEZ-LPEZ D, TARDS J D. Bags of Binary Words for Fast Place Recognition in Image Sequences[J]. IEEE Transactions on Robotics, 2012, 28(5): 1188-1197.

[12] ENDRES F, HESS J, STURM J, et al. 3-D mapping with an RGB-D camera[J]. IEEE Transactions on Robotics, IEEE, 2014, 30(1): 177-187.

[13] KERL C, STURM J, CREMERS D. Robust Odometry Estimation for RGB-D Cameras[C]//International Conference on Robotics and Automation. 2013.

[14] KERL C, STURM J, CREMERS D. Dense Visual SLAM for RGB-D Cameras[C]//Proc. of the Int. Conf. on Intelligent Robot Systems (IROS). 2013.

[15] KÜMMERLE R, GRISETTI G, STRASDAT H, et al. G2o: A general framework for graph optimization[J]. Proceedings - IEEE International Conference on Robotics and Automation, 2011: 3607-3613.

[16] MA Y, SOATTO S, KOSECKA J, et al. An invitation to 3-d vision: from images to geometric models[M]. Springer Science & Business Media, 2012, 26.

[17] STURM J, ENGELHARD N, ENDRES F, et al. A benchmark for the evaluation of RGB-D SLAM systems[C]//2012 IEEE/RSJ International Conference on Intelligent Robots and Systems. IEEE, 2012: 573-580.

作者

马跃龙，曹雪峰，万刚，李登峰

基金

分类号

出处

《测绘工程》 2018年第3期

上一篇：方差分量估计的抗差总体最小二乘算法

下一篇：基于罗德里格矩阵的抗差迭代坐标转换算法研究

《测绘工程》2018年第3期文献

方差分量估计的抗差总体最小二乘算法作者：陶叶青，蔡安宁，杨娟

一种基于深度相机的机器人室内导航点云地图生成方法作者：马跃龙，曹雪峰，万刚，李登峰

基于罗德里格矩阵的抗差迭代坐标转换算法研究作者：李国琴，田林亚，郭英起，张洋，毕继鑫

基于图割算法的摄影测量点云面向对象分类方法作者：郑特，邹峥嵘，张云生，杜守基，何雪

基于凸包算法和抗差最小二乘法的激光扫描仪圆形标靶中心定位作者：何华，李宗春，阮焕立，付永健

低空机载LiDAR点云定位误差分析作者：杜婷，李浩，杨彪，苏博，刘亚南

已知平面与高程点不同时的严密三维基准变换作者：曹旭，沈云中

天线相位中心改正对GPS精密单点定位的影响作者：张磊，兰孝奇，房成贺，张崇军

一种基于控制点集的实体地貌辅助建模方法作者：周啸，王玉萍，李少梅，叶辉

一种基于遗传算法和BP神经网络的对流层延迟改正模型作者：陈阳，胡伍生

一种改进遗传神经网络的建筑基坑沉降预测模型作者：周星勇，杨容浩，王志胜，冉中鑫

基于BIM理念的规划监督测绘数据挖掘分析作者：王天应

基于百度地图的武汉市老地名时空分析系统作者：彭宇，刘鹏程，黄颖，曹隽隽，郭明强

一种面向倾斜影像三维建模的影像筛选方法作者：张明磊，张云生，邹峥嵘

省市县一体化农村土地承包管理系统构建研究作者：倪慧珠，傅月波，万术海，冯柏栋

面向地理信息科学专业的计算机制图实习改革与实践作者：李玲，刘正纲，王崇倡

杂志信息网