更全的杂志信息网

一种非迭代的位姿估计方法

更新时间:2009-03-28

1 引 言

SLAM是指机器人在未知环境中从某一位置开始移动,在移动过程中根据位置估计和传感器数据进行自身的定位,同时重建增量式地图的过程[1]。SLAM被认为是实现全自主移动机器人的核心环节,被广泛应用于未知环境的探索、无人机的导航与路径规划、灾难现场的搜寻与营救等众多领域中[2]

一个清晰的SLAM系统框架大致可以分为两部分:前端和后端,前端负责提取传感器的数据并构建模型,后端根据前端的数据进行优化。对于视觉的SLAM而言,前端主要是指视觉里程计的实现,即根据图像求解相机位姿。而后端则是对前端的计算结果进行优化,以获得更精确的位姿估计和全局一致的地图。因此,位姿估计是SLAM中的首要环节,估计精度直接影响最终的定位和地图重建结果[3-4],计算消耗的时间也将影响到SLAM的实时性。由此可见,对SLAM前端的位姿估计进行优化是非常必要的。

在使用深度相机进行位姿估计时,常见的方法是求解n 线透视(PnL)[5]或者n点透视(PnP)问题,其中PnP求解较为常见[6-7]。PnP计算时要求参与计算的特征点匹配都是正确的,但是初始图像特征匹配经常存在误匹配。通常采用RANSAC(Random Sample Consensus)迭代算法[6]剔除误匹配,这种方法可靠性强、精度高、鲁棒性强,具有较好的剔除误匹配点的能力。但RANSAC依赖迭代运算提高精度,所以计算代价很高。尤其是在数据量庞大、特征点匹配错误率高时,时间消耗会呈指数级增长。Felix Endres等人[8]在RANSAC算法随机抽样时,引入了三点空间距离相等的筛选准则,在一定程度上减少了RANSAC算法的计算量,但是算法仍需迭代。

为此,本文以三维空间中欧式距离与坐标系的建立无关为准则,结合初始图像匹配中特征点描述的距离信息,提出了一种无需迭代的新方法,剔除大量错误特征点,进行直接求解。从而提高求解精度,减少求解时间。

本文首先介绍了求解深度相机位姿变化的数学基础,包括PnP算法和采用RANSAC剔除误匹配求解PnP的算法;其次详细论述和说明了本文的改进方法,然后通过实验,从时效和准确性两个方面对改进方法和传统RANSAC算法进行了对比分析。最后,对全文做了归纳和总结。

②遍历初始匹配点集,按式(5)分别计算特征点对相对于种子的距离匹配度量值。得到集合

一般意义上的“启蒙”指的是一种态度或过程,它只承认自由个体的权威,而不承认其它的权威。这个意义上的启蒙没有日期来标示其开始或结束,因而不能指一个阶段的启蒙。不论何时,只要能摆脱不加怀疑的接受并学会批判性分析,那么就可以说是获得了启蒙。

2 深度相机的位姿变化估计过程

2.1 PnP算法

相机运动过程中,利用两帧具有部分景物重叠的图像可以求解相机的位姿变化。如图1所示,设空间中一点P(x,y,z)在两幅图像F1、F2中的投影图像的齐次坐标分别为:p1(u1,v1,1)和p2(u2,v2,1)。第二帧图像相对于第一帧图像位姿变化由旋转矩阵R和位移矢量t描述。相机的内参数为K。所以:

 

(1)

其中,d1d2是两个图像点由深度相机获取的已知投影深度。记归一化相机坐标为:

 

(2)

将式(2)代入式(1)得到:

线上线下学习内容高度契合,各有分工:线上完整精讲、细讲知识点、重概念原理和“广度”学习,线下教师部分精讲,理清脉络,重案例点评和“深度”学习。

x2=Rx1+t

(3)

患者行CT平扫及增强扫描,采用日本东芝公司320排CT Aquilion ONE进行容积扫描。增强扫描采用高压注射器经肘前静脉注入非离子型造影剂欧乃派克100ml,流速4ml/s。

 

(4)

其中,分别是图像1和图像2的归一化相机坐标,由式(2)计算得到,n为参与计算的特征点对数。

  

图1 相机成像示意图Fig.1 Schematic diagram of camera imaging

2.2 RANSAC求解PnP

首先由深度相机获取两帧图像为F1、F2。在这两帧图像中分别提取SIFT特征[9]。SIFT特征点由关键点和描述子组成,关键点记录了特征点的位置坐标,描述子由关键点周围像素的梯度方向直方图生成。匹配SIFT特征时,采用描述子的欧氏距离d作为两幅图像中特征点的相似性判断标准。利用FLANN(Fast Library for Approximate Nearest Neighbors)[10]方法对两个点集中的元素进行匹配,找到图像F1中特征点在图像F2中的最佳的匹配点在这些匹配的特征点对中含有很多错误的匹配,本文剔除大于4dmin(匹配对的最小欧式距离),以提高正确匹配点的比例。初步筛选后,依然会存在误匹配点,因此需要采用RANSAC做进一步筛选。假设剩余n组初始匹配点为:

中学隶属于国家的事业单位,在发展过程中,其教育经费的主要来源是国家政府的资助,还有部分的经费来源是赞助资金以及捐助资金。随着教育体制改革的提出,逐渐地出现了教育经费紧张的现象,与此同时,在财务管理工作过程中,如果学校依然铺张浪费,势必会对中学的教育发展造成一定的影响。缺乏一个完善的预算评价系统,是这一类问题的主要表现,由于我国的预算管理系统比较落后,预算评价系统匮乏,导致现阶段我国中学财务工作中,出现了预算管理工作的停滞问题[3]。

 
 

则利用RANSAC算法剔除误匹配点,求解PnP的过程为:

①在集合P1、P2中随机抽取3对匹配的特征点。

显然,在无测量误差时,若为正确匹配点,则 lxn=0。因此,可设定阈值T,若 lxn<T则认为匹配正确,否则认定匹配错误。由此可见,可以利用正确匹配的种子点剔除误匹配点,但是需要保证种子点匹配是完全正确的。

③遍历集合中其余点是否符合以上模型,即计算是否小于设定的阈值。统计符合以上模型的点数,即为内点数。

④重复以上步骤,直到达到最大迭代次数或获得所需内点数。

⑤选择内点数最多的模型,用式(4)求解位姿参数。

3 本文方法

④在交集点中,任意选择一对特征点作为种子点,对匹配点按几何距离度量再做一次筛选。 如果筛选后的点数小于90%,则舍弃该对种子点,再次选择。

Dynamic evolution of travel itinerary patterns of Yangtze River Delta:

(5)

②根据方程(3)求解Rt

  

图2 三维空间中的特征点Fig.2 The distribution of features in the 3D space

本文筛除错误匹配点的算法流程如下:

(1)特征点描述子的距离越近,正确匹配的概率越高。

方案三:沿测区边界像控点布设方法与方案二相同,测区内航向相邻像控点平均间隔基线数为5,航线东西两端按3至4条基线布设一个像控点。即测区边界布设像控点的方式与方案二相同。测区内,旁向间隔一条航线布设一排像控点,航向方向像控点的布设与方案二相同。

(2)当选择的种子点匹配错误时,根据 lxn<T筛选留下的匹配特征点会很少。因为正确的匹配点与错误匹配点的距离不会相等,而错误匹配的特征点与错误种子点具有相同欧式距离的几率很低。

本文的方法基于两个假设条件:

①选择描述子矢量距离d最小的2对特征点作为种子点。

金标免疫层析技术是根据单克隆抗体技术建立的一种固相免疫技术,与酶联免疫技术相似,都是属于一种快速的检测技术。但是与酶联免疫技术相比,金标免疫层析技术不需要专门的仪器设备,检测所需时间更短,大约10min即可完成检测。而且该试纸卡操作十分简便,与其他检测方法相比价格相对较低,对待测物质具有较高的灵敏度。刘波等[31]利用该技术建立起了对食用油中苯并芘进行检测的试纸条,检测限可达5~10μg/L,对食用油中苯并芘的含量具有快速准确的判定。

大伙儿对你磨刀子感了兴趣,听说你要杀人,这不是想劝劝你吗?老冬瓜说。不要杀了吧?到了咱这个年龄,啥仇还不都淡了。

Vertical displacement characteristics of rock slope under rainfall conditions

③设定阈值TL1L2进行筛选,并对筛选后的集合求交集,若交集的元素数量小于初始点集的10%,则重复步骤①选取新的种子点,并对筛选集合两两求交集。直到交集点数目大于10%,或者种子点数等于4。则输出最大交集点,进入步骤④。

经过对两幅图像F1、F2中的SIFT特征点进行匹配,目的是找到空间中同一点在两幅图像中的投影若匹配出现错误,其在深度图像中相对某一正确匹配的点的绝对距离必然发生变化。如图2所示,种子点为正确匹配的特征点到种子点的空间绝对距离相等;而错误的匹配到种子点的距离不会相等(极端的对称情况因为发生的概率很低,暂时不予考虑)。由于观测误差的存在,可以设定一个阈值进行筛选。以为例,定义匹配准则:

Rt有6个自由度,一对匹配点可以得到关于Rt的两个约束方程,因此获取三个以上的匹配点就可以利用对应点的关系求解相机的位移矢量和旋转矩阵,即得到了相机的位姿变化。实际计算中,在多于三对特征点时,由于特征点的定位误差和深度图像的采集误差,匹配点对并不能完全满足公式(3)。因此在根据式(3)求解Rt的过程中需要将求解转化为优化问题,优化方程为:

⑤将最终筛选得到的特征点代入公式(4)求解R,t

需要说明的是:

(a)在实际的算法中,建议T的取值为0.05~0.15之间,在本文的实验中选取T=0.1。

(b)步骤③是为了验证种子点是否选择正确,实验结果表明,如果种子点选取个数超过4个,则此时初始匹配点对中存在极高的误匹配率,RANSAC和本文算法都不能得到正确的结果。

(c)步骤④是为了避免出现两个不同点距离种子点距离相同的极端情况。即在空间中与两个种子点具有相同距离的点集是一个圆,而不是唯一确定的一个点。当加入第三个内部种子点时,可以唯一确定正确的匹配点,这与GPS的绝对定位原理相同。

数值模拟结果表明:滑坡变形主要集中在中前部,特别是右侧中部(高程170 m~200 m)位移明显较大,且前部位移比中部位移要大,另外局部后壁也出现了较大的位移,详见图11(工况6,较危险工况)。基于上述8个工况下的数值模拟结果推断,该滑坡在库水位作用下将发生前缘蠕滑、后缘拉裂、中部剪断的三段式破坏模式。

4 实验结果与分析

实验的计算机配置:Intel(R) Core(TM) i5-3210M CPU 2.20GHz,2GB,Ubuntu虚拟机下。实验图像数据来自nyuv2公开数据库(http://cs.nyu.edu/~silberman/datasets/ nyu_depth_v2.html)中Kinect深度相机采集的图像。Kinect提供了两幅图像:RGB图像和深度图像,本文采用文献[11]中的方法对RGB图像和深度图像进行配准。

实验中,RANSAC算法采用OpenCV中的solvePnPRansac()函数实现。其中的三个主要输入参数:限制的最大迭代次数:100;阈值:1.0;最小内点数:100。这里的迭代次数和内点数量限制都是根据实践经验设置的,如果二者选取过小,算法收敛于正确结果的概率会降低。由于100个内点在本文实验中无法得到满足,故实验基本上都是迭代了100次,平均时耗稳定。

实验中选择三组图像,分别为相机位姿变化较小、适中和较大三种情况。分别应用RANSAC算法和本文算法对这三组图像进行处理。实验图像分别如图3、图4和图5所示。

  

图3 实验1:小位姿变化Fig.3 Experiment 1:Small pose change

  

图4 实验2:适中位姿变化Fig.4 Experiment 2:Moderate posture change

  

图5 实验3:较大位姿变化Fig.5 Experiment 3:Large pose change

图3~5中,(a)为对FLAAN算法匹配结果进行初步筛选的结果,实验一和实验二选择4dmin,实验三由于4dmin筛选后匹配点对太少,因此选择10dmin筛选。图中连接线的两端为两幅视图之间的匹配点;(b)为RANSAC算法的筛选结果;(c)为本文算法筛选结果。

三组实验的运行时间和计算结果如图表1所示。表中的真实值(True value)为经过SLAM系统后端优化后的结果,Inliers为算得到的内点数量,运行时间为程序运行200次的平均统计结果。相机位移的测量误差(Transl.Error)为位移矢量(Translation vector)和真实值的矢量距离,将三个欧拉角(Euler angle,角度制)Pitch、Yaw和Roll看作一个向量,计算该向量和真实值的矢量距离即为相机旋转的测量误差(Rot.Error)。

 

表1 实验结果Tab.1 Results of experiment

  

ExperimentsMethodsInliersRuntime/msTransl. vector/mEuler angle/(°)Transl.ErrorRot.Error1True value[0.020,0.022,-0.003][0.559,1.420,-1.385]Ransac16 27.849[0.040,0.006,-0.016][0.639,1.521,-1.433]0.0366880.616125Propesed algorithm193.392[0.046,0.006,-0.024][0.559,1.420,-1.385]0.0296360.6689192True value[0.097,0.001,-0.008][1.439,10.736,0.925]Ransac1231.591[0.088,0.002,-0.015][1.012,10.938,0.918]0.0111460.472804Propesed algorithm122.453[0.088,0.002,-0.015][1.012,10.938,0.918]0.0111460.4728043True value[0.105,0.016,-0.052][1.930,16.083,-0.059]Ransac2430.649[1.723,0.668,-0.016][10.444,47.429,-19.461]1.74586537.8343Propesed algorithm152.573[0.139,0.028,-0.046][1.107,15.274,-1.520]0.0370981.861073

由表1可知,当相机位姿变化不大时(实验1和实验2),本文算法与RANSAC获取基本一致的计算精度,但是在计算效率上,本文算法明显优于RANSAC,计算效率提高了8倍以上。在实验1中,两种算法得到了不一样的内点数,其主要原因是因为RANSAC的投影误差参数与本文算法筛选的距离度量值,不具有完全等价的几何意义,导致某些点在本文算法中认为是内点,而在RANSAC算法则认为是外点。从最终结果看,这些点并不太影响最终的估计结果。

在实验3中,由于相机位姿变化较大,初始匹配中外点比例较大,RANSAC算法出现了错误,其主要原因是因为solvePnPRansac()函数筛选时,是从图像点出发计算投影误差是否符合模型,而图像点对应的三维空间点并不唯一,因此出现如图3(b)所示的错误。而本文则直接应用空间点的三维距离对外点进行筛选,取到了比较好的效果。故针对深度相机的视觉SLAM而言,本文提出的方法在一定程度上增强了系统鲁棒性。

5 结 论

针对深度相机的姿态估计,本文提出了一种根据空间绝对距离筛选特征匹配的方法。将特征点描述匹配的距离信息,应有于后续的错误匹配筛选中。由此避免了迭代运算,提高了算法的运行速度。实验结果表明,和传统算法相比,运行时间提高了8倍以上。另外,由于场景中两点的距离与相机的转动和平移无关,因此,当相机转动角度较大时,算法的鲁棒性和准确性也优于传统的RANSAC迭代算法。最后,本文中提出的空间绝对距离筛选的方法,也可很容易推广到其他深度获取设备中,如双目相机、RGB_D摄像机和激光雷达等。

参考文献:

[1] M Kaess,A Ranganathan,F Dellaert.iSAM:Incremental smoothing and mapping[J].IEEE Trans.on Robotics,2008,24(6):1365-1378.

[2] Durrant-Whyte H,Bailey T.Simultaneous localization and mapping:part I[J].IEEE Robotics & Amp Amp Automation Magazine,2006,13(2):99-110.

[3] WU Mengqi,LI Zhongwei,ZHONG Kai,et al.Adaptive point cloud registration method based on geometric features and photometric features[J].Acta Optica Sinica,2015,35(2):229-236.(in Chinese)

伍梦琦,李中伟,钟凯,等.基于几何特征和图像特征的点云自适应拼接方法[J].光学学报,2015,35(2):229-236.

[4] Carlone L,Aragues R,Castellanos J A,et al.A fast and accurate approximation for planar pose graph optimization[J].International Journal of Robotics Research,2014,33(7):965-987.

[5] LI Xin,ZHANG Yueqiang,LIU Jinbo,et al.A direct least squares method for camera pose estimation based on straight line segment correspondences[J].Acta Optica Sinica,2015,35(6):203-213.(in Chinese)

李鑫,张跃强,刘进博,等.基于直线段对应的相机位姿估计直接最小二乘法[J].光学学报,2015,35(6):203-213.

[6] Fischler M A,Bolles R C.Random sample consensus:a paradigm for model fitting with applications to image analysis and automated cartography[J].Communications of the Acm,1981,24(6):381-395.

[7] LI Xin,LONG Gucan,LIU Jinbo,et al.Accelerative orthogonal iteration algorithm for camera pose estimation[J].Acta Optica Sinica,2015,35(1):0115004.(in Chinese)

李鑫,龙古灿,刘进博,等.相机位姿估计的加速正交迭代算法[J].光学学报,2015,35(1):0115004.

[8] Endres F,Hess J,Engelhard N,et al.An evaluation of the RGB-D SLAM system[C].IEEE International Conference on Robotics and Automation.IEEE,2012:1691-1696.

[9] Lowe D G,Lowe D G.Distinctive image features from scale-invariant keypoints[J].International Journal of Computer Vision,2004,60(2):91-110.

[10] Plimpton S.Fast parallel algorithms for short-range molecular dynamics[J].Journal of Computational Physics,1995,117(1):1-19.

[11] Lachat E,Macher H,Mittet M A,et al.First experiences with kinect v2 sensor for close range 3d modelling[J].ISPRS-International Archives of the Photogrammetry,Remote Sensing and Spatial Information Sciences,2015,XL-5/W4(5):93-100.

 
张一铭,吕耀文,徐熙平,吕梦凌,钟文婷
《激光与红外》 2018年第05期
《激光与红外》2018年第05期文献

服务严谨可靠 7×14小时在线支持 支持宝特邀商家 不满意退款

本站非杂志社官网,上千家国家级期刊、省级期刊、北大核心、南大核心、专业的职称论文发表网站。
职称论文发表、杂志论文发表、期刊征稿、期刊投稿,论文发表指导正规机构。是您首选最可靠,最快速的期刊论文发表网站。
免责声明:本网站部分资源、信息来源于网络,完全免费共享,仅供学习和研究使用,版权和著作权归原作者所有
如有不愿意被转载的情况,请通知我们删除已转载的信息 粤ICP备2023046998号