更全的杂志信息网

基于人体姿态信息的无人机人机交互实现*

更新时间:2016-07-05

0 引 言

为了使无人机(unmanned aerial vehicle,UAV)具有更广泛的用途,如何让无人机更加智能化成为了扩大无人机应用的关键。瑞士苏黎世联邦工业大学[1]设计的无人机使用计算机视觉实现了对未知地区的探索。香港科技大学的沈劭劼等人[2]通过激光测距仪与微软Kinect传感器对室内地图进行了重建,并在无人机上搭载嵌入式计算机实现自主飞行。随着计算机硬件技术的不断发展,人工智能技术也在近几年内取得了突破[3~5]。如果将最新的人工智能技术应用的无人机行业中,将能够大幅提高无人机的智能水平。

目前来看,无人机较为复杂的控制方式阻碍了消费级无人机的推广。本文提出了使用人体姿态信息完成与无人机的交互任务,并在机载嵌入式计算设备上完成了部署,达到了20帧/s的处理速度。通过使用该方法,用户可以抛开传统的依赖遥控器的人机交互方式,大幅提高了无人机使用的便捷性和自主智能程度。

25例患者中,4例腹腔干近端外压性狭窄,给予CTA检查得知腹腔干起始部位的1~2cm前上方造成锐利压迫,3例轻度狭窄,凹陷结构为V型,狭窄的远端轻度扩张或者不存在明显扩张现象,不存在侧支循环状态,1例为重度狭窄,为钩状狭窄形态,扩张了远端管腔,建立了肠系膜上动脉和腹腔干侧支循环。

1 人机交互流程

人机交互实现的核心是完成对人体姿态信息的检测与分类。传统的图像信息检测方法[6,7]运行速度慢,难以实现实时性。近年来,基于深度学习的检测算法[8]如Fast-RCNN等使用耗时较长的Selective Search算法[9]为分类器生成候选框(region proposals),如果能够找到一种生成候选框的替代办法,就能够将检测问题转化为分类问题,而分类问题的训练样本制作要简单得多。由于人体姿态信息通常为前景目标,本文采用前景信息生成候选窗口。

对于需要用汽车运输的矿岩,其运输车辆,根据本区矿岩性质特点、矿山采剥规模、当地气候条件,通过对国内矿用汽车生产状况、设备性能及在矿山使用效果的认真调查研究后,结合本矿区重载上坡运行的特点,推荐45 t矿用自卸汽车运输矿石,108 t矿用自卸汽车运输岩石。设备大型化后,作业人员少,既节能,运输成本也低,汽车等待时间短,单向行车密度较小,能提高运行速度,充分发挥运输设备的效率,减少安全隐患。

为了解决无人机回传图像存在抖动而难以进行背景建模的问题,使用模板匹配的方法对无人机的抖动进行了补偿。对补偿后的图像,使用改进的视觉背景提取(visual background extraction,ViBe)方法进行前景信息提取,并通过聚类的方法生成了可能存在人体姿态信息的候选框。串联了两个神经网络分类器完成人体姿态信息的分类任务。分别用于判断目标是否为人和对姿态信息的种类进行分类。无人机根据姿态信息的分类结果做出响应,完成人机交互任务。整个系统的工作流程如图1所示。

卷积层的计算公式为

图1 人机交互基本流程

2 人体姿态信息提取

2.1 无人机回传图像的稳定

多旋翼无人机在飞行悬停过程中受到气流的不稳定和控制回路的时延影响,机体会产生一定程度的震动和漂移,造成拍摄画面的不稳定,影响到后续算法对目标的检测与跟踪工作。无人机本身通过添加防震垫圈,为相机配备云台等手段从物理上减弱了震动。本文通过算法补偿无人机的震动与漂移。

通过实验与观察发现,无人机在悬停时图像中存在的变化主要体现在水平与竖直方向上的平移变化。在整幅图像中,实际位置会发生变化的前景目标只占一小部分,而占大部分区域的背景在稳定的图像中的位置应当维持不变。同时,由于无人机悬停时的漂移变化是小运动,因此,可以保证图像中间部分在下一帧当中依然出现。因此,只要将占图像大部分区域的背景匹配对齐,即可消除图像的水平与竖直方向上的平移变化。使用模板匹配法可以很好地解决这一问题。

对新采集的一帧图像,在图像上滑动与模板图像相同大小的窗口并计算二者的差异,可以获得在该位置上模板与图像的相似度。衡量相似度的标准为

本文采用差减法计算萤石中氟化钙含量。全钙的测定采用EDTA滴定法。关于碳酸钙的测定,本文在参考标准GB/T 5195.1—2006方法1、经验修正法和去碳酸钙的萤石样作空白校正法[8]的基础上,提出了一种新的方法。即分别称取两份不同质量的萤石试样,用稀盐酸浸取其中的碳酸钙,然后控制实验条件(溶液pH值、钙离子浓度、体积),使两份溶液中氟化钙溶解量趋于一致,对两份溶液进行干过滤,采用EDTA滴定法测定两份溶液中全钙的质量差(以碳酸钙计),经过换算可得试样中碳酸钙的含量。最终,实现了差减法对萤石中氟化钙的测定。

(1)

式中 R为模板在图像各个位置上的相似度,该值越小表明越相似;T为模板的像素值;I为图像原图的像素值。

对整个图像都进行遍历移动计算后,可以获得一个偏移相似度矩阵。求取该矩阵中的最小值,最小值所在的下标即为无人机震动造成的图像的偏移量。

2.2 使用前景信息生成候选框

人体姿态信息通常属于前景信息。为了获取前景信息,首先需要完成背景建模工作,主要解决无人机震动和光照影响。ViBe是一种像素级的背景建模、前景检测算法,具有较高的运行速度。通过对该算法进行改进,完成了对无人机悬停时拍摄的图像的背景建模。

首先对读入的图像进行稳定算法处理,消除无人机震动带来的图像抖动。采集前30帧图像建立背景模型。对每个像素点都建立长度为30的样本库,保存前30帧的样本信息。对后续的图像,逐个像素点与样本库比对并计算距离L

(2)

式中 L代表在读入图像像素点与样本库的距离,该值越大,表明该点越可能为前景;Ti为样本库中的第i个样本的像素值;I为输入图像在(x,y)处的像素值;1{·}为示性函数,当中括号中的条件为真时取1,否则,取0;θ为判断样本库与当前像素是否相似的阈值,根据实验取经验值20。

对获得的所有候选框提取出框内的图像信息并进行分类,为了保证目标完整的出现在框内,对候选框的长宽放大1.2倍,再将框内图像送入分类器分类。

3 人体姿态信息分类

3.1 目标类别分类器设计

若计算L<10,将该点视作背景;否则,归为前景。为了适应户外光照的变化,对ViBe方法的背景模型更新策略进行了改进。当该点归为背景时,使用该点的像素值替换样本库中在时间上最老旧的样本,加速陈旧信息的消除,以适应光照变化。计算完成后可以获得一幅与输入图像大小相同的二值图像,其中前景像素点值为1,背景像素点值为0。对该图像进行聚类处理,可以生成可能含有目标的候选窗口。本文使用非极大值抑制消除位置重叠的候选窗口。

核密度估计是空间分析中常用的非参数估计方法,它借助动态单元格(相当于窗口)计算要素在其周围邻域中的密度[23]。核密度估计概念简洁、表达直观能清晰直观的表现农村居民点的空间分布差异特征,其值越高表示农村居民点分布越密集,反之则分布的越稀疏。核密度估计的方程为:

为了获得较好的分类效果,除了要获取人体所在区域信息之外,还需要尽可能准确地预测出人体的轮廓,去除周边背景等因素的干扰。由于之前的目标检测过程中已经进行了背景建模,本文采用前景信息获取的方法剔除背景因素的干扰,既能够提高分类效果,也能够减少计算开销,提取后的姿态信息如图2(b)所示。

1)输入层与数据预处理

本文主要研究对站立人体的分类,因此,使用输入尺寸为128×64的红绿蓝三原色(RGB)彩色图像能够较好地保留人体的特征又不会占用过多的空间。

由于采集的图像的高度与宽度不定,使用双线性插值将图像缩放到与输入层相同的大小。为了保留图像的边缘特征,不对缩放后的图像进行滤波处理。受到光照,拍摄条件等因素的影响,不同的图像数据间还可能存在偏差,因此,对缩放后的图像进行去均值处理。计算所有样本的图像的各个通道中每个像素点的均值,每个输入样本均减去该均值。

2)卷积层与池化层提取特征

本文基于企业异质性理论,在三元边际的分解框架下,利用2007~2017年联合国商品贸易(UN Comtrade) 数据库中 SITC (Rev.3) 第7类四分位产品的贸易数据,分析了 “一带一路”沿线各国物流绩效对中国机械运输设备出口三元边际的影响。研究结果表明:

(3)

经过实验测试,发现使用2层的全连接神经网络进行训练即可够获得很高的分类准确率,并且相较于复杂的卷积神经网络,该方法的计算开销与运行时间亦显著降低。

采用池化操作可以降低特征维数,并使网络具备平移不变性,抵抗数据的平移。池化层通常接在卷积层之后,将N×N区域的特征聚合到一个特征中。本文采用最大值池化。

3)全连接层与输出层

卷积神经网络在最后一层池化层后连接了多层全连接层用于完成特征序列到分类类别的映射,最后一层使用Softmax分类层输出各类别的概率。

股骨颈骨折术后要恢复患者髋关节功能,需配合有效的功能锻炼。常规功能康复训练对于老年术后患者应用效果有限[1]。并且大多数老年患者术前多合并糖尿病、高血压等疾病,长期卧床更易导致肌肉萎缩、下肢深静脉血栓等并发症发生。所以,在本研究中,针对手术治疗的股骨颈骨折患者应用阶段性康复功能训练,以期提高患者预后,现报告如下。

3.2 人体姿态分类器设计

定义4种容易摆出并且区别较大的姿态,如图2(a)所示。为了保证无人机使用的安全性,需要设计姿态作为无人机对人体姿态信息的响应开关。将图2(a)从左到右4个姿态对应的无人机指令设计为:开启无人机对人体姿态信息的响应;关闭无人机对人体姿态的信息的响应;向右飞行,向左飞行。

图2 人体姿态数据集

由于该分类器仅考虑解决二分类问题,选择使用AlexNet网络训练人体目标分类器。

式中 l为卷积神经网络的层数;k为卷积核;M为卷积核在上一层的感受野;b为卷积核的偏置。AlexNet网络含5个卷积层。其中第一个卷积层卷积核大小为11×11,第二个卷积层为5×5,后面三个卷积层卷积核大小均为3×3。

4 实验与验证

4.1 无人机实验平台搭建

使用飞越Tarot 650四旋翼无人机机架和Pixhack开源飞控为主体搭建了一架无人机,并在无人机上搭载了Gopro相机,双轴云台和Odroid XU4嵌入式计算机。Odroid-XU4使用2.0 GHz基于ARM架构的处理器作为运算单元,拥有2 GB内存空间和64 GB存储空间,具有强大的计算能力,较低的功耗和小巧的封装尺寸,十分适合作为机载嵌入式计算设备。

该无人机的相关参数指标:最大飞行速度为54 km/h,最大飞行高度为1 000 m,最大数据传输距离为2 km,姿态测量精度为1°,水平方向定位精度为1 m,垂直方向定位精度为1.5 m,最大起飞重量为4 kg,空载重量为2.9 kg,续航为空载20 min,满载12 min,对角电机轴距为650 mm。相关参数基本满足实验需求。

4.2 图像稳定处理

对获取到的图像进行去抖动稳定处理。图3(a)所示为无人机上拍摄到未经稳定算法处理时临近2帧差分的结果,图3(b)为经过稳定算法处理后临近2帧差分的结果。可以明显发现:在图3(a)中由于无人机的震动导致了画面后方的栏杆在相邻两帧间出现了明显的位移,而图3(b)中两帧的栏杆基本已经重合,证明了算法实现了对无人机的震动对图像造成影响的补偿。

文不在繁,贵在简。《摘编》收录了总书记十八大以来关于扶贫工作的8个专题242段经典论述,一字一句无不字字珠玑、句句经典。《摘编》(二)中“农村要发展,农民要致富,关键靠支部”短短15字,指出了脱贫攻坚工作必须夯实党的领导政治保障、抓好组织建设促脱贫攻坚,在基层组织建设、选人用人上夯实脱贫攻坚基础;《摘编》(三)中提到“要一家一户摸情况,张家长、李家短都要做到心中有数”,寥寥数语,简短实在,道出了“贵在精准,重在精准,成败之举在于精准”的重要性和关键性。

在我国悠久的历史长河中,玉雕工艺一直是让我们引以为傲的一门手艺,但原料大多数以翡翠和田玉玉石为主,若在硬度仅次于钻石的蓝宝石上雕刻,那绝对是一件十分考验工匠能力的事情。而就在“中国蓝宝石之都”的昌乐,有这样一位堪称“国家级”的蓝宝石雕刻大师——刘海。可以说,是昌乐蓝宝石成就了刘海的雕刻之路,而刘海的雕刻艺术又让昌乐蓝宝石的光芒更加闪耀。

图3 图像稳定算法效果

4.3 前景信息提取与候选框生成

在无人机悬停并且成功对背景进行重构的情况下,可以利用前景信息完成目标检测任务。图4(a)为无人机拍摄到的一帧原始图像,图4(b)为使用改进的ViBe法提取到的前景信息。为了实现多目标检测,图像划分为8×6个区块,对每个区块统计可能含有前景目标的概率。图4(c)为对4(b)进行概率统计后的结果,图中可能含有前景目标的区块用黑色标识。图4(d)为对图4(c)的可能区域进行聚类操作并使用非极大值抑制剔除重复框后得到的结果,可见该方法能够较好地完成目标检测任务。

图4 候选框生成

4.4 目标种类分类器

为了简化问题并提高稳定性,仅对站立的人进行分类,而行人的特征与本文要求一致,因此,使用INIRIA INRIAPerson行人数据集作为训练样本进行训练。INRIAPerson数据集的训练集中包含614张含有行人的正样本图片和1 218张不含行人的负样本图片,图片中人体大部分为站立姿势且大于100个像素。

图5为目标种类分类器的训练过程。在经过2 000批次的迭代训练后,网络在INIRAPerson数据集上分类准确率达到97.6 %。整个训练过程中损失函数变化如图5(a)所示,分类准确率变化如图5(b)所示,发现,经过1 500次迭代后,网络已经趋于稳定。

我从大连返回济州。逃学一个月了,系里还不知道,只有宿舍的人知道。他们对我很关心,问我家里的事是否处理完了。我说完了。他们说不是你家里有事吧,一个漂亮女孩来找你,你是跟她走的,对不对?她是你女朋友吗?好啊老李,你个浪驴,重色轻友。

4.5 人体姿态分类器

对图3的每一种姿势,均采集了1 200张图像,不同的图像间手张开的角度和拍摄角度均有一定的不同,并采集了2 000张其他不同的姿势作为背景样本。将1 200张图像其中1 000张作为训练集,另200张作为测试集,送入一2层的全连接神经网络进行训练,在训练前对所用样本均进行了去均值处理。经过每批次100张图片输入,共400次迭代后,分类器的分类正确率达到了99.7 %,整个训练过程中分类准确率与损失函数变化分别如图5(c)和图5(d)所示。

图5 分类器训练结果

4.6 算法运行效率分析

为了验证本文方法在嵌入式计算机上的实时性,对整个系统各个环节的运算耗时进行了统计,并与当下流行的用于检测任务的Faster R-CNN进行了对比。对本文各算法部分在Odroid-XU4上处理一张大小为640×480的RGB图像所花费的时间统计,图像稳定为16.7 ms,前景信息提取为23.6 ms,目标种类分类器为12.2 ms,人体姿态分类器为2.4 ms,单张图片耗时总计为54.9 ms。

定理6 设内交换群G=PQ,其中P为正规Sylow p-子群,Q为循环Sylow q-子群,|G|=pnqm,则其幂图P(G)的独立数β(P(G))≥q+1且等号成立当且仅当以下情形之一成立:

整个系统在Odroid-XU4上可以达到约20/s帧的处理速率。而Faster RCNN检测算法由于在机载嵌入式计算机上缺乏GPU计算资源,处理一张图片平均需要花费19 s,处理速率十分低下。通过对比可见,相比目前的卷积神经网络检测算法如Faster RCNN等本方法在运算速度上有很大优势,具有实际应用价值。

5 结 论

设计了一种采用人体姿态信息完成无人机人机交互的方法。整个系统能够在机载嵌入式计算机上实现实时性,大幅提高了无人机的自主智能程度。

参考文献:

[1] Fraundorfer F,Heng L,Honegger D,et al.Vision-based autonomous mapping and exploration using a quadrotor MAV[C]∥IEEE/RSJ International Conference on Intelligent Robots and Systems,IEEE,2012:4557-4564.

[2] Shen S,Michael N,Kumar V.Autonomous indoor 3D exploration with a micro-aerial vehicle[C]∥IEEE International Conference on Robotics and Automation,IEEE,2012:9-15.

[3] Krizhevsky A,Sutskever I,Hinton G E.ImageNet classification with deep convolutional neural networks[C]∥International Conference on Neural Information Processing Systems,Curran Associates Inc,2012:1097-1105.

[4] Everingham M,Gool L V,Williams C K I,et al.The pascal visual object classes (VOC) challenge[J].International Journal of Computer Vision,2010,88(2):303-338.

[5] 田渊栋.阿法狗围棋系统的简要分析[J].自动化学报,2016(5):671-675.

[6] Forsyth D.Object detection with discriminatively trained part-based models[J].IEEE Transactions on Pattern Analysis & Machine Intelligence,2010,32(9):1627-1645.

[7] Dalal N,Triggs B.Histograms of oriented gradients for human detection[C]∥IEEE Computer Society Conference on Computer Vision and Pattern Recognition,CVPR 2005,IEEE,2005:886-893.

[8] Girshick R,Donahue J,Darrell T,et al.Rich feature hierarchies for accurate object detection and semantic segmentation[C]∥Computer Vision and Pattern Recognition,IEEE,2014:580-587.

[9] Uijlings J R R,Sande K E,Gevers T,et al.Selective search for object recognition[J].International Journal of Computer Vision,2013,104(2):154-171.

杨喆,伊国兴
《传感器与微系统》2018年第6期文献

服务严谨可靠 7×14小时在线支持 支持宝特邀商家 不满意退款

本站非杂志社官网,上千家国家级期刊、省级期刊、北大核心、南大核心、专业的职称论文发表网站。
职称论文发表、杂志论文发表、期刊征稿、期刊投稿,论文发表指导正规机构。是您首选最可靠,最快速的期刊论文发表网站。
免责声明:本网站部分资源、信息来源于网络,完全免费共享,仅供学习和研究使用,版权和著作权归原作者所有
如有不愿意被转载的情况,请通知我们删除已转载的信息 粤ICP备2023046998号