更全的杂志信息网

BP神经网络的枪声识别

更新时间:2016-07-05

在现代战争中,狙击战术有灵活方便的作战技术,在作战过程中无需较大空间并且杀伤力强,因此在狙击战术中狙击手有着重要作用,他们能够高效地击毙敌方人员,摧毁对方的设备,压制敌方火力。在常规的作战中,隐藏在暗处的狙击手能给部队极其重要的威慑力,为了保障己方的安全需要在最短时间内发现隐藏的狙击手并且准确及时的将其制伏。在狙击战争中,最大的障碍与威胁就是来自于对方军队所布置在潜伏于暗中的狙击手[1]

人们早在很久前就已经根据声音进行探测加以利用,因此发展成为一门非常古老的学科。在现代战争中,早在二战时期就开始应用声音对目标探测,并且起到了非常重要的作用,该技术对接收到的声音探测经过处理识别最终定位,最终确定出敌方的火炮和潜艇[2]。因此研究了被动声探测技术,以达到对目标的噪声识别、定位和跟踪的目的。

本文是由MATLAB软件完成,将接收到声音信号经过一系列的处理再用短时傅里叶变换对其提取特征参数,在MATLAB上构建了BP神经网络算法对声信号进行识别判断。

1 枪声信号识别

枪声信号识别是将收集到的声音信号经过不同算法的处理使得输入的声学信号以数字信号的形式输出,再用数字处理的方法对待测信号进行特征提取,常用的处理方法有傅里叶变换、小波变换等,从而获得待识别声音信号的特征[3]。接着匹配得出的特征信号,特征信号同参考特征模型对比(特征模型是已知的预先得到的),最终得出识别结果,识别流程图如图1所示。

图1 枪声识别过程

1.1 声音预处理

对训练样本进行特征分析,获取训练数据的原始特征参数,这些参数可以是直接测量得到的数据也可以是作某些计算得到的值[4]

包括去噪,带通滤波,模数转换,基元选取和端点检测等,这些都对预处理后的特征提取和声音识别有一定影响,所以在不同的应用条件下要做不同的选择。

虽然上述色散-耗散条件出自空间导数的线性有限差分格式及标量对流方程, 但是下节将显示它用于更一般的非线性格式和更复杂的流动问题的可行性.

1.1.1 预加重

加窗处理每一帧信号,汉明窗,汉宁窗及矩形窗等都是常用的窗函数。根据与其它窗对比,汉明窗在抑制频谱泄露方面的效果较好,与其它窗函数比较其频率特性较适合信号分析,所以,经过对比其它窗函数最终选定汉明窗作为本次使用的窗函数,对信号加权处理,汉明窗的函数公式为:

预加重使信号在整个频带中都较为平坦,不论是在低频还是高频都保持平坦,将信号高频的部分提升,信噪比提高是其主要目的功能 [5]。声音信号s(n)以数字化的形式通过数字系统实现预加重,该系统为低阶系统,一般选用一阶的FIR滤波器。该数字系统是固定数字系统,或者是缓慢自适应系统。本系统所使用的预加重器是固定的一阶系统,为目前应用较广泛的一阶系统,其传递函数为:

本系统对声音信号的预处理步骤为:对接收到的信号进行预加重处理,其次对信号分帧,将分帧后的信号加窗最后检测信号的端点。在进行预处理单位的过程中,其中输入是通过对原始的声音信号进行采样,然后对采样得到的信号中,对于非声音频段的帧频声信号进行去除处理。

(1)

这里预加重的输出s′(n)通过下面的差分方程式与系统的输入相关:

(2)

1.1.2 分帧

分帧就是用窗口来截取信号,从而构成分析帧,这里的窗口长度有限并且可移动,分帧的目的是为了得到“短时”声音信号。可以表示为用一定的窗函数[6]。加窗音频信号式中s(n)为声音信号ω(n)为窗函数。

1.1.3 加窗

定义:给定一个时间宽度很短的窗函数r(t),令窗滑动,则信号x(t)的STFT定义为

式中,Φn(κ)表示湍流空间功率谱,η表示传输距离从0积分到L,κ表示极坐标下的二维空间频率,φ表示κ所处极坐标的角向参数,wi表示束腰半径w的虚数部分.

(3)

特征参数提取的目的是在大量的原始数据中求出最有效的目标特征数据,降低数据维数,便于进行识别。通过对声音信号的采样,我们可以得到声音的时域信息,但是如果进行声音识别,往往需要频域分析。频域分析的目的是把复杂的时域波形经过变换分解为若干个谐波分量来研究,以获得声音的频率结构。

本文通过座舱泄压计算为民用飞机是否设置驾驶舱门泄压板提供了判断准则,同时提出了一种驾驶舱门泄压板面积评估和确定的计算方法,为驾驶舱门泄压板的尺寸选择提供了设计依据。本文中所提出的全机泄压计算模型、计算方法以及判断准则除应用于驾驶舱门泄压板的设计外,还适用于民用飞机增压舱内货舱泄压板,货舱压力平衡活门等相似作用的释压口盖尺寸设计和计算。

(4)

1.2 端点检测

在声音识别过程中,最为重要的一步是对端点处进行检测,其结果将影响到系统识别的性能。所谓端点检测,就是在一段声音数字信号中确定出声音的开始和结束位置,将与系统识别无关的背景信号和噪声信号进行剔除,减少特征提取和比较阶段的计算量[7-8]

端点检测通常有基于短时能量、基于短时过零率、基于倒谱特征和基于谱熵等方法,其中基于短时能量和过零率是使用最多也是最易于实现的方法。

无论是周公制礼所中“则(礼)—德—事—功—民”的序列,还是叔向的“威严—礼序—经业—百事”的逻辑,都表达为一种“事/利”与“礼/德”相互关联的序列,属于对“正德、利用、厚生”的更有逻辑的推说。这反映的是西周“德政”文化之下充满事功色彩却又不乏伦理追求的政治传统,以及这一传统在春秋时期朝向民本思想方向的有力发展。同时,经济活动的繁荣、传统礼乐制度的破坏在实际中加深了这样一种理想序列断裂的危险,“礼”与“利”的辨证成为春秋时期的一个重要问题。《国语·周语上》载芮良夫之言:

将经过加窗处理后的声音信号求短时能量,用En表示第n帧的短时能量,所得结果等于该段信号取样值的平方和,其计算公式如下:

众所周知,具有相应的学习能力与职业技能决定着个体的生存状态,它也直接关系到个体的生活质量和生命尊严。因为,经济弱势的背后,实际上是基本能力和权利的缺失。诺贝尔奖获得者阿玛蒂亚·森提出了两个概念:收入贫困和能力贫困。他认为,贫困是指剥夺人的基本能力和权利,而不仅仅是低收入[1]。在此意义下,成人能力提升的培训具有社会保障价值。这是因为通过成人培训可以实现社会保障的基本特性,即人作为存在应当享受的生存权、学习权、幸福权等,从而满足作为价值主体的人的所具有的安全的需要、发展的需要和价值实现的需要。成人能力提升的培训与社会保障这两者之间需要与满足需要的关系,也决定了其相关政策之社会保障价值之所在。

(5)

1.2.2 求取短时平均过零率

当相邻两个采样值的符号不同,就存在一次过零,所以过零率是在单位时间内信号过零的次数[9]。短时平均过零率在一定情况下是对时变频谱信息的一个描述。计算短时过零率Zn是将声音信号经过窗函数对信号加权处理,其计算公式如下:

(6)

其中ω(m)是窗函数,N为窗宽,且

(7)

2 声音特征提取

其频率特性为:

2.1 短时傅里叶变换

短时傅里叶变换(STFT),在研究非平稳信号中式应用最广泛的方法。基本思想:首先为了方便计算先将信号划分为许多间隔,这些小间隔是以时间为单位划分成的,其次对每个时间间隔做傅里叶变换分析结果,最终得出在每个时间间隔所存在的频率,这些频率构成的频谱在整体上表现出了频谱在时间上的变化形式。所以,信号的观察由间隔窗口观察从而引出STFT。

初心如磐,奋楫争先。在平凡而又艰苦的岗位上,郝哲严谨求实、敬业奉献,用行动诠释了一名共产党员的担当,用奉献履行了全心全意服务“三农”的工作使命,用高尚的品格和优良的作风实现了个人的人生价值。郝哲忘我的工作精神和取得的丰硕成绩得到各级领导和服务对象的高度赞誉。

STFTx(t,f)=[x(t)r*(t-t)]e-j2πftdt (8)

从公式中可以看出信号的STFT为在时间t处,接收到的声信号x(t)乘以时间较短的“分析窗”r*(t-t) 作为该接收信号的傅立叶变换值,这里就相当于,输出信号的值等价于t=t周围的一个切片,因此,x(t)是在时间t附近,接收到的声信号的局部频谱 [10]

1.2.1 求取短时能量

2.2 BP神经网络

人工神经网络是根据人脑神经元处理信息的方式对神经网络做一个简单的抽象建模,神经网络与大量神经元进行连接,能够进行复杂的逻辑操作。BP神经网络是一种按照误差逆向传播算法进行训练,其网络模型拓扑结构有输入层、隐层和输出层,是目前应用最为广泛的神经网络[11]

3 结果分析

声音信号的采集是在是在爆炸洞中完成,通过多次打靶,采用多种方式进行打靶,例如连续射击和间断射击有无噪声等多种情况采集现场声音,将收集到的声音信号在电脑上处理。处理过程如下。

“小表姐正生气二表哥偷懒,却听见柴垛的后面有响动,然后,居然听到了女人的喘息声。小表姐的脸色变得难看起来,已经是大姑娘的她,知道那是什么声音,于是奔到柴垛后面一看,呆住了。

首先将采集到的声音信号进行分帧与加窗处理。如图2。

图2 分帧和加窗

接着对处理过的信号进行短时傅里叶变换得到如下时频图。

相对密度作为多胞材料最重要的参数,讨论相对密度对于泡沫铝材料的动态力学性能的影响具有重要的意义。图9(a)和(b)分别为三种相对密度下的动态初始压溃应力和应变硬化参数随初始冲击速度的变化曲线。由图可见随着冲击速度的不同,不同相对密度的泡沫铝会在某一个值附近上下震荡,但对于同一相对密度的泡沫铝可以认为两个参数均固定不变。

图3 短时傅里叶时频图

最后训练神经网络。将已知的枪声信号作为训练样本对神经网络进行训练,将以上处理过后的声音信号与已训练好的神经网络进行对比,得出结论。

曹妃甸港信息化服务平台是港口推进智慧港口进程的重要举措,更是港口发展战略落地的关键载体。在平台的设计中进行系统性、全局性和战略性地谋划,注重开放性与共享性,建立全港统一的标准数据中心,实现信息系统的有效整合。通过平台的建设,促进港口信息化进一步纵深融合发展,为港口的发展提供技术支撑[1]。

神经网络的训练如图4,由于初始权值是随机赋值的,所以每次训练结果不同。训练10次,选取误差最小(E=0. 56724)时的网络作为最终训练成功的神经网络,得到输入层到隐层之间的权值矩阵inputWeights和隐层到输出层之间的权值矩阵layerWeights,保存最优权值。

图4 BP神经网络训练结果图

从以上结果看出,本文所采用的BP神经网络识别算法对枪声的识别率达到80%以上,实现了枪声的识别。相对于其他识别方法,此方法更简单,识别率高,误差小。

参考文献:

[1] 李承选.狙击手探测系统:让狙击手无所遁形[J].现代军事,2005(11),52-55.

[2] LAWRENCE RABINER, BIING HWANG JUANG. Fundamentals of Speech Recognition[J] Prentice Hall PTR,1999(6):105-112.

[3] 焦李成.神经网络的应用与实现[M].西安:西安电子科技大学出版社,1998:20-40.

[4] 飞思科技产品研发中心编著.MATLAB 6.5辅助小波分析与应用[M].北京:电子工业出版社,2003,121-130.

[5] 韩力群.人工神经网络理论、设计及应用[M].北京:化学工业出版社,2007:53-69.

[6] 王炳锡,屈丹.实用语音识别基础[M].北京:国防工业出版社,2005:88-102.

[7] 韩力群.人工神经网络理论、设计及应用[M].北京:化学工业出版社,2007,95-123.

[8] 张小宁.基于小波变换和神经网络的口标识别技术的研究[D].济南:济南科技大学,2003:134-156.

[9] 侯亚丽,李铁.基于LM优化算法的BP神经网络日标识别力法[J].探测与控制学报,2008,30(2):53-57.

[10] 周开利,康耀红.神经网络模型及MATLAB仿真程序设计[M].北京:清华大学出版社,2005:70-82.

[11] HE Y,JIN B H,Lv Q S. Improving BP Neural Network for the Recognition of Face Direction [C]. International Symposium on Computer Science and Society,2011:79-82.

全璐,侯文,李秉臻,刘宏斌,叶垯诚
《电声技术》 2018年第02期
《电声技术》2018年第02期文献

服务严谨可靠 7×14小时在线支持 支持宝特邀商家 不满意退款

本站非杂志社官网,上千家国家级期刊、省级期刊、北大核心、南大核心、专业的职称论文发表网站。
职称论文发表、杂志论文发表、期刊征稿、期刊投稿,论文发表指导正规机构。是您首选最可靠,最快速的期刊论文发表网站。
免责声明:本网站部分资源、信息来源于网络,完全免费共享,仅供学习和研究使用,版权和著作权归原作者所有
如有不愿意被转载的情况,请通知我们删除已转载的信息 粤ICP备2023046998号