更全的杂志信息网

基于麦克风阵列的语音增强与干扰抑制算法

更新时间:2016-07-05

1 引言

随着社会的快速发展,语音通信作为最直接、最有效的通信手段受到人们地广泛关注,人们对语音通信质量的要求也逐渐提高。在实际的语音通信环境中存在着各种各样的噪声干扰,这些干扰严重影响了语音通信的质量[1]。因此,为了提高语音通信的质量,语音增强技术一直是语音信号处理领域中的热点问题。语音增强是指从噪声背景中提取有用信号,抑制、降低噪声干扰的技术,即从带噪语音中提取尽可能纯净的原始语音信号[2]

麦克风阵列信号处理技术能够充分利用语音信号的空时信息,已经成为研究语音增强的热点所在[3-5]。目前常用的经典麦克风阵列语音增强方法包括固定波束形成、自适应波束形成、盲信号分离以及后置滤波等[6]。其中,固定波束形成算法最早由Flanagan[7]提出,是最经典的空域处理方法,也是其他方法的基础,该算法通过对各麦克风阵元接收到的信号进行时延补偿,使得各通道输出信号在某一方向上保持同步,并且在该方向的入射信号获得最大增益[8]。该方法相对简单并且易于实现,但对于干扰信号的屏蔽效果不是很好。如果只做波束形成,增强后的声源信号中仍然有干扰信号的存在。此外,当前的研究主要是基于纯空域处理技术,未利用到时频信息,性能受限。本文在固定波束形成技术的基础上做了改进,在频域上构造新的加权函数,提出了空域波束形成-频域加权的空频联合处理算法,从而进一步对干扰信号进行抑制。由于利用到频率信息,所提出的算法能够更有效的抑制干扰。

(2)如果渗漏而积不大时,在渗漏的而积上先用水枪及钢刷擦净井壁表而浮砂、灰土;然后补刷或喷涂专用的防水砂浆。防水砂浆有固定的成品或用防水粉加水泥自行拌制成防水砂浆。使用时应按产品说明要求进行,使防水砂浆能渗入混凝土内产生某种化学作用,改变混凝土的密度,使其有抵抗水分的渗入。

2 传统的固定波束形成算法

传统的波束形成可以描述为作用于传感器阵列输出的空间滤波器,构造特定的波束方向图。这种空间滤波过程可以分为两步:时间对齐和加权求和。以简单的延迟-相加波束形成为例,第一步首先根据每个麦克风阵元与参考点之间的到达时间差,对每个阵元信号进行相应的时移。第二步是将时移后的信号相加[9]

还原剂与烟气混合的均匀性好坏取决于喷射系统,喷枪使用压缩空气将还原剂溶液以雾状按照一定的角度、速度和方向喷入炉膛与烟气混合。还原剂与烟气混合不均匀带来较低的脱硝效率可从以下几个方面改善:(1)增加喷入的雾化颗粒的动量;(2)增加喷枪数量;(3)增加喷射区域;(4)改善喷枪的性能来获得最优的雾化颗粒直径、分布、角度和喷射方向。这是本次改造主要考虑的方向和措施。

式中,下标“a”表示时间对齐后的阵元信号。将时移后的信号加权求和,得到波束形成的输出为:

(1)

式中:

xfm=u(t)cos[2πfmt+v(t)]

(2)

式中,xfm是以fm为中心频率的窄带信号,u(t)为慢变化的幅度调制函数,v(t)为慢变化的相位调制函数。

理想情况下,第i个麦克风,在时刻k的阵列输出可表示为:

Xi(k)=αix(k-t-τi)+ni(k)

(3)

式中,x(t)为源信号,i=1,2,…,Mτiαi

在本研究中原先设立了一种假设,就有形和无形的因素,超市供应链参与者农民比非参与者农民要过得好。由于农民采用的市场渠道,定量分析没有揭示销售、收入、业绩和整体状况的显著差异。然而,在超市供应链销售的农民比即时交易市场中的农民更满意并且获得相对较高的售价。此外,定性信息表明,以评估条款为标准,在超市供应链销售的农民过得比即时交易市场中的农民要好,但是,关于影响程度需要进一步的分析以达到结论性的结果[5]371-388。

ni(k)分别为从声源到第i个麦克风的延迟、幅度衰减和干扰信号。对其进行采样,采样频率为fs,采样点数为N,第n个采样点时刻的输出为:

由此,我们便构造出加权系数Wn,从式(16)可以看出:频域上,对声源信号波束形成输出进行系数加权时,如果某一频率上声源信号中存在的干扰信号较大,权值系数Wn便会减小,从而该频率的声源信号在一定程度上被削减;干扰信号小的频点上的声源信号被保留。通过这种方法,频域上系数加权可以有效地抑制干扰信号。

(4)

式中,Ts=1/fs, n=1,2…N

假定阵元i的位置向量为:

从近年全国高校艺体类本科专业的招生录取情况来看,就整体而言,学生的高考英语成绩普遍较低且个体差异显著,这种状况在新升格的本科院校中尤为突出。例如,笔者对自己所在的阿坝师范学院(该校于2015年4月经教育部批准由省属高等专科学校升格为省属公办普通本科院校)2017级环境设计、音乐学、体育教育338名本科学生的高考英语成绩进行了分析(数据来源于该校教务处),其结果如下表所示:

Ri=(rxi,ryi,rzi)

智慧城市的建设并不只是云计算和物联网技术的提升,还需要有大量的资金投入。智慧城市是一个全新的理念,其核心是将信息资源当作重要的生产要素来有效地推动城市经济的转型和升级,从而为经济社会的发展竞争创造一种新的优势。但是,当前我国智慧城市的建设还没有形成国家层面的一种全面的战略机制。在国家层面依然存在一些管理职责混乱的现象,各智慧城市的建设基础参差不齐,并且低水平建设和实用主义现象普遍存在,造成智慧城市投入成本较高,却无法提高资源利用率[3]。

(5)

式中,rxi=risinφicosθi,

再将频域信号转换到时域,得到第n帧系数加权后的声源信号:

式中,m是帧同步的时间序号,m=1,2,…,NN为帧长。最后合成所有帧信号得到系数加权后的输出信号。

令导弹第一次被测量到的时刻为参考时间 t=0,其余各测量时刻为ti,对应的实时距离为Ri,那么式(5)可表示为

r=(sinφcosθ,sinφsinθ,cosφ)

(6)

式中,φ,θ为信号源的俯仰角和水平角。以原点为参考点,设该点接收信号为x(t),则阵元i接收到的信号相对于原点的时间延迟[10]为:

(7)

式中,c=340 m/s。根据以上求得的时间延迟对信号进行时移:

大学生进行项目开发实践,先通过一系列课程的补充,基础知识得到进一步梳理和重新构建;通过项目实践解决问题,实践能力得到提高;撰写论文和专利,得到最终的成果。实践证明,以项目开发为主线的跨学科培养模式,有利于建立跨学科的学生科研团队,有利于学生实践能力、创新能力的培养。

Xa,i(n)=Xi(n+τi)

(8)

假设语音信号为x(t),其由M个窄带信号叠加而成,表达式可记为:

式中,i=1,2,…,M

(9)

(3)要对各种管道配件的外形、尺寸“心中有数”,尤其是大口径的管道配件,不但安装时占用的空间大,还需要一定的操作空间,因此布置时一定要核对尺寸,不能盲目布置。配件的外形、尺寸等参数可以从有关手册、标准图和厂家的技术资料中查到。

3 改进的空频联合处理算法

在传统纯空域波束形成的基础上,本文提出了空频联合处理方法。空频联合处理算法框图如图1所示,即增加了频域上的加权处理,通过空频联合处理更加有效地对语音信号进行增强。本算法假设麦克风阵列位于声源的远场,如此可近似地认为收到的信号为平面波。声源信号和干扰信号的方向可以通过DOA[11-13]估计或其他测向方式获得,已知信号方向。

图1 空频联合处理算法框图

3.1 算法结构

1)空域:延时-求和波束形成

与上一部分介绍的传统固定波束形成相同,首先根据每一个麦克风与参考点之间的时延,对麦克风接收信号进行时移,使各路输出信号在某一方向上对齐。然后将时移后的信号相加,针对声源信号与干扰信号分别形成两个波束形成输出。

2)频域:系数加权

将两个波束形成后的输出从时域转换到频域并构造加权系数,利用加权系数乘以频域上的声源信号,进一步地消除干扰信号以增强声源信号。

式(16)表明:协同成员pi的知识掌握程度W(pi,K)可表示为协同成员pi与其所掌握的知识点之间的边权权重之和;协同成员pi与其他成员间的关联关系强度W(pi,P)可表示为协同成员pi与其所关联的其他协同成员之间的边权权重之和。

3.2 加权系数的构造

空域上,利用延迟-相加波束形成算法,分别得到指向声源信号s(t)以及干扰信号I(t)的两个波束形成输出Zs(n)、ZI(n):

多年来,我们的教育似乎只重视“成功教育”而忽略了“苦难教育”,当代大学生似乎只有从爷爷奶奶那里才能听到一点“过去的故事”。独生子女们对衣来伸手、饭来张口的生活习以为常。针对当前大学生生存能力普遍较差的特点,高校必须加强对大学生的自身能力训练,磨炼其意志,提高其生存能力和动手能力。可以把大学生带出去,通过做社会志愿者,去西部山区支教等方式,让其真正体会到生活的艰辛和社会的多样化。还可以组织大学生参加拓展活动,提升生存能力,培养团队精神。

(10)

(11)

式中,n=1,2…N,为时域采样点序号。对波束形成后的输出进行加窗分帧[14]

自2001年《俄罗斯政党法》开始,在普京各项改革法令举措下历经十数载的演变发展,俄罗斯一党独大、多党并存的政党政治框架日趋成型,在国家杜马中也形成了相对稳定的政党格局,其组成为包括政权党统一俄罗斯党在内的四个主要的议会内政党。毋庸置疑,这对推进俄罗斯的民主化进程大有裨益、有利于政党政治规范的良性形成及政党运行的法制化形塑。〔3〕在保障俄政治体系由权威向民主的平稳过渡、为俄政治现代化保驾护航层面,这一政治架构的正向作用是无可置疑的,政党与制度日益相辅相成。

Zs,n(m)=W(m)ZS(n+m)

(12)

ZI,n(m)=W(m)ZI(n+m)

(13)

式中,W(m)为窗函数,n是帧序号,m是帧同步的时间序号,m=1,2…NN为帧长。接着对分帧后的离散数据做短时傅里叶变换,定义角频率则离散的短时傅里叶变换为:

(14)

(15)

构造系数Wn

如果说宁国最出名的将领是秀容月明,那么胡人最厉害的是梨友。梨友是单于的弟弟,官封左贤王,用兵如神,堪称秀容月明的对手。这次胡人进军,便是梨友提议的。梨友说,宁国皇帝因猜忌削了秀容月明兵权,并解散秀容兵,我们应趁此机会打过去,不出数年,便可灭了宁国。

(16)

式中,n是帧序号,分别为声源信号和干扰信号一帧内的短时功率谱:

(17)

(18)

Xi(n)=αix(nTs-t-τi)+ni(nTs)

频域上系数加权后第n帧声源信号为:

(19)

ryi=risinφisinθi,rzi=ricosφii=1,2,…,Mφi,θi分别为阵元位置的俯仰角和水平角是阵元i和原点之间的几何距离。

(20)

平面波从-r方向入射到阵列:

4 麦克风阵列语音增强的评价标准

采用以下两种标准来衡量算法性能。

4.1 分段信噪比

信噪比是衡量语音增强算法效果的常规方法,定义为信号和噪声能量比值的对数值,信噪比越大,表示语音质量越好。不过,由于整段语音信号是时变的,而噪声能量是均匀分布的,传统信噪比计算公式只能得到大致的信噪比。因此,为了了解语音信号的信噪比情况,定义了不同时段下的分段信噪比[15-16]为:

(21)

式(21)中,L为帧长,M为帧数,对于每帧算出的信噪比设置高低门限,分别为35 dB和-10 dB。

4.2 噪声抑制

噪声抑制[17](Noise Reduction,NR)表征了算法对于噪声的抑制作用,定义为:

(22)

式中,vin(n),vout(n)分别为输入和输出中的噪声信号。NR越大,说明噪声抑制效果越好。

5 仿真与分析

仿真实验分别以长度为22 s的语音信号signal1.wav和signal2.wav作为声源,声源信号为signal2.wav,signal1.wav为干扰信号。仿真条件如下:麦克分阵列为4阵元均匀线阵,阵元间距为10 cm,声源信号与干扰信号位置分别为(-1.7,0.62,2.16), (2.11,-0.77,2.68)。仿真结果如下。

5.1 语谱图

各形式下的语音语谱图如图2~图5所示。

图2 纯净语音信号的频谱图

图3 单麦克风接收信号的语谱图

图4 波束形成后的语谱图

图5 加权后的语谱图

从图4可以看出,相比于图3所示的单麦克风信号语谱图,经过传统的固定波束形成方法后,信号的语谱图在很大程度上滤除了干扰信号,但仍有残存;对比图4和图5,经过本文方法频域上系数加权后,图5显示的语音信号的语谱图更干净、更接近图2所示的纯净语音信号,干扰信号被进一步抑制。

5.2 分段信噪比

不同情形下分段信噪比对比见表1。

表1 不同情形下信噪比对比

信号分段信噪比/dB单麦克风语音信号-1.23波束形成后语音信号3.96空频联合处理后语音信号5.74

由上表可以看出,波束形成后的语音信号信噪比提高了5.19 dB,系数加权后的语音信号信噪比提高了6.97 dB。系数加权后相比于仅作波束形成信噪比提高了1.78 dB。由此可以看出,波束形成可以对语音进行增强,提高信噪比。而系数加权可以进一步地对干扰噪声进行滤波,从而提高信噪比。

5.3 噪声抑制

计算了仅做波束形成后信号的噪声抑制比为6.10 dB,而进一步系数加权后的噪声抑制比为7.72 dB,噪声抑制比提高了1.62 dB。由此可以看出,系数加权在波束形成的基础上更加有效地抑制了干扰噪声。

答题者只能在提交答卷后查看自己的考试成绩及排名,一旦退出,便无法再次查看答卷历史和所得成绩,只能再次答题,再次提交才能再次查看答案结果。如能根据登录方式,访问IP自动记录答题历史,一定时间内可以反复查看,有助于学生进一步巩固答题效果,查漏补缺,对没有掌握的地方进行重点消化。

6 结束语

本文分析并提出了一种基于麦克风阵列的语音增强与干扰抑制算法,在波束形成之后增加了系数加权进一步滤除干扰信号,利用空频联合处理进行语音增强。仿真结果从语谱图上可以看出,波束形成后的输出信号一定程度上滤除了干扰信号,系数加权可以更加有效地提高信噪比。听音结果也显示系数加权后的语音质量相比较仅做波束形成有所提高。当然,分段信噪比的计算结果也表明系数加权对于信噪比的提高优于仅做波束形成。系数加权后对于干扰的抑制更加明显、有效。

参考文献:

[1] 沈锁金,刘伟,高颖. 语音增强算法的研究与实现[J]. 电声技术, 2016, 40(12):40-42.

[2] 张金虎. 基于麦克风阵列的语音增强算法研究[D]. 兰州:兰州交通大学, 2014.

[3] 于春和,苏龙. 基于GSC与谱减法的麦克风阵列语音增强方法[J]. 沈阳航空航天大学学报, 2015, 32(05):80-85.

[4] 陈磊,江伟华,童峰,等. 一种可跟踪移动声源方向的麦克风阵列语音增强算法[J]. 厦门大学学报:自然科学版, 2015, 54(04):551-555.

[5] 戴红霞,赵力. 基于麦克风阵列的数字助听器语音增强技术[J].电子器件, 2015, 38(03):606-610.

[6] 武素芳. 基于延迟-求和的麦克风阵列语音增强算法研究[D]. 西安电子科技大学,2010.

[7] J L FLANAGAN. Computer-steered microphone arrays for sound transduction in large rooms[J]. Journal of Acoustical Society of American. 1985, 78(5):1508-1518.

[8] 丁猛. 基于麦克风阵列的语音增强算法概述[J]. 大众科技, 2011(03):29-30.

[9] JACOB B, CHEN J D, HUANG Y T. 麦克风阵列信号处理[M]. 邹霞,周彬,译. 北京:国防工业出版社,2016:33-34.

[10] 白梅. 宽带恒定束宽波束形成方法研究[D]. 电子科技大学, 2008.

[11] 叶中付,罗大为,韦进强,等. 相干信号波达方向估计技术综述[J]. 数据采集与处理, 2017, 32(02):258-265.

[12] 李声飞. 一种改进MUSIC算法DOA估计的研究与FPGA实现[J]. 信息技术与信息化, 2017(06):83-85.

[13] 田野,练秋生,徐鹤. 基于稀疏信号重构的DOA和极化角度估计算法[J]. 电子学报, 2016, 44(07):1548-1554.

[14] 梁瑞宁,赵力,魏昕,等.语音信号处理[M]. 北京:机械工业出版社, 2016:65-66.

[15] 王文杰. 麦克风阵列语音增强技术研究[D]. 河北工业大学,2010.

[16] 徐宇卓,马建芬,张雪英. 基于语音起始段检测语音可懂度客观评价方法[J]. 电子技术应用, 2015, 41(06):150-153.

[17] 郑家超. 宽带波束形成麦克风阵列语音增强方法的研究[D]. 辽宁工业大学, 2011.

王义圆,张曦文,周贻能,黄际彦
《电声技术》 2018年第02期
《电声技术》2018年第02期文献

服务严谨可靠 7×14小时在线支持 支持宝特邀商家 不满意退款

本站非杂志社官网,上千家国家级期刊、省级期刊、北大核心、南大核心、专业的职称论文发表网站。
职称论文发表、杂志论文发表、期刊征稿、期刊投稿,论文发表指导正规机构。是您首选最可靠,最快速的期刊论文发表网站。
免责声明:本网站部分资源、信息来源于网络,完全免费共享,仅供学习和研究使用,版权和著作权归原作者所有
如有不愿意被转载的情况,请通知我们删除已转载的信息 粤ICP备2023046998号