快捷分类

基于堆叠降噪稀疏自动编码器的软件缺陷预测

更新时间：2009-03-28

0 引言

软件缺陷预测[1]是提高和保证软件产品质量的关键技术之一。尽管很多学者已经对此问题进行了大量的探索，但其依然是一项艰巨而又有挑战性的工作[2]。刘芳等人[3]首先用主成分分析法对软件缺陷数据进行降维，消除冗余信息，然后用处理后的缺陷数据进行训练，构建软件缺陷预测模型；孟倩等人[4]使用粗糙集方法对软件缺陷数据进行属性约减，去掉冗余和无关的属性，再用支持向量机对软件缺陷进行分类预测；王海林等人[5]用基于关联规则的特征选择算法提取软件缺陷数据的特征，降低训练样本的维度，去除噪声属性，再用人工神经网络构建软件缺陷预测模型。这些方法都是先对软件缺陷数据进行特征提取，再结合机器学习等方法构建软件缺陷预测模型，而作为关键步骤的特征提取过程，它们都是采用浅层机器学习算法，很难获得软件缺陷数据的深层次本质特征。因此，如何自动从软件缺陷数据中提取与缺陷预测相关的深层特征成了一个重要的研究课题。

Hinton等人[6]提出的深度学习理论可以有效解决这个问题。深度学习的本质是将神经网络搭建成多层或多阶非线性信息处理的模型，使用有监督或无监督的特征映射获取原始数据的深层次本质信息。在进行分类预测时，将特征提取与分类器组合到一个框架中，用原始数据去自动学习特征，去除人工特征提取的过程，提高特征提取的效率[7]。目前将深度学习理论应用到软件缺陷预测中的主要研究有：Yang等人[8]用深度信念网络对软件缺陷进行特征提取，结合Logistic回归分类器构建软件缺陷预测模型；Wang等人[9]提出用深度信念网络自动学习软件程序源代码的语义语法特征，并利用学习到的特征训练和构建缺陷预测模型。

自动编码器[10]作为深度学习理论的重要组成部分，在无监督特征提取中扮演着重要角色，也被应用到多种领域。甘露等人[11]将改进的自动编码器应用于软件缺陷预测中，取得了不错的效果，但其实验数据量较小，容易造成训练欠拟合。Meng等人[12]对降噪稀疏自动编码器进行了研究，并分析了稀疏性约束和隐藏层节点数对数据重构和特征提取的影响，但其应用领域仅为手写字体的分类，Kumar等人[13]用于静态手势的特征提取，Sankara等人[14]用于指纹的特征提取，都证明了降噪稀疏自动编码器的有效性。

为了解决软件缺陷预测中特征提取面临的问题，获取软件缺陷数据深层次本质特征信息，提高预测精度，本文提出基于堆叠降噪稀疏自动编码器进行特征提取的软件缺陷预测方法，通过设置不同的隐藏层数和稀疏性约束，获取软件缺陷数据各层次的特征表示，然后用Logistic回归分类器进行分类预测，构建软件缺陷预测模型。

2 基于堆叠降噪稀疏自动编码器的软件缺陷预测方法

2.1 自动编码器

自动编码器(Auto-Encoder,AE)[11]是一种无监督学习算法，通过学习一个尽可能恢复自身的非线性编码，可以获取输入数据的深层次本质特征表示。自动编码器模型结构如图1所示，AE首先对输入数据进行编码，得到隐藏层的特征表示，然后对隐藏层的特征表示进行解码得到重构数据，再使用反向传播算法来训练网络，使得重构数据尽可能地等于输入数据，得到编码结果。

图1 自动编码器结构示意图

给定一个无标签的训练样本集其中x(i)∈Rn，m为样本个数，n为样本维数。对输入层的每一个输入数据x(i)，经编码操作，可得到隐藏层的特征表示y(i)：

y(i)=fθ(x(i))=f(wx(i)+b)

其中，θ=(w,b)为网络参数，w为权值矩阵，b为偏置向量，f(·)为激活函数，通常选择sigmoid函数：f(x)=1/(1+e-x)。再对隐藏层的特征表示进行解码操作，可得到重构数据

其中，θ′=(w′,b′),w′为权值矩阵，通常取w′=wT，b′为偏置向量。则对AE的网络参数优化调节实际上就是最小化重构误差：

其中，L(·)为代价函数。为了比较重构数据与输入数据之间的差异，通常有如下2种代价函数：

1)平方差代价函数：

2)交叉熵代价函数：

Nielsen[15]证明了交叉熵代价函数优于平方差代价函数，因此本文中选择交叉熵代价函数。自动编码器在整个训练样本集的代价函数为：

其中，第一项为整体代价项，第二项为规则化项，其目的是减小权重的幅度，防止过拟合。权重衰减系数λ用于控制两项的相对重要性。

2.2 稀疏自动编码器

稀疏自动编码器[16](Sparse Auto-Encoder,SAE)是在AE的基础上给隐藏神经元添加稀疏性约束而得到的。稀疏性约束是指激活最少(最稀疏)的隐藏神经元来表示输入数据的特征。

要想搞创作，就要敢于冲破旧框框的束缚，最大限度地进行新的探索，犹如猛虎下山蛟龙入海；犹如国庆节一下子放出了十万只鸽子；犹如孙悟空在铁扇公主肚里拳打脚踢翻筋斗云，折腾个天昏地暗日月无光一佛出世二涅槃口吐莲花头罩金光手挥五弦目送惊鸿穿云裂石倒海翻江蝎子窝里捅一棍，然后平心静气休息片刻，思绪开始如天马行空，汪洋肆意，天上人间，古今中外，坟中枯骨，松下幽灵，公子王孙，才子佳人，穷山恶水，刁民泼妇，枯藤昏鸦，古道瘦马，高山流水，大浪淘沙，鸡鸣狗叫，鹅行鸭步——把各种意想叠加起来，翻来覆去，去粗取精，去伪存真，由此及彼，由表及里，一唱雄鸡天下白，虎兔相逢大梦归。[4]

稀疏自动编码器在整个训练样本集的代价函数为：

2.1.1 运动症状：帕金森病患者明显可见的静止性震颤、肌强直、运动迟缓、姿势步态异常等运动症状可在公众场合表现出来，这些身体形象的改变会引发患者的羞愧感、尴尬感和孤立感[9-10]。有研究认为帕金森病患者病耻感与其外在形象改变和功能逐渐丧失有关，同时语言沟通障碍和“面具脸”所致的非语言沟通障碍也不可避免地导致患者的孤立，感到一种与他人逐渐疏远的感觉[8]。因此，患者可能被他人误认为隐瞒病情和不愿与人沟通，加重患者的孤立感。运动症状可直接导致社会孤立和自我歧视，因此运动症状是帕金森病患者病耻感的主要来源。

其中，第一项为自动编码器的代价，第二项为稀疏性惩罚项，称为稀疏性惩罚因子，β控制稀疏性惩罚因子的权重。s2是隐藏层中隐藏神经元的数量，ρ为稀疏性约束，通常是一个接近于0的较小的值为隐藏神经元j的平均激活值，表示在给定输入为x的情况下，隐藏神经元j的激活度表示ρ和之间的KL距离，其表达式为：

6)通过梯度下降法分别对各阶特征表示构建的预测模型进行“微调”，优化深度网络中的参数；

当时，KL距离为最小值0，并且随着与ρ之间的差异越大，其KL距离越大，而当靠近0或1时，其KL距离将趋向于∞，所以在代价函数中加入稀疏性惩罚项，并使其最小化，可以使得更靠近于ρ。

2.3 降噪稀疏自动编码器

降噪稀疏自动编码器[13](Denoising Sparse Auto-Encoder,DSAE)是在SAE的基础上，首先对输入数据进行加噪处理，再对加噪处理后的数据进行稀疏性编码，使得SAE必须学习去除这种噪声，迫使其学习输入数据更加鲁棒的表示，提高泛化能力。

图2 降噪稀疏自动编码器结构示意图

降噪稀疏自动编码器的结构如图2所示。x(i)为原始输入数据，为经过加噪处理后的数据，本文选择加入掩蔽噪声(Masking Noise，MN)，即随机选择样本数据x(i)中的一些值，并将这些值置为0。

降噪稀疏自动编码器的重构数据与输入数据x(i)之间的误差则为：

降噪稀疏自动编码器在整个训练样本集的代价函数为：

2.4 堆叠降噪稀疏自动编码器

将多个降噪稀疏自动编码器逐层叠加构建成深度神经网络模型，则称为堆叠降噪稀疏自动编码器(Stacked Denoising Sparse Auto-Encoder,SDSAE)，其可以获取输入数据更深层次的特征信息，越深的层次获取的特征信息具有越强的特征表示能力。

推荐理由:渔村少年的成长史，一家四代的航海梦，童年风景与国家命运的时代交响。此番张之路先生打通科学思维与文学想象，讲述了一个太阳和阴凉儿捉迷藏的故事。故事文本的表层情节生动活泼、充满童趣，还包含了有关太阳的科学常识；故事的内核意义丰富：大与小、动与静、显与隐、能与不能等哲学概念深蕴其中。新锐绘本画家乌猫用极富个性的图画语言为这个故事赋能，以中国艺术解读中国文本，以东方美术诠释中国故事。最终，乌猫呈现给读者的是融汇了敦煌壁画元素的瑰丽画面，深具东方韵味，令人叹为观止。

在使用SDSAE进行分类预测时，其训练过程分为无监督的预训练过程和有监督的微调过程。预训练过程是指采用逐层贪婪训练方法，依次训练深度网络的每一层，获取近似最优化网络参数的过程。即首先将原始数据输入至第一层DSAE，训练得到原始数据的一阶特征表示然后将该特征表示作为第二层DSAE的输入，训练得到原始数据的二阶特征表示以此类推，将第(n-1)阶特征表示作为第n层DSAE的输入，可以训练得到原始数据的n阶特征表示

4.基本农田保护区。全市基本农田保护区面积为63204公顷，约占全市国土面积的29.27%。分布于10个镇（办事处）。

由于SDSAE的不同层是各自学习的，所以需要将它们组合成一个完整的深度网络，并对网络参数进行微调。微调过程是在预训练过程完成之后，SDSAE与分类器组合在一起，使用反向传播算法计算代价函数的偏导数，通过梯度下降法对网络参数进行迭代更新，同时调整所有层以获取最优化的网络参数的过程。

2.5 基于堆叠降噪稀疏自动编码器的软件缺陷预测方法

本文设计一个具有4个隐藏层的SDSAE用于软件缺陷数据的特征提取，并使用Logistic回归分类器对提取的特征进行分类的软件缺陷预测模型。在构建的预测模型中，为了学习到最优的网络参数，在预训练过程中，使用大量的无标签数据进行逐层贪婪训练，获得近似最优化的网络参数，在微调过程中，将包括分类器在内的整个深度网络进行微调，获得最优的网络参数。使用堆叠降噪稀疏自动编码器进行软件缺陷预测的具体步骤如下：

1)将软件缺陷数据集划分为训练数据集和测试数据集，并对训练数据集进行预处理；

2)将处理后的训练数据输入至第1层DSAE进行预训练，获得原始数据的一阶特征表示

3)将步骤2获得的一阶特征表示作为第2层DSAE的输入，训练获得原始数据的二阶特征表示

由图3可知，当WTP小于3 200元时，采用无阿司匹林方案（安慰剂）进行CVD一级预防相较于阿司匹林方案更具经济性的概率约为99%；当WTP约为3 500元时，无阿司匹林方案相较于阿司匹林方案更具经济性的概率约为50%，即两种方案经济性无显著差异；当WTP大于3 600元时，阿司匹林方案更具经济性的概率约为99%。

本实验所用计算机配置为Intel(R) Xeon(R) E3-1230 3.30 GHz处理器，8 GB内存。实验所运行的软件环境为在Windows 7操作系统下安装的Matlab R2014a。

本文采用的实验数据为Eclipse缺陷数据集[17]，该数据集是软件缺陷预测领域应用较为广泛的公共数据集之一，可以从Eclipse Bug Data获取。Eclipse缺陷数据集有6个文件，分别对应于Eclipse的3个版本2种粒度下的故障记录，本文所采用的实验数据均为Eclipse 2.0版本files粒度的故障数据记录。

2006年6月，新加坡启动了第6个信息化产业十年计划“智慧国2015(iN2015)”并且制定了4项战略，涵盖了基础设施建设、资讯通信产业的发展、人才培养、经济的提升。并在2014年提前完成“智慧国2015”计划的同时，新加坡政府公布了“智慧国家2025”的10年计划。

青浦区是全国第三批节水型社会建设试点。《条例》施行以来，青浦区继续按照《上海市青浦区节水型社会建设试点工作大纲》及规划，按照最严格水资源管理的要求，努力形成水资源管理制度、节水型经济结构、节水型工程技术和节水型行为规范等四大体系，扎实开展节水型社会建设各项工作。实行了取水许可和水资源论证制度，开展水平衡测试，实行定额管理，实行建设项目节水设施“三同时、四到位”管理制度。节水型社会建设试点取得初步成效，并于2011年通过了水利部全国节水型社会建设中期评估，被评为第三批全国节水型社会建设试点优秀单位。

至于金豆子，传说又有演变，也颇有意思。我曾去睢宁县古邳镇附近一个乡贤世家，叫花家大院的，看见庭院中立一块龙蛇形石头，石头上刻了这样一个故事：明朝一个老汉，在山得到许多金豆子和金马驹，就交给两个儿子：“民生”与“民望”，去换成米粮，救助灾民，却被贪官获知，他就催促百姓上山挖金豆子金马驹，致使百来人死在山上，其中就有“民生”和“民望”。于是龙王派了两龙蛇，“救苍”与“拯生”，惩罚了贪官、拯救了百姓。这是水能载舟、亦能覆舟的民间翻版，民生与民望，乃是王朝统治的根基。

7)将测试数据按训练数据相同的方法进行预处理后分别输入至训练好的预测模型，得出预测结果；

译文：Stability is of overriding importance.We should ensure stable growth,maintain employment,and prevent risks.To ensure overall economic and social stability,we must not allow the redline to be crossed concerning financial security,people’s well-being,or environmental protection.

8)对得到的预测结果进行评价，得出结论。

使用堆叠降噪稀疏自动编码器进行软件缺陷预测的完整过程如图3所示。

3 实验与分析

3.1 实验准备

3.1.1 实验环境

4)类比步骤3，可分别获得原始数据的三阶特征表示和四阶特征表示

图3 基于SDSAE的软件缺陷预测过程

3.1.2 实验数据集

5)将步骤2～步骤4得出的特征表示和原始数据的标签分别作为Logistic回归分类器的输入构建软件缺陷预测模型；

本文实验以软件发布后模块缺陷倾向性为预测目标，首先去除该数据集中所有非数值类型的特征，然后将发布后缺陷数量(post)转换为软件模块是否有缺陷的类标has_defects，转换方法为：若post=0，则has_defects=0，否则has_defects=1。经过处理后，数据集共有198个特征，主要包括软件规模度量特征、复杂性度量特征和基于语义语法树的度量特征等。该数据集中共有6729个样本，其中有缺陷样本为975个，缺陷率为14.49%。

3.1.3 超参数设置

综上所述，PLC技术在机械电气控制装置中起着极为关键的作用，不仅可以提高工业生产的效率，推动我国工业化的进程，而且还可以取代人力生产，促进社会经济的发展。近些年，人们对PLC技术的发明与应用提出了更高的要求和标准。为了实现我国社会经济运作环境的稳定，我们要将PLC技术进行合理化的应用并对其进行深入性的研究和分析。

本文实验中，由于数据集共198个特征，故输入层节点数设为198；权重衰减系数λ设为1e-3，稀疏性惩罚系数β设为3。本实验中，采用minFunc函数最小化DSAE的整体代价函数，minFunc是一个开源的Matlab函数，用于使用线性搜索方法对可微分真值多元函数进行无约束优化，可以从minFunc获取。在实验中，将代价函数优化方法指定为L-BFGS，并将最大迭代次数设为400。Logistic回归分类器的权重衰减系数设为1e-4，同样采用minFunc最小化其代价函数，最大迭代次数设为100。

世俗化一直是儒家当然也是陆九渊心学的重要思想倾向。在中国传统中儒家一直以入世的主张而与另两种强调出世的思想佛家和道家有着泾渭分明的区别。

3.2 评价指标

本文采用的评价指标为F1-度量，是综合衡量准确率和召回率的分类评价指标，其大小用来评价软件缺陷预测模型的好坏。F1-度量的计算公式为：

其中，准确率precision=TP/(TP+FP)，召回率recall=TP/(TP+FN)，TP是预测为有缺陷模块中确实有缺陷的软件模块数量，FP是预测为有缺陷模块而实际却无缺陷的软件模块数量，FN是预测为无缺陷模块而实际却有缺陷的软件模块数量。

3.3 实验结果及分析

为了验证降噪稀疏自动编码器DSAE对软件缺陷数据进行特征提取的能力，分别经过主成分分析法PCA[18]、线性判别分析法LDA[19]、独立成分分析法ICA[20]与降噪稀疏自动编码器DSAE进行特征提取构建缺陷预测模型，验证模型性能。其中：PCA累计贡献率设为0.95，DSAE的隐藏层单元数设为100，稀疏性约束设为0.2，加噪方式为掩蔽噪声，掩蔽率设为0.2。实验结果如图4所示，其中LR为文献[17]中所述没有经过特征提取，直接使用Logistic回归分类器构建缺陷预测模型的预测性能。由图4可以看出，使用DSAE对软件缺陷数据进行特征提取，不需要预先定义特征，只需将缺陷数据输入预测模型，其会自动学习，获取缺陷数据深层次本质特征。经过DSAE进行特征提取构建的缺陷预测模型，相比没有经过特征提取或经过PCA、LDA、ICA等方法进行特征提取的预测模型，在F1-度量上均有明显的提高，这表明DSAE对特征提取的效果比传统特征提取方法要好。

教师的“健康”,不仅限于没有疼痛、没有疾病或少病，还包括身体的舒适、心理的安宁，即完全的身心舒适与幸福感。健康安全工作诉求包括多方面。首先，学校应当建立安全制度，采取措施保障教师的人身安全。学校不得在危及教师人身安全、健康的校舍和其他设施、场所中进行教育教学活动。其次，额定教师的工作量。教师工作量关乎教师投入多少时间、完成了哪些教学及其相关工作任务，与教师职业幸福感、师资科学配置以及教育教学质量密切相关。第三，形成和谐的教师工作氛围，构建支持教师工作的人际工作环境。

图4 不同预测模型的预测性能对比

为了验证DSAE中微调和稀疏性约束对预测模型性能的影响，在实验中，设置只含一个隐藏层的DSAE构建缺陷预测模型，DSAE的隐藏层节点数设为100，稀疏性约束分别设为0.01、0.04、0.07、0.1、0.2、0.3、0.4、0.5、0.6、0.7、0.8、0.9、1.0，实验结果如图5所示。从图5可以看出，未经过微调的预测模型在稀疏性约束小于0.4时呈增长趋势，在0.4～0.7区间内呈下降趋势，大于0.7时变得不稳定，而经过微调的预测模型在不同稀疏性约束情况下均能表现出良好的预测性能，且均比未经过微调的预测模型的性能优越。分析原因，未经过微调的预测模型当稀疏性约束小于0.4时，DSAE的隐藏神经元激活数随着稀疏性约束的增大而增多，使DSAE可以学习原始数据更本质的特征表示，因此预测性能增加；当稀疏性约束在0.4～0.7之间时，DSAE的隐藏神经元需要激活的过多，这将造成训练过拟合，因此预测性能会降低；但当稀疏性约束大于0.7时，意味着隐藏层中的大多数神经元都需要激活，这种不合理的设置会破坏网络参数正常的优化，虽然预测模型仍然具有预测能力，但其网络参数已经不是通过“学习”得到的，所以得到的预测模型属于无效预测模型。而经过微调的预测模型的网络参数已经在分类器的监督下进行了调整，使得DSAE的稀疏性约束设置对预测模型的影响消失，因此，经过微调的预测模型在不同稀疏性约束下均能表现出良好的性能。

水稻叶部的一种细菌病害。病原菌是原核生物界的水稻黄单胞稻致病变种。病菌从根、茎、叶部的伤口或水孔侵入稻体，在维管束的导管中繁殖危害。苗期和分蘖期最易受害。秧苗叶片多表现叶枯症状。在感染品种上多出现急性凋萎症状，病斑青灰色水渍状，病叶迅速卷曲凋萎，在抗病品种上产生褐色枯斑。病菌的发育适温26℃-30℃，在病残体上越冬，稻种亦可带菌，经风雨传播。氮肥过多和低洼积水田发病早而重。台风暴雨后，病害常在感病品种上迅速扩散。防治措施：选栽抗病品种、防止稻田淹水是防病关键，并结合药剂防治。

图5 微调和稀疏性约束对预测性能的影响

为了验证SDSAE中模型深度和稀疏性约束对预测性能的影响，在实验中，设置含有4个隐藏层的预测模型，隐藏层单元数为150-100-50-30，稀疏性约束分别为0.05、0.1、0.2、0.3、0.4、0.5，实验结果如图6所示。从图6可以看出，对于相同的模型深度，当稀疏性约束小于0.3时，其值越大，预测性能越好，但大于0.3时，又略有降低。与此同时，对于相同的稀疏性约束，网络深度越深，预测性能越好。分析原因，是由于深度模型可以获取输入数据更深层次的特征信息，越深的层级获取的特征信息具有越强的特征表达能力，因此预测模型深度越深预测性能越好。但并不是模型深度越深越好，其深度取决于预测模型与训练数据的规模，当预测模型深度太深时，会造成“梯度消失”现象，从而不能完成模型训练，得不到预测结果；并且从图6还可以看出，预测模型的深度越深，预测性能相对提升得越少，甚至可能造成训练过拟合，降低预测性能，所以不能盲目地增加模型深度。

图6 隐藏层数和稀疏性约束对预测性能的影响

为了验证SDSAE中掩蔽噪声的不同掩蔽率对预测性能的影响，在实验中，设置SDSAE的隐藏层为4层，隐藏层单元数为150-100-50-30，稀疏性约束设为0.3，掩蔽噪声的掩蔽率分别为0、0.1、0.2、0.3、0.4、0.5、0.6、0.7、0.8、0.9、1.0，实验结果如图7所示。从图7可以看出，对于加入掩蔽噪声相同掩蔽率的预测模型，模型深度越深预测性能越好。而对于相同的模型深度，掩蔽噪声的掩蔽率越大，预测性能越差。分析原因，是由于预测模型在训练时，掩蔽噪声会掩蔽掉训练数据中与软件缺陷有相关性的数据，即对缺陷预测有益的信息，因此掩蔽率越大，预测模型的性能越差。当掩蔽率为1.0时，所有训练数据都被掩蔽，虽然预测模型具有预测能力，但其网络参数并不是根据训练数据“学习”得到的，因此得到的预测模型属于无效模型，其预测结果也不是有效的预测结果。但对预测模型的训练数据中加入噪声，可以使学习到的预测模型鲁棒性更高，泛化能力更强，因此掩蔽噪声的掩蔽率应设置在一个合理的范围。

图7 掩蔽噪声的掩蔽率对预测性能的影响

4 结束语

为了解决软件缺陷预测中传统的特征提取方法不能提取出软件数据中深层次本质特征的问题，本文提出一种基于堆叠降噪稀疏自动编码器的软件缺陷预测方法，其首先用堆叠降噪稀疏自动编码器对软件缺陷数据进行特征提取，然后用Logistic回归方法对提取后的特征表示进行分类预测，取得了较好的预测效果。但由于预测模型的性能受模型深度、稀疏性约束、掩蔽率等超参数的影响，而超参数的选择并没有统一的理论指导，因此对超参数的选择是今后研究的主要课题。

参考文献：

[1] 王青,伍书剑,李明树. 软件缺陷预测技术[J]. 软件学报, 2008,19(7):1565-1580.

[2] 陈翔,顾庆,刘望舒,等. 静态软件缺陷预测方法研究[J]. 软件学报, 2016,27(1):1-25.

[3] 刘芳,高兴,周冰,等. 基于PCA-ISVM的软件缺陷预测模型[J]. 计算机仿真, 2014,31(3):397-401.

[4] 孟倩,马小平. 基于粗糙集-支持向量机的软件缺陷预测[J]. 计算机工程与科学, 2015,37(1):93-98.

[5] 王海林,于倩,李彤,等. 基于CS-ANN的软件缺陷预测模型研究[J]. 计算机应用研究, 2017,34(2):467-472.

[6] Hinton G E, Salakhutdinov R R. Reducing the dimensionality of data with neural networks[J]. Science, 2006,313(5786):504.

[7] Lecun Y, Bengio Y, Hinton G. Deep learning[J]. Nature, 2015,521(7553):436-444.

[8] Yang Xinli, Lo D, Xia Xin, et al. Deep learning for just-in-time defect prediction[C]// IEEE International Conference on Software Quality, Reliability and Security. 2015:17-26.

[9] Wang Song, Liu Taiyue, Tan Lin. Automatically learning semantic features for defect prediction[C]// ACM International Conference on Software Engineering. 2016:297-308.

[10] Deng Li, Seltzer M, Yu Dong, et al. Binary coding of speech spectrograms using a deep auto-encoder[C]// Conference of the International Speech Communication Association. 2010:1692-1695.

[11] 甘露,臧洌,李航. 基于DA-SVM的软件缺陷预测模型[J]. 计算机与现代化, 2017(2):36-39.

[12] Meng Lingheng, Ding Shifei, Xue Yu. Research on denoising sparse autoencoder[J]. International Journal of Machine Learning & Cybernetics, 2016,31(5):1-11.

[13] Kumar V, Nandi G C, Kala R. Static hand gesture recognition using stacked denoising sparse autoencoders[C]// IEEE International Conference on Contemporary Computing. 2014:99-104.

[14] Sankaran A, Pandey P, Vatsa M, et al. On latent fingerprint minutiae extraction using stacked denoising sparse AutoEncoders[C]// IEEE International Joint Conference on Biometrics. 2014:1-7.

[15] Neilsen M. Neural Networks and Deep Learning[M]. Determination Press, 2015.

[16] Jiang Xiaojuan, Zhang Yinghua, Zhang Wensheng, et al. A novel sparse auto-encoder for deep unsupervised learning[C]// The 6th IEEE International Conference on Advanced Computational Intelligence. 2013:256-261.

[17] Zimmermann T, Premraj R, Zeller A. Predicting defects for Eclipse[C]// IEEE International Workshop on Predictor Models in Software Engineering.2007:9.

[18] Vidal R, Ma Yi, Sastry S S. Principal Component Analysis[M]. IEEE Computer Society, 2005.

[19] Ye Junxiao, Janardan R, Li Q. Two-dimensional linear discriminant analysis[C]// Proceedings of the 8th Annual Conference on Neural Information Processing Systems. 2004:1569-1576.

[20] Choi S. Independent Component Analysis[M]. Springer Berlin Heidelberg, 2012.

作者

薛参观

出处

《计算机与现代化》 2018年第05期

上一篇：基于Docker的MPI和OpenMP混合编程

下一篇：SecDr：一种内容安全的Docker镜像仓库

《计算机与现代化》2018年第05期文献

基于LSTM的临床血液需求预测方法作者：郑亚鹏，樊璐

基于移动通信大数据的城市人口空间分布统计作者：周天绮

基于模糊推理的构件度量作者：陈晓，孙英昊，赵攀，刘倩

基于VSTO的文档审阅批注自动导出技术作者：李建波

基于Docker的MPI和OpenMP混合编程作者：赵博颖，肖鹏，张力

基于堆叠降噪稀疏自动编码器的软件缺陷预测作者：薛参观

SecDr：一种内容安全的Docker镜像仓库作者：魏兴慎，苏大威，屠正伟，刘苇，祁龙云，吕小亮，杨斌

基于CP-ABE的隐藏属性外包解密访问控制作者：陈成，努尔买买提黑力力

双重触发的嵌入式系统内核安全访问控制作者：黄姝娟，朱怡安，高武奇，罗钧旻

基于极限学习机的武器装备作战效能全局敏感性分析作者：董雪，张德平

基于深度强化学习DDPG算法的投资组合管理作者：齐岳，黄硕华

基于跳跃显露模式挖掘算法的癌症分类作者：乔媛，廖小平，邵开霞

基于马尔科夫链的大学生自主学习能力预测方法作者：刘德春，张秀国，姜微

面向中亚的大学汉语辅助学习软件设计与教学应用作者：杨勇，赖如，任鸽

延迟抖动在TFRC拥塞控制策略中的应用作者：谭志勇，赵甫哲

基于内容分析的网络协议指纹识别作者：夏琨，丁波，刘俊，刘子豪，林亮成

一种平稳子空间分析的快速不动点算法作者：林原灵，陈前

一种快速的双重层次包围盒碰撞检测算法作者：刘超，蒋夏军，施慧彬

FlexRay动态段消息调度优化算法作者：张良玉，王义，张育贵，刘志超，杨梅

基于加权中值滤波的MST立体匹配算法作者：赵大成，许道云

基于Gabor滤波的语音识别鲁棒性研究作者：缑新科，徐高鹏

基于船舶融合点迹行为识别的雷达监视系统作者：陈晓利，祁云嵩，林嘉炜

基于信息论方法的分类数据相似性度量作者：郑碧如，吴广潮

基于fastText的中文文本分类作者：代令令，蒋侃

杂志信息网