更全的杂志信息网

多路径高斯核模糊C均值聚类算法*

更新时间:2009-03-28

1 引言

基于目标函数的模糊聚类方法具有类别模糊关系刻画、聚类问题数学形式表达、非线性规划优化理论等优点,因此成为聚类分析领域的研究主流。此类算法的典型算法包括模糊C均值聚类FCM(Fuzzy C-Means)[1]、可能性C均值聚类算法PCM(Posibilistic C-Means)[2]及推广算法[3 - 6],被广泛应用于图像处理、模式识别、计算机视觉等领域。

核方法利用核函数表示高维特征空间中内积运算,能够将低维输入空间的非线性关系投影为高维特征空间的线性关系,提升了模式间的区分性能,且无需明确知道具体的非线性映射形式,克服了机器学习的维数灾难,所以也被研究者引入模糊聚类领域并取得成功的应用。

核方法首先被Girolami[5]和张莉等[6]引入硬核聚类算法,在此基础上核方法被进一步地应用于模糊聚类算法,应用的关键和难点在于聚类中心的表示上。伍忠东等[7]将核方法引入模糊C均值聚类算法得到核模糊C均值聚类算法KFCM(Kernel Fuzzy C-Means clustering algorithm)。该KFCM算法利用梯度法和核聚类目标函数,在特征空间中得到聚类中心Φ(vi)的迭代公式,但由于非线性映射函数Φ(·)的不可知性,所以将其分别与非线性映射样本Φ(xj)和特征空间聚类中心Φ(vi)作内积运算并利用核函数表示,从而将Φ(vi)以隐式方式蕴藏在核聚类算法中。因此,称此类核聚类算法为隐核模糊C均值聚类算法HKFCMs(Hidden Kernel Fuzzy C-Means clustering algorithm)。HKFCMs算法容易受到模糊指标的影响而导致聚类效果较差。文献[8]提出了另外一种形式的核模糊C均值聚类算法,它将核聚类目标函数中的核函数取为Gauss核函数。由于Gauss核函数的特殊性,因此可以在输入空间结合梯度法和核聚类目标函数,得到由聚类中心vi和模糊隶属度uij所构成的聚类中心vi迭代计算公式。核聚类算法为Gauss核模糊C均值聚类算法GKFCMs(Gauss Kernel Fuzzy C-Means clustering algorithm)。GKFCMs算法在迭代计算时需要首先对聚类中心vi作初始化,由于其较好的聚类性能而应用广泛。杨广全等[9]运用粒子群生物进化算法PSO(Particle Swarm Optimization)在聚类中心vi解空间中全局搜索优解,并基于核聚类目标函数构造适应度函数,称该核聚类算法为PSO核模糊C均值聚类算法PSO-KFCMs(PSO Kernel Fuzzy C-Means clustering algorithm)。PSO-KFCMs和GKFCMs一样是基于输入空间的,且都需要对聚类中心vi作初始化。

这些核模糊聚类算法都有着不同的聚类中心推导原理和参数迭代估计路径,不同的参数迭代路径即意味着不同的优解产生,一个自然的想法即是将这些参数迭代路径结合起来,从而搜索出更加优良的参数估计解,以提高核聚类算法的聚类性能。

本文在上述研究工作的基础上提出了一种多路径高斯核模糊C均值聚类算法MGKFCMs(Multi-route Gauss-Kernel Fuzzy C-Means clustering algorithm)。MGKFCMs算法首先令核目标函数及模糊隶属度函数中的核函数为高斯核函数(Gauss Kernel Function),然后使用梯度法得到输入空间聚类中心迭代公式,最后基于聚类中心迭代公式及PSO算法在解空间中作双重路径的聚类中心优解搜索,在每一次并行迭代中,选择使得核目标函数取值小的聚类中心路径作为参数迭代最终路径。分析了MGKFCM算法与原有核模糊聚类算法的关系,研究了MGKFCM算法的性质,并证明MGKFCM算法的收敛性。在机器数据集上的仿真实验验证了该算法的有效性。

2 多路径高斯核模糊聚类算法(MGKFCMs)

2.1 MGKFCMs 算法的目标函数及模糊隶属度

核模糊C均值聚类算法KFCMs即是在FCMs算法的基础之上应用核方法得到的,即利用核函数表示非线性映射后的内积运算,KFCMs算法的目标函数和模糊隶属度如式(1)和式(2)所示。

 
 

(1)

 
 

(2)

其中,V=[vi]c×d为输入空间聚类中心矩阵,U=[uij]c×n表示模糊隶属度矩阵,uij(0≤uij≤1)表示样本xj属于第i组聚簇的隶属程度;m(m>1)称为模糊指标。dKij=‖Φ(xj)-Φ(vi)‖表示特征空间中向量Φ(xj)与核聚类中心Φ(vi)的欧氏距离,且可利用核函数表达出来。即有:

 

(3)

Gauss核函数如式(4)所示:

 

(4)

由式(4)可得:

KG(xi,xi)=1,σR

(5)

2.2.3 MGKFCMs 算法聚类中心迭代路径

 
 
 

(6)

 

(7)

2.2 MGKFCMs 算法多路径聚类中心迭代方法

由式(6)可知,MGKFCMs算法的目标函数可理解为输入空间聚类中心vi的函数,可以通过梯度法得到vi的迭代计算公式,这样得到的聚类中心包含了梯度信息,也可以利用PSO粒子群生物进化算法在解空间中自适应寻优,这样寻找得到的聚类中心不包含梯度信息。为了充分有效地利用各种算法的优势,在聚类中心参数的迭代过程中,MGKFCMs 算法以核聚类目标函数为评价函数,对两种方法所得到的聚类中心进行评价比较,选择使得核聚类目标函数值小的聚类中心为参数的迭代路径。

2.2.1 梯度法聚类中心迭代公式

令式(6)对聚类中心vi求偏导,并令结果为0,得到:

不同覆膜时期向日葵长势和产量测定结果表明,非生育期覆膜成熟期长势和产量明显好于常规播前覆膜。上年秋季覆膜株高、茎粗、花盘直径、产量分别较常规播前覆膜提高21.3%,26.3%,35.8%,58.1%;早春覆膜分别比常规播前覆膜株高、茎粗、花盘直径、产量提高11.3%,10.5%,33.3%,38.2%(表3,表4)。

 

(8)

2.2.2 PSO算法搜索聚类中心

生物进化优解搜索算法的优势在于全局优解搜索性能和不依赖于梯度信息,适合于非线性、不可微和多峰值复杂问题的优化。由于粒子群(PSO)算法是基于实数域编码并在输入解空间全局搜索优解的,适合于对模糊聚类算法聚类中心估计寻优。文献[10,11]利用PSO算法对聚类中心进行编码寻优求解,文献[9]进一步将其与核方法结合起来,称这样的聚类中心为PSO核聚类中心。

基本PSO算法中每个粒子都是优化问题的一个可行解,由一个速度决定其更迭的方向和距离,结合粒子位置和飞行速度决定其下一代粒子位置,经过逐代搜索最后找到最优解,每次迭代中粒子根据自身pbest和全局gbest来修正自身飞行速度,其中自身pbest为粒子历代搜索得到的最优位置,全局gbest为全体粒子所搜索得到的最优位置。

粒子的速度及位置更新公式分别为:

vij(t+1)=wvij(t)+c1r1[pij(t)-

步骤4 再利用模糊隶属度uij(t+1)和更新的梯度聚类中心以及目标函数式(6),得到第一个目标函数值J1(t+1)。

(9)

xij(t+1)=xij(t)+vij(t+1)

(10)

其中,c1c2为加速因子,取为正的常数,一般取为2;r1r2为[0,1]的随机数,w称为惯性因子。

为了利用PSO算法求解MGKFCMs算法,需要定义PSO算法适应度函数,即需要将MGKFCMs算法最小化目标函数转换为PSO算法最大化适应度函数,一般定义式(11)为PSO适应度函数。

 

(11)

PSO核聚类中心方法在输入空间中对聚类中心vi寻优,没有利用核目标函数对于Φ(vi)或vi的梯度信息,而仅是在适应度函数的指引下修正迭代寻优路径和速度。

令式(1)和式(2)中的核函数为Gauss核函数,即将式(4)和式(5)代入式(1)和式(2)中,得到MGKFCMs算法的目标函数和模糊隶属度:

vi(t)为MGKFCMs 算法第t次迭代时所确定的聚类中心,将其代入式(7)得到第t+1次迭代时的模糊隶属度uij(t+1),由vi(t)、uij(t+1)及式(8)得到梯度法聚类中心并结合及式(6)得到核聚类目标函数值(t+1)。由vi(t)、式(6)及PSO算法得到PSO聚类中心并结合及式(6)和式(11)得到核聚类目标函数值(t+1)。当(t+1) < ( t+1)时,则取反之则取

如果说“局气”是满满的市井江湖气息的话,那么“四世同堂”则是透着老北京的文化底蕴。这里的装潢、用材和菜品,无不透着老北京的文化底蕴和气息,透着亲切和家的感觉。不仅是地道的北京美食,更能把绝对够味儿的京城文化呈现给大家。

1.2.2 5'缺失表达载体的构建 将各片段TA克隆至pMD19-T载体上,热激法转化大肠杆菌E.coli DH5α,培养12~16 h后挑单克隆,PCR鉴定阳性转化子,测序得到准确的质粒。

需要说明的是,PSO算法采用并行算法搜索聚类中心,根据粒子规模数可以定义多个聚类中心,此处所确定的聚类中心为第t+1步迭代的群体最优解gbest值。

2.3 MGKFCMs 算法迭代流程

光滑、红润、富有弹性的皮肤,有赖于皮肤真皮下组织微血管的充足营养供应。睡眠不足会引起皮肤毛细血管瘀滞,循环受阻,使得皮肤的细胞得不到充足的营养,因而影响皮肤的新陈代谢,加速皮肤的老化,使皮肤颜色显得晦暗而苍白。

步骤1t=0,初始化输入空间聚类中心vi(t)=vi(0);

步骤8 对于目标函数值J(t+1),如果它小于某个确定的阈值,或它相对上次函数值J(t)的改变量小于某个阈值,则算法停止。反之,则令t=t+1,转步骤2。

步骤3 根据模糊隶属度uij(t+1)及聚类中心vi(t),结合式(8),得到更新的梯度聚类中心

设D={(xk,yk)|k=1,2,…,n},其中xk∈Rn为得到的分解信号,yk∈R为输出结果。在权w空间中最小二乘支持向量机分类问题可以描述如下:

xij(t)]+c2r2[gij(t)-xij(t)]

由于该模块需要经常对数据进行分析并且对实时性要求较高,在数据源发生改变后需要重新进行机器学习过程,因此神经网络模型不宜过于复杂。为保证数据预测和分析更加精准和实时,在本文中机器学习模型将采用BP 神经网络对生命体征数据进行分析学习和预测。

步骤5 根据模糊隶属度uij(t+1)及聚类中心vi(t),结合式(6)和式(11)及PSO算法得到更新的PSO聚类中心

步骤6 再利用模糊隶属度uij(t+1)和更新的PSO聚类中心以及目标函数式(6),得到第二个目标函数值J2(t+1)。

模糊聚类算法都依赖于AO交替迭代算法对聚类参量进行估计,MGKFCMs算法迭代路径如下:

步骤7 比较两个目标函数值J1(t+1)和J2(t+1)的大小,若J1(t+1)小于J2(t+1),记目标函数值J1(t+1)大于J2(t+1),记目标函数值

步骤2 依聚类中心vi(t)结合式(7)计算得到样本模糊隶属度uij(t+1)。

最后,MGKFCMs对样本xj的聚类类别判定为:

巩俐之所以能被叫做“巩皇”,不仅是她的长相或是气场,最重要的是她在职业上达到了别人毕生所求却难以攀到的高度。从1987年出道至今,巩俐共参演了三十多部电影,虽然不高产,但她的每一个角色都堪称经典,她说:“当我接下一个角色时,一定要有一个比较长的准备过程,不会应付。”“不应付”才配得上演员的称呼,在做准备的过程中,演员要慢慢地和角色融为一体,最后才能成就角色。正因为全情投入,所以巩俐才塑造了那么多至今都很少有人能够超越的经典角色,这也成就了她辉煌的一生。

3 MGKFCMs算法性质分析

3.1 MGKFCMs算法的多路径选择性

MGKFCMs 算法在每次迭代时,会并行产生两种聚类中心:梯度法聚类中心和PSO聚类中心对应生成两种目标函数值(t+1)及(t+1),当(t+1)小于(t+1)时,MGKFCMs 算法聚类中心第t+1迭代vi(t+1)选择为反之则选择为因此MGKFCMs算法的迭代路径有多种可能并且有多条路径选择,而不是仅仅依赖于梯度法迭代路径或PSO搜索迭代路径。MGKFCMs算法的多种路径选择特性说明了MGKFCMs算法兼有梯度法和PSO算法优解搜索的长处,从而能够更加快速有效地确定对参数的估计。

3.2 MGKFCMs聚类算法的收敛性分析

在每一次参数迭代时,MGKFCMs 算法就会有两种聚类中心:梯度法聚类中心和PSO聚类中心相应地得到两个核聚类目标函数值(t+1)及(t+1),根据梯度法和PSO算法的基本原理可知,(t+1)≤JMGKFCM (t)以及(t+1)≤JMGKFCM (t),所以有min{(t+1),(t+1)}≤ JMGKFCM(t),而MGKFCMs算法令JMGKFCM(t+1)= min{(t+1),(t+1)},所以有0<JMGKFCM(t+1)≤JMGKFCM(t),因此MGKFCMs 算法目标函数值必然形成一个收敛序列,MGKFCMs 算法在一定的迭代步骤后会收敛于聚类目标函数的稳定点。

4 仿真实验

因为MGKFCMs算法结合了GKFCMs算法和PSO-KFCMs算法的优势,所以为了验证本文所提出的MGKFCMs算法的有效性,将MGKFCMs算法与GKFCMs算法和PSO-KFCMs算法做比较测试。

4.1 公共测试数据集

PSO-KFCMs算法基于Iris数据集的最高平均分类精度为90.27,在参数σ=4,m=4时取得;最低平均分类精度为89.33,在参数σ=4,m=2及σ=16,m=2时取得。在聚类平均精度的基础上,再取聚类平均精度的平均为89.90。

 

Table 1 Attributes of Iris data set表1 Iris实验数据集属性

  

数据集样本数维数类别比Iris150450∶50∶50

4.2 仿真实验说明

在测试时,三种核聚类算法都选用Gauss核函数,Gauss核函数需要对Gauss核参数σ赋值,核参数σ取值为[21,22,23,24],聚类算法模糊指标m取值为[2,3,4]。在取核函数为Gauss核函数的情况下,GKFCMs算法由式(6)~式(8)作聚类运算,而PSO-KFCMs算法利用PSO算法在解空间中搜索聚类中心,依式(6)、式(7)和式(11)进行迭代,MGKFCMs算法在每次迭代时,首先由梯度法式(8)及PSO算法得到两聚类中心,然后根据式(6)和式(7)分别计算得到对应模糊隶属度和目标函数值,选择使得目标函数值小的聚类中心进行迭代。每种聚类算法根据参数和数据集进行10次测试,计算各类聚类平均精度。MGKFCMs、GKFCMs、PSO-KFCMs算法均选择对聚类中心做初始化。在MGKFCMs及PSO-KFCMs算法的有关PSO算法的初始化设置中,每个粒子的维数为c×d维,c=3为类别数,d=4为样本的维数,每个粒子的位置为12维,每4维分量对应某一类的聚类中心粒子位置的每维分量取值为[0,10],PSO算法适应度函数定义为式(11),粒子数取为20,迭代次数为50次。直接利用PSO算法搜索解的测试结果并不理想,这是因为在高维输入空间中,存在多个局部极值点,有的极值点的聚类效果并不好,当PSO算法在搜索时落入了这些局部极值点,则导致聚类算法失效,因此利用FCMs算法首先作聚类分析,然后将所得三类聚类中心串联作为一个初始粒子值代入PSO算法中。

随着科学技术的不断发展,人工智能所引导的未来社会样态已经基本浮现。与此同时,学生的学习不应当仅仅局限于教材知识的掌握、应试概念的习得与特定能力的培养,而应该指向的是未来社会的要求。教师应当为未来社会培养能够独立思考并具有人格特质的学生。那么,这一基本要求的具体实现路径是什么?研究者认为当下热烈讨论的深度学习则给予了强有力的时代回应。深度学习原本是起源于人工智能领域机器模拟人脑神经元计算方式的一种算法程序。自其被引入教育教学领域后,其多表示为学生在应对具有挑战性的学习内容时,在学生理解知识的基础上,学习主动性增强、迁移能力提升、学科体系建构与高阶思维掌握的一种学习过程或学习状态[1]。

4.3 基于Iris数据集的实验结果及分析

高斯尺度参数σ和模糊指标m的设置对聚类算法影响较大,所以依参数不同取值表现算法聚类结果,三模型聚类结果分别如表2~表4所示。

 

Table 2 Test results of MGKFCMs on Iris data set表2 MGKFCMs算法基于Iris数据集的测试结果

  

聚类模型MGKFCMs类1类2类3平均σ=2 m=2100.0092.4078.0090.13σ=2 m=3100.0090.2082.4090.87σ=2 m=4100.0090.2087.0092.40σ=4 m=2100.0094.0074.0089.33σ=4 m=3100.0093.4078.0090.47σ=4 m=4100.0092.0081.8091.27σ=8 m=2100.0094.0074.0089.33σ=8 m=3100.0094.0078.0090.67σ=8 m=4100.0093.2078.0090.40σ=16 m=2100.0094.0074.0089.33σ=16 m=3100.0094.0076.0090.00σ=16 m=4100.0093.8078.0090.60

MGKFCMs算法基于Iris数据集的最高平均分类精度为92.40,在参数σ=2,m=4时取得;最低平均分类精度为89.33,分别在参数σ=4,m=2和σ=16,m=2时取得。在聚类平均精度的基础上,再取聚类平均精度的平均为90.40。

乳腺肉瘤的发病原因不是很清楚,有学者认为可能与性激素的紊乱及妊娠有一定关系[4]。也有研究认为与乳腺纤维腺瘤相关[5]。Huang等报道放疗增加乳腺肉瘤的发生率[6]。本病没有明显的家族遗传性。乳腺肉瘤多发生于女性,男性较为罕见。其发病年龄较乳腺癌早,多在25~50岁。双侧乳腺均可出现乳腺肉瘤,以单侧乳腺外上象限多见,肿块主要特点为无痛、可活动、迅速生长,这与乳腺癌不同,并且不伴有乳头溢液,很少侵及局部皮肤。其转移途径主要为血行转移,淋巴转移少见。

 

Table 3 Test results of GKFCMs on Iris data set表3 GKFCMs算法基于Iris数据集的测试结果

  

聚类模型GKFCMs类1类2类3平均σ=2 m=2100.0092.0078.0090.00σ=2 m=3100.0090.0082.0090.67σ=2 m=4100.0090.0087.6092.53σ=4 m=2100.0094.0076.0090.00σ=4 m=3100.0092.0078.0090.00σ=4 m=4100.0092.0080.8090.93σ=8 m=2100.0094.0074.0089.33σ=8 m=3100.0094.0077.2090.40σ=8 m=4100.0092.8078.2090.33σ=16 m=2100.0094.0074.0089.33σ=16 m=3100.0094.0077.2090.40σ=16 m=4100.0092.8079.6090.80

GKFCMs算法基于Iris数据集的最高平均分类精度为92.53,在参数σ=2,m=4时取得;最低平均分类精度为89.33,分别在参数σ=8,m=2和σ=16,m=2时取得。在聚类平均精度的基础上,再取聚类平均精度的平均为90.39。

 

Table 4 Test results of PSO-KFMCs on Iris data set表4 PSO-KFCMs算法基于Iris数据集的测试结果

  

聚类模型PSO-KFCMs类1类2类3平均σ=2 m=2100.0094.0076.0090.00σ=2 m=3100.0092.6077.8090.13σ=2 m=4100.0092.2078.8090.33σ=4 m=2100.0094.0074.0089.33σ=4 m=3100.0094.0075.8089.93σ=4 m=4100.0093.4077.4090.27σ=8 m=2100.0094.0074.0089.33σ=8 m=3100.0094.0076.0090.00σ=8 m=4100.0093.6077.0090.20σ=16 m=2100.0094.0074.0089.33σ=16 m=3100.0094.0075.6089.87σ=16 m=4100.0093.8076.4090.07

基于UCI机器学习数据库中的公共数据集进行算法比对测试,所选数据集为Iris数据集,数据集的信息如表1所示。

应用PPP融资模式具体项目的研究,主要包括污水处理项目[4]、基于循环经济的中水项目[5]、城市轨道交通[6]、新型城镇化建设、城市基础设施[7]等方面。

由表2~表4可知,MGKFCMs、GKFCMs、PSO-KFCMs算法关于Iris数据集都能取得较好的聚类结果,且聚类效果相差不多。MGKFCMs、GKFCMs的最低平均聚类精度为89.33,与PSO-KFCMs算法的最低平均聚类精度相同,说明了梯度信息对聚类算法聚类有效性的影响,GKFCMs在参数σ=2,m=4时取得三算法的最高平均聚类精度92.53,在再平均聚类精度上MGKFCMs算法为90.40,充分体现了梯度信息引入对算法求解的优化作用,也表明了MGKFCMs算法的有效性。

4.4 基于高斯数据集的仿真实验及结果分析

构造三类二维高斯数据集作算法比对测试,三类二维高斯数据集的中心分别为(5,5)、(10,5)、(7.5,9.5826),这三个中心构成一个等边三角形,即三类数据集的中心是等距的,且三类高斯数据集的协方差矩阵都为[2 0,0 2],协方差矩阵用以反映数据集的离散程度,三类数据集的样本数都取为50。基于三类二维高斯数据集的算法测试与基于Iris数据集的测试类似,唯一不同的是样本维数d=2。测试结果分别如表5~表7所示。

“那是,我不喜欢的工作我都干五年了,人一辈子有几个五年?我想过得幸福点,干自己喜欢干的事儿,过自己喜欢过的日子,这要求过分吗?”

3.心理学家指出,无休止地抱怨,或者向他人施加压力等行为,都是对一个人的精神施暴。孩子的承受能力毕竟有限,一旦这种压力达到一定程度,要不就“给个耳朵勉强听着”,要不就本着“哪里有压迫,哪里就有反抗”的原则“反驳”家长。这样势必是亲子关系恶化,造成亲子沟通不良的严重后果。

 

Table 5 Test results of MGKFCMs on Gauss data set表5 MGKFCMs算法基于高斯数据集的测试结果

  

聚类模型MGKFCMs类1类2类3平均σ=2 m=296.6093.0095.2094.93σ=2 m=396.6092.4095.4094.80σ=2 m=496.0091.0096.0094.33σ=4 m=296.0094.0094.0094.67σ=4 m=396.0094.0094.0094.67σ=4 m=496.2093.6095.2095.00σ=8 m=296.0094.0094.0094.67σ=8 m=396.0094.0094.0094.67σ=8 m=496.0094.0094.0094.67σ=16 m=296.0094.0094.0094.67σ=16 m=396.0094.0094.0094.67σ=16 m=496.0094.0094.0094.67

 

Table 6 Test results of GKFCMs on Gauss data set表6 GKFCMs算法基于高斯数据集的测试结果

  

聚类模型GKFCMs类1类2类3平均σ=2 m=294.0092.0096.0094.00σ=2 m=394.0092.0096.0094.00σ=2 m=494.0092.0096.0094.00σ=4 m=292.0092.0096.0093.33σ=4 m=394.0092.0096.0094.00σ=4 m=492.2092.0096.0093.40σ=8 m=292.0092.0096.0093.33σ=8 m=392.0092.0096.0093.33σ=8 m=492.0092.0096.0093.33σ=16 m=292.0092.0096.0093.33σ=16 m=392.0092.0096.0093.33σ=16 m=492.0092.0096.0093.33

 

Table 7 Test results of PSO-KFCMs on Gauss data set表7 PSO-KFCMs算法基于高斯数据集的测试结果

  

聚类模型PSO-KFCMs类1类2类3平均σ=2 m=298.0092.0090.0093.33σ=2 m=398.0090.6090.0092.87σ=2 m=498.0090.0090.0092.67σ=4 m=298.0092.0092.0094.00σ=4 m=398.0092.0090.4093.47σ=4 m=498.0090.8090.0092.93σ=8 m=298.0092.0092.0094.00σ=8 m=398.0092.0091.8093.93σ=8 m=498.0091.0090.6093.20σ=16 m=298.0092.0092.0094.00σ=16 m=398.0092.0092.0094.00σ=16 m=498.0091.0090.6093.20

MGKFCMs算法基于高斯数据集的最高平均分类精度为95.00,最低平均分类精度为94.33,在聚类平均精度的基础上,再取聚类平均精度的平均为94.70。GKFCMs算法基于高斯数据集的最高平均分类精度为94.00,最低平均分类精度为93.33,聚类平均精度再平均为93.56。PSO-KFCMs算法基于高斯数据集的最高平均分类精度为94.00,在参数σ=4,m=4时取得,最低平均分类精度为92.67,聚类平均精度的再平均为93.47。基于高斯数据集的对比测试表明,就最高平均分类精度、最低平均分类精度、聚类平均精度的再平均三个指标而言,MGKFCMs算法能够表现出相对于GKFCMs、PSO-KFCMs算法更好的聚类性能,同时也说明MGKFCMs算法对GKFCMs、PSO-KFCMs两算法各自优势的有效利用。

5 结束语

对于核模糊聚类算法[12]而言,核聚类中心的有效表示是运用核方法的关键。为了综合有效地利用梯度法和PSO算法在聚类中心估计中的优势,提出了多路径高斯核模糊C均值聚类算法(MGKFCMs)。MGKFCMs算法将Gauss核函数应用于KFCMs算法的目标函数和模糊隶属度中,得到MGKFCMs算法的目标函数和模糊隶属度,并利用目标函数最小化为评价标准,在迭代过程中对梯度聚类中心和PSO聚类中心进行选择,选取使得目标函数值小的聚类中心作为参量迭代路径。理论分析了MGKFCMs算法相关性质并通过仿真实验作了算法的有效性验证。

参考文献:

[1] Bezdek J C,Ehrlich R,Full W.FCM:The fuzzy c-means clustering algorithm[J].Computers & Geosciences,1984,10(2-3):191-203.

[2] krjanc I,Dovžan D.Evolving Gustafson-kessel possibilistic c-means clustering[J].Procedia Computer Science,2015,53(1):191-198.

[3] Verma H,Agrawal R K,Sharan A.An improved intuitionistic fuzzy C-means clustering algorithm incorporating local information for brain image segmentation[J].Applied Soft Computing,2016,46(C):543-557.

[4] Parastar H,Bazrafshan A.Fuzzy C-means clustering for chromatographic fingerprints analysis:A gas chromatography-mass spectrometry case study[J].Journal of Chromatography A,2016,1438:236-243.

[5] Girolami M.Mercer kernel based clustering in feature space[J].IEEE Transactions on Nerual Networks,2002,13(3):780-784.

[6] Zhang Li,Zhou Wei-da,Jiao Li-cheng.Kernel clustering algorithm[J].Chinese Journal of Computers,2002,25(6):587-590.(in Chinese)

[7] Wu Zhong-dong, Gao Xin-bo,Xie Wei-xin. A study of a new fuzzy clustering algorithm based on the kernel method[J].Journal of Xidian University,2004,31(4):533-537.(in Chinese)

[8] Zhang D Q,Chen S C.Fuzzy clustering using kernel method[C]∥Proc of International Conference on Control and Automation,2002:162-163.

[9] Yang Guang-quan, Zhu Chang-ming.Particle swarm optimization algorithm based fuzzy kernel clustering method[J].Journal of Shanghai Jiaotong University,2009,43(6):935-939.(in Chinese)

[10] Niu Q,Huang X J.An improved fuzzy C-means clustering algorithm based on PSO[J].Journal of Software,2011,6(5):873-879.

[11] Kumar S,Singh S K.Hybrid BFO and PSO swarm intelligence approach for biometric feature optimization[J].International Journal of Swarm Intelligence Research,2016,7(2):36-62.

[12] Ding Y,Fu X.Kernel-based fuzzy c-means clustering algorithm based on genetic algorithm[J].Neurocomputing,2016,188:233-238.

附中文参考文献:

[6] 张莉,周伟达,焦李成.核聚类算法[J].计算机学报,2002,25(6):587-590.

[7] 伍忠东,高新波,谢维信.基于核方法的模糊聚类算法[J].西安电子科技大学学报(自然科学版),2004,31(4):533-537.

[9] 杨广全,朱昌明.基于粒子群优化的模糊核聚类方法[J].上海交通大学学报,2009,43(6):935-939.

 
文传军,汪庆淼
《计算机工程与科学》2018年第05期文献

服务严谨可靠 7×14小时在线支持 支持宝特邀商家 不满意退款

本站非杂志社官网,上千家国家级期刊、省级期刊、北大核心、南大核心、专业的职称论文发表网站。
职称论文发表、杂志论文发表、期刊征稿、期刊投稿,论文发表指导正规机构。是您首选最可靠,最快速的期刊论文发表网站。
免责声明:本网站部分资源、信息来源于网络,完全免费共享,仅供学习和研究使用,版权和著作权归原作者所有
如有不愿意被转载的情况,请通知我们删除已转载的信息 粤ICP备2023046998号