更全的杂志信息网

犹豫模糊信息下的协相关度与聚类分析*

更新时间:2009-03-28

1 引言

由于客观世界的复杂性和个人认知水平的差异性,针对同一问题往往有不同的看法,有时很难达成一致。例如在经济管理与决策问题中,讨论备选方案满足某一准则时,有些专家给出的隶属度值是0.6,有些专家认为是0.7,还有些专家坚持0.8比较合理。他们观点不一,又难以说服对方。又如决策者在做决策时常常表现出犹豫不决和优柔寡断的状态,这时用来描述决策信息的模糊集的隶属度用一个确定的值来刻画很难反映决策者的真实情况。为此,Torra和Narukawa[1-2]提出了另一种广义模糊集——犹豫模糊集。犹豫模糊集的隶属度是由一些可能的数值组成的集合,这样可以兼顾决策者的不同偏好,得到更合理全面的决策结果。更为重要的是,它避免了使用各种算子来合成各专家提供的数据,能直观描述不同决策成员给出的意见,因而可以直接反映和处理它们,从而减少了数据的流失。Torra等人在文献[1-2]讨论了犹豫模糊集与直觉模糊集[3]、二型模糊集[4]和模糊多集[5]之间的区别与联系,指出犹豫模糊集包含直觉模糊集,它是二型模糊集的特例,与模糊多集形式上相同,但运算法则不同。犹豫模糊集自诞生以来,发展速度很快,其中徐泽水和夏梅梅及其团队[6-10]为犹豫模糊集的进一步研究做出了重要贡献。

常规治疗组患者选择采用复方丹参注射液,选择采用20 mL复方丹参注射液加入到500 mL生理盐水当中,对患者进行静脉点滴,每天对患者进行一次治疗。

熵和相关性测度是模糊集理论中两个重要的研究课题,其理论早被应用到诸如数据分析、模式识别、聚类分析、决策以及图像处理等许多领域。从原先热学上的熵到信息论中的信息熵、相对熵,再到模糊集上的模糊熵、直觉模糊熵、犹豫模糊熵,最终形成了一套公理化体系。其中交叉熵测度主要度量两个集合的区别信息,吸引了众多学者对其进行研究。文献[11]提出了一些直觉模糊环境下的交叉熵和直觉模糊熵的公式,并把它们运用到群决策当中。文献[12-15]给出了熵、交叉熵、距离测度和相似性侧度之间的联系以及公理化定义,并把它们应用到区间值模糊集上。文献[16]将模糊集的熵、交叉熵推广到犹豫模糊环境下,给出犹豫模糊集的熵测度、交叉熵测度及其公理化形式,并讨论了犹豫模糊集的熵、相似度以及交叉熵之间的关系,最终将它们应用到多属性决策中。Gerstenkorn和Manko[17]把统计学中相关系数的概念推广到直觉模糊集上,Hong和Hwang[18]又把它们定义到概率空间上。文献[19]通过重心法来计算直觉模糊集的相关系数,此后又有学者将相关系数推广到区间型直觉模糊集上[20-21]。文献[22]仔细分析了犹豫模糊信息下距离与相关度的关系,提出了基于距离的相关度公式,该公式构造合理,易被人们接受,但其结构不精,适用面不宽,很多情形下与事实不符。文献[23]提出了基于距离的犹豫模糊相似度公式,但公式的分辨率不够高,度量结果有时与实际情况相差很大。文献[24]把信息论中的相对熵迁移到犹豫模糊集上,并把犹豫模糊相对熵对称化,提出对称交互熵,针对基于距离的相似度公式的缺陷,利用对称交互熵定义一种新的相似度公式。文献[25]将直觉模糊集的相关性测度延伸至犹豫模糊环境下,定义并证明了犹豫模糊集的两种相关系数,但这种相关系数实际上是基于向量的观点,会出现即使两个样本不同,其相关系数也可能为1的情况。

聚类是把一系列的对象、方案或事件等分成若干个类的过程,每个类中对象的特征比其他类有更高的相似性。聚类分析是利用数学的方法按照确定的标准对客观事物进行分类,将样本的相似程度作为划分原则,这样选择合适的相似度就成为聚类的关键。随着信息时代的到来,特别是在大数据趋势下,聚类分析作为信息处理的重要一步,越来越受到人们的重视。因为现实的分类往往伴随着模糊性,所以用模糊理论来进行聚类分析会显得更自然,更符合客观实际,因此便产生了模糊聚类分析。面对不同的模糊环境,人们提出了各种聚类算法来处理不同类型的模糊数据,如直觉模糊聚类算法[26-28]、二型模糊聚类算法[29-30]等。在犹豫模糊情形下,文献[24]是通过编网的聚类方法,在利用相似度公式计算得到的关联矩阵上直接进行表上作业,此方法快速有效,操作简单,直观性很强,但它所有的聚类边界或者是水平的,或者是竖直的,没有对角的边界,结构单一,过程粗糙,且当样本容量较大时,容易产生混乱甚至无法进行操作,同时它很难利用计算机进行程序设计,这种直观分类在一定程度上降低了聚类的质量和准确性;文献[25]利用导出的相关系数公式构造相似矩阵,通过平方法获得等价矩阵,进而对样本数据进行聚类分析,采用经典方法聚类,但聚类结果不够精细,与事实不是特别吻合。

针对以上问题,本文首先从文献[16]关于犹豫模糊元的公理化定义出发,构造任意两个犹豫模糊元新的交叉熵公式,把它作为一种距离,并与文献[23]中的各种距离公式进行比较,突出其优势所在。然后基于此交叉熵距离,在属性权重完全未知的情况下,根据离差最大化[31]原则建立非线性规划模型得到属性权重公式。接着由概率统计[32]中相关系数的定义结构,得出犹豫模糊集的协相关度公式,并证明了它与一般相关系数类似的性质。考虑到论域里不同元素对结果的影响不同,故将协相关度加权(权重通过得出的属性权重公式获得),最后利用加权的协相关度公式构造协相关矩阵,再把协相关矩阵转化为等价矩阵,进而做聚类分析。

2 概念准备

定义1[1-2]X是一个给定的集合,称为论域,则二元组A={x,hA(x)|xX}称为定义在X上的一个犹豫模糊集。其中hA(x)是区间[0,1]上若干个不同的数组成的集合,表示元素x属于集合A若干个可能的隶属度。为表述方便,把有限论域X上的全体犹豫模糊集记为HFS(X),称hA(x)为A的犹豫模糊元,简写为hA

特别地,当犹豫模糊集的每一个犹豫模糊元都只有一个元素时,则犹豫模糊集就退化为普通模糊集。可见犹豫模糊集是普通模糊集的推广,这里主要是隶属度的推广,由一值变为多值。

值得注意的是,不同的犹豫模糊元中元素的个数可能不同且这些元素的排列顺序通常是紊乱的,为便于不同犹豫模糊元的比较与运算,这里做出规定:

因此有c≥0,又,故C(hA,hB)≥ 0。

然后将函数L分别对wkξ求偏导,并令之为0,得:

为了度量不同犹豫模糊集的区别信息,这里引入交叉熵的概念。文献[16]给出了两个犹豫模糊元的交叉熵的公理化定义。

定义2[16]αβ是任意两个犹豫模糊元,则它们的交叉熵C(α,β)应满足下面两个公理化条件:

(1)C(α,β)≥ 0

果冻亦称啫喱,呈半固体状,由食用明胶加水、甜味剂、果汁或其他汁液制成。其外观晶莹、色泽鲜艳、口感软滑,深受大众欢迎,尤其是女性和儿童[1]。随着社会经济发展与人们生活水平的提高,营养保健食品是当今世界饮食消费的新动向,加上人们对健康保健的越来越重视,果冻产品的未来主流必然是趋向天然化和功能性[2]。此外,果冻为低热量食品,想减肥或保持苗条身材的人可以放心食用,是减肥美容之佳品。

(2)C(α,β)=0⇔ ασ(i)=βσ(i),∀i=1,2,…,l

按照以上定义方式,构造任意两个犹豫模糊元的交叉熵公式。

定义3hA(xi)、hB(xi)分别为犹豫模糊集AB的犹豫模糊元,∀xiXX={x1,x2,…,xn},则称:

 

为犹豫模糊元hA(xi)和hB(xi)的交叉熵,简记为C(hA,hB)。

由定义3交叉熵的结构,不难得到下面的定理。

定理1 设 ∀A,BHFS(X),hAhB分别是 AB 的犹豫模糊元,则C(hA,hB)满足:

(1)C(hA,hB)≥ 0

(2)C(hA,hB)=0 ⇔hA=hB,即X,j=1,2,…,li

(3)C(hA,hB)=C(hB,hA)

证明 令:

 

(1)要证C(hA,hB)≥0,只需证c≥0。设 f(x)=xp,0≤ x≤ 1且 p>1,则 f″(x)=p(p-1)xp-2≥ 0,即 f(x)是下凸函数,因此有Jensen不等式成立:

 

其中λk≥ 0。当 x1=x2=…=xm时,等号成立。因此有,0≤ xk≤ 1,i=1,2,3,4。现令 ,故:

 

(1)所有元素统一按升序排列。令σ:(1,2,…,n)→(1,2,…,n)为一个排序,使得 hσ(j)(xi)< hσ(j+1)(xi),即 ∀xi分别表示hA(xi)和hB(xi)中第 j小的元素,当且仅当时,有 hA(xi)=hB(xi)。

(2)若两个犹豫模糊元 hA=hB,即 =,j=1,2,…,li,显然有 C(hA,hB)=0;若 C(hA,hB)=0,则必有c=0。由Jensen不等式等号成立的条件,当且仅当 x1=x2=x3=x4时,等式成立,即当∀xiX,j=1,2,…,li时,等号成立,这时有hA=hB

解此模型,作Lagrange函数:

由定理1可知,定义3中的交叉熵实际上是一种距离测度,因此可以把C(hA,hB)看作两个犹豫模糊元hAhB的距离。C(hA,hB)越大,表示hAhB的差别越大,反之说明hAhB越接近。在犹豫模糊信息下,关于距离的定义很多。文献[23]给出了很多犹豫模糊元距离的公式,但本文提出的交叉熵距离在许多情形下特别是当两个犹豫模糊元比较接近的时候,具有更高的分辨效果。

X={x1,x2},定义在X上的3个犹豫模糊集ABC分别为:

 

比较这3个犹豫模糊集不难发现,犹豫模糊元hA(x1)与 hB(x1),hA(x2)与 hB(x2),hB(x2)与 hC(x2)它们相互间的隶属度很接近,因此在直观上AB的差别程度就比BC小,BC的差别程度比AC小。

利用文献[23]中的广义加权平均犹豫模糊距离公式:

(1)0≤ ρij≤ 1

 

λ=1,式(2)是归一化Hamming距离;λ=2,式(2)变成归一化Euclidean距离。

广义Hausdorff犹豫模糊距离:

 

λ=1,式(3)是Hamming-Hausdorff距离;λ=2,式(3)变为Euclidean-Hausdorff距离。

在实际应用中,有时还要度量犹豫模糊集之间的差别信息,为此定义:

设立穿越高铁现场值班室和远程监控调度室,由侧穿高铁桥梁桩基工作小组统一指挥,进行24h监测、值班和巡视制度,确保盾构下穿铁路期间地表、洞内、值班室信息互通,出现问题第一时间处理。

 

d(A,C)、d(B,C)、di(A,C)、di(B,C)可类似定义。分别利用式(1)、(2)、(3)计算 hAhB,hBhC,hAhC的距离,最终各犹豫模糊集间的距离如表1和表2所示。

 

Table 1 Generalized hesitant fuzzy distance under different parameters表1 不同参数下的广义犹豫模糊距离

  

d2(A,C)0.100 0 0.100 0 λ λ=1 λ=2 d1(A,B)0.041 7 0.064 2 d1(B,C)0.058 3 0.076 2 d1(A,C)0.100 0 0.100 0 d2(A,B)0.100 0 0.100 0 d2(B,C)0.100 0 0.100 0

 

Table 2 Cross-entropy distance under different parameters表2 不同参数下的交叉熵距离

  

p p=1.5 p=2.0 C(A,B)0.037 5 0.042 3 C(B,C)0.055 2 0.061 8 C(A,C)0.093 9 0.100 0

从表1、表2可以看出,若用式(3)计算它们的距离,无论λ取1还是2,其结果都是0.1,与直观认识不符;用式(2)计算AC的距离,λ取1和2,其值也都是0.1,由于这是一个静态的值,这就意味着无论犹豫模糊集B是怎样的,在比较ABBC的相似程度时,式(2)失去了意义。最后看本文提出的式(1),观察各个值可以看到,用式(1)算出的结果没有出现上述对象间差别程度相同的情况。可以大致看出ABC两两之间的距离(比如在比较ABBC之间的距离时),总体来看式(1)得出的结果表示的相互差异性最大(尽管ABC比较接近),这意味着相比于传统意义上的距离,新型的交叉熵距离的灵敏度更高,其表征的差异度明显。因此,用式(1)作为犹豫模糊元的距离是很合理的。

处女作《回到明朝当王爷》横扫网络,囊括多项年终大奖;《大争之世》《步步生莲》入围台湾图书借阅榜前二十名;《锦衣夜行》荣获台湾金石堂销量第一名。

3 基于交叉熵的属性权重确定方法

在多属性决策中,不同的属性对最终的决策起着不同的作用,应当赋予不同的权重。对于属性信息完全未知的多属性决策问题,需要从决策矩阵中挖掘出属性权重信息。本文提出的交叉熵既然可视作一种距离,那么就用这种距离来反映对象间的离差(上文已说明这种离差差别反映明显,因此用在此方法上很合理),由离差最大化方法获取属性权重。若所有对象在某属性下的属性值差异越小,说明该属性对决策结果所起的作用越小;反之,如果某属性能使所有对象的属性值有较大差异,则说明其对决策起重要作用。因此,从决策的角度考虑,对象属性值偏差越大的属性应该赋予越大的权重。

设对象集 A={A1,A2,…,Am},属性集 X={x1,x2,…,xn},权重向量w=(w1,w2,…,wn)T。用dijk表示在属性 xk下,对象AiAj在相应犹豫模糊元间的交叉熵距离,即 dijk=C(hAi(xk),hBj(xk))。令 Dk(w)=(k=1,2,…,n),表示对属性xk而言,所有对象与其他对象的总离差。

根据上述分析,加权向量w的选择应使所有属性对所有对象的总离差最大。为此,可建立如下的优化模型:

 

(3)结论显然。

 

(2)用 l(hA(xi))、l(hB(xi))分别表示 hA(xi)和 hB(xi)中元素的个数,令 li=max{l(hA(xi)),l(hB(xi))},若 l(hA(xi))≠l(hB(xi)),则在元素少的集合里重复添加元素,使得该集合的元素个数达到li。添加的原则依据决策者的风险偏好:喜好风险的决策者会对预期结果有比较乐观的估计,通常添加该集合中最大的元素;而厌恶风险的决策者对预期结果的估计一般比较悲观,则是添加该集合中最小的元素。为方便起见,本文不妨统一采用乐观准则添加元素。例如两个犹豫模糊元:hA(x1)={0.2,0.4},hB(x1)={0.3,0.5,0.6},很明显 l(hA(xi))<l(hB(xi)),为保证运算能够进行,将hA(x1)扩充为hA(x1)={0.2,0.4,0.4}。

 

由此得到:

 

再将权重归一化,得:

 

从式(4)可以看出,在属性xk下,各对象间的总离差越大,该属性的权重就越大,反之相应的权重越小。因此,式(4)的结果符合上述权重分配的要求。

4 犹豫模糊集的协相关度

在统计学中,两组数据XY的相关系数定义为:

(1)J1激电异常带:位于矿区中部JP1~JP19激电中梯剖面测量区段内,长度约3379m,宽度为400~650m,形态规则,呈NW向展布,视电阻率为0~85Ω·m,视极化率为1.6%~15.32%,为本区规模最大,成矿条件较好的激电异常带。异常带出露地层为斜长角闪片岩、大理岩,岩石硅化较强。经探矿工程揭露查证,地表圈定9条石墨矿体(M1~M4、M6、M7、M9、M13、M14),矿体走向和激电异常带展布形态基本一致,地表矿体出露地段多数为激电异常尖峰区段,异常中心深部含矿岩石星点状、片状、细脉状黄铁矿普遍发育,说明此异常带主要为石墨矿和金属硫化物富集共同引起的叠加异常。

 

其中cov(X,Y)=E{[X-E(X)][Y-E(Y)]}表示随机变量XY的协方差;D(X)=E[X-E(X)]2,D(Y)=E[Y-E(Y)]2分别表示XY的方差。

鉴于这种构造思想,可以类比得出两个犹豫模糊集的协相关度。

定义4 A={xi,hA(xi)|xiX},B={xi,hB(xi)|xi…,li},hB(xi)={hσ(j)B(xi)|j=1,2,…,li},X={x1,x2,…,xn},则AB的协相关度:

 

其中:

设计中综合运用上述各种抗干扰措施,信号传输采用RS422电平标准,以正/负差分信号的形式传输,可有效抗辐射干扰,具有抗干扰能力强、驱动距离远的优点,结合常规的EMC设计,包括阻抗匹配、电源滤波、正确的接地处理、尽可能远离干扰源布线等,保证了硬件抗干扰措施的有效性。

 

正是通过大大小小、各个层面的PDCA循环,通过这种持续的改善,管理才能得到不断的改进与提升。因此大家在实践中会觉得管理是一件枯燥、乏味的事情,并且需要不断地重复这种枯燥和乏味。一个人能否有一番成就,就在于落实想法的执行层面,能不能忍耐住这种单调和乏味。举一反三,一个企业与另一个企业的发展步子之所以有所不同,不是在于两者比拼有多么高的资源能力和战略布局,最终拼的,还是管理的素养。

(1)R(A,B)=R(B,A)

定理2 A,BHFS(X),R(A,B)都满足:

(2)-1≤ R(A,B)≤ 1

(3)A=BR(A,B)=1

证明(1)由R(A,B)公式定义的结构,结论显然成立。

(2)由Cauchy-Schwarz不等式:

 

(3)显然成立。

由定理2知,R(A,B)∈[-1,1]。当 R(A,B)>0 时,表示犹豫模糊集AB正相关,其值越大表明它们的相关性就越大;当R(A,B)<0时,说明AB负相关,其值越小表示它们的这种负相关性越强。简而言之,当|R(A,B)|越靠近1时,认为AB的相关性越强。

除了将抽象难懂的知识点类比生活中的事物外,更要根据学生的特点优化处理教材,省略一些和实际操作联系不紧密的深层次理论,并把某些知识点揉进操作案例中,例如实体完整性,参照完整性的含义和作用,就可以融入到编辑数据表当中去[3]。

在实际应用中,论域里不同的元素占有不同的地位,应赋予不同的权重。设元素xi(i=1,2,…,n)的权重为 wi,满足wi∈[0,1],故在式(5)的基础上,将协相关度公式加权:

 

同样地,Rw(A,B)也满足下面的性质:

(1)Rw(A,B)=Rw(B,A)

(2)-1≤ Rw(A,B)≤ 1

(3)A=BRw(A,B)=1

证明过程与定理2类似,这里不再赘述。

本文从调压井工程项目的超前管棚、导井、土方开挖、一次支护和混凝土二次衬砌等各道施工工序,详细介绍了调压井的实际施工方案,并重点通过超前管棚施工和出渣方式的施工方案与常规的设计施工方案进行比较,总结出了进度快、投资少、安全隐患少的调压井施工方案。

5 基于犹豫模糊协相关度的聚类分析

5.1 知识准备

定义5A1,A2,…,Amm个犹豫模糊集,称R=(ρij)m×n为协相关矩阵,其中 ρij=Rw(Ai,Aj),i=1,2,…,m,表示两个犹豫模糊集AiAj的协相关度,满足:

修复剂种类:本试验采用了5种化学修复剂,分别为2%骨炭(A)、2%活性炭(B)、2%磷矿粉(C)、2%土壤修复剂Ⅰ(D)、 2%土壤修复剂Ⅱ(E)。

(2)ρii=1

(3)ρij=ρji

从定义5可以看出,协相关矩阵是主对角元全为1的对称矩阵,且所有元素均在0到1之间,因此协相关实际上是一种相似关系。

《中级财务会计》课程实践环节成绩应该由网络课程出勤率、实践课程参与度、定岗实习企业财务指导成绩综合构成,全面反映高校本科生在本课程的完成度,并实现对课程全方位、有效考核。

定义6 R=(ρij)m×n是一个协相关矩阵,称 Rα=(ρij(α))m×nα-截矩阵,其中:

 

显然协相关矩阵的α-截矩阵是一个布尔矩阵。

定义 7[28]R=(ρ)是一个协相关矩阵,称ijm×mR2=RR=(ij)m×m为协相关矩阵的复合(乘积),其中

聚类分析的基本思想是用相似性尺度来衡量事物之间的亲疏程度,并以此来实现分类。由普通聚类可知,同类元素具有等价关系,因此在进行模糊聚类分析前必须建立模糊等价关系,其实质是根据研究对象本身的属性来构造模糊矩阵。基于相似关系下的模糊矩阵当然是相似矩阵,而本文主要应用模糊等价关系将对象聚类,因此必须把协相关关系下的相似矩阵改造成模糊等价矩阵。改造方法很多,本文采用平方法:RR2→(R2)2→…→R2k→…,直到。这时,模糊等价矩阵(R的传递闭包)

5.2 犹豫模糊聚类途径方法

A={A1,A2,…,Am},X={x1,x2,…,xn},w=(w1,w2,…,wn)T依次为对象集、属性集和权重向量。决策专家组对所有对象按各属性进行测度,得到犹豫模糊决策矩阵D=(hij)m×n,hij=hAi(xj)。在进行对象聚类分析前,需要对犹豫模糊决策矩阵D=(hij)m×n进行规范化处理,以消除各属性指标的量纲差别和数量级差别带来的影响。本文假设决策矩阵D已经过标准化处理。

有了以上各节的讨论,便可以给出犹豫模糊环境下基于等价关系的聚类途径,具体步骤如下:

至少有十多分钟的时间,念蓉的脑子里一片空白。她既不知道自己是如何走出酒店的,也不知道自己是如何将车子开上公路的。当终于回过神来,她发现,她的两条腿和两只手,都在抖个不停。

但动物园中的北白犀停止了繁殖。研究发现,雄性犀牛为了保护领地而发生争斗是激发性激素的重要途径。但人工环境中,雄性犀牛没有了领地,也无法维持以前的领地意识,性激素分泌锐减;雌性犀牛长期不能繁殖,导致繁殖能力衰退直至绝育。

(1)利用式(1)计算任意两个犹豫模糊集AiAj在属性xk下的交叉熵dijk,利用式(4)计算属性xk的权重 wk(k=1,2,…,n)。

(2)利用式(7)计算 AiAj加权的协相关度Rw(Ai,Aj),构造协相关矩阵R

(3)利用平方法将协相关矩阵R改造成等价关系矩阵t(R)。

(4)利用t(R)对所有对象进行聚类处理,给定不同置信水平α,求α-截矩阵t(R)α。一个α水平截矩阵就代表一种聚类,其方法是:布尔矩阵t(R)α的第i行(列)的所有元素与第 j行(列)的相应元素都相等,那么AiAj就归为一类。很明显,当α=1时,所有对象自成一类,随着α值的降低,对象由细到粗逐渐被归并,当α从1变化到0时,其分类数从m类变化到1类,最后形成动态聚类谱系图。

5.3 算例分析

某电脑大卖场欲对7种不同的电脑Ai(i=1,2,…,7)进行分类,需要考虑4个因素:价格 x1,功能 x2,服务x3,质量x4。决策组分别从这4个因素对这7种电脑进行评价,其决策信息以犹豫模糊集的形式给出,组成决策矩阵D=(hij)7×4hij表示对象 Ai满足属性xj的被评估值,如表3所示。

 

Table 3 Hesitant fuzzy decision matrix表3 犹豫模糊决策矩阵

  

x1x2x3x4 A1 A2 A3 A4 A5 A6 A7{0.4,0.6}{0.2,0.3,0.5}{0.2,0.3,0.4}{0.3,0.45,0.75}{0.8}{0.4,0.5,0.7}{0.6,0.7,0.9}{0.3,0.5,0.6}{0.2,0.4}{0.2,0.4}{0.3,0.6}{0.4,0.6,0.7}{0.4,0.6}{0.6,0.8}{0.2,0.3}{0.2,0.4,0.5}{0.2,0.3,0.5}{0.3,0.6,0.75}{0.3,0.4}{0.4,0.6,0.7}{0.6,0.8,0.9}{0.4}{0.3,0.4}{0.3}{0.45,0.6}{0.6,0.8}{0.5,0.6}{0.7,0.8}

(1)计算同一个属性下任意两个犹豫模糊元的交叉熵(由于决策矩阵牵涉到7个对象在4个属性下的交叉熵距离,数量庞大,故这些数据不再列出)。然后由式(4)得到属性权重w=(0.312 0,0.163 7,0.273 3,0.250 9)T

(2)根据式(7)得到任两种电脑 AiAj(i,j=1,2,…,7)加权的协相关度Rw(Ai,Aj),其协相关矩阵为:

 

(3)利用Matlab软件计算得到矩阵:

 

因此模糊等价矩阵t(R)=R4

(4)选定置信水平 α∈[0,1],构建 α-截矩阵 t(R)α,令α由1降至0,按t(R)α进行动态聚类:

①当0.998 6<α≤0时,Ai(i=1,2,…,7)被分为7类:{A1},{A2},{A3},{A4},{A5},{A6},{A7};

②当 0.992 1<α≤0.998 6时,Ai(i=1,2,…,7)被分为6类:{A1},{A2,A3},{A4},{A5},{A6},{A7};

③当 0.986 7<α≤0.992 1时,Ai(i=1,2,…,7)被分为5类:{A1},{A2,A3},{A4,A6},{A5},{A7};

④当 0.913 2<α≤0.986 7时,Ai(i=1,2,…,7)被分为4类:{A1,A2,A3},{A4,A6},{A5},{A7};

⑤当 0.752 7<α≤0.913 2时,Ai(i=1,2,…,7)被分为3类:{A1,A2,A3},{A4,A6,A7},{A5};

⑥当 0.576 9<α≤0.752 7时,Ai(i=1,2,…,7)被分为2类:{A1,A2,A3},{A4,A5,A6,A7};

⑦当0<α≤0.576 9时,Ai(i=1,2,…,7)被分为1类:{A1,A2,A3,A4,A5,A6,A7}。

如果利用文献[25]中犹豫模糊集的相关系数公式:

 

计算关联矩阵C,得:

 

构造等价关联矩阵,计算C2,C4,…,C2n,…,有C8=C4,即C4为一个等价关联矩阵:

 

选择不同的截割水平α∈[0,1],建立C4α-截矩阵,所得聚类结果如表4左侧所示,文献[33]和文献[34]中的聚类方法得到的聚类结果见表4中侧和右侧。

通过比较可以发现,文献[25]的聚类结果与本文主要有以下差别:(1)文献[25]中的相关系数公式最多可将样品分成6类,本文的协相关度公式所得结果则更加精细,可以满足不同层次的需求。(2)聚类结果存在很大差异。在聚为6类时,文献[25]把A2A4归为一类,事实上A2A4更接近,有的属性下甚至相等。在聚为5类时,文献[25]把A6A7归为一类,而 A4A6更相似,因此本文将 A2A3A4A6作为一类更合理,这也与文献[33]和文献[34]所得结果一致。

 

Table 4 Comparison of various clustering results表4 各种聚类的结果比较

  

分类 文献[25]的方法7 6 5 4 3 2 1{A1},{A2,A4},{A3},{A5},{A6},{A7}{A1},{A2,A4},{A3},{A5},{A6,A7}{A1},{A2,A4,A6,A7},{A3},{A5}{A1},{A2,A3,A4,A6,A7},{A5}{A1,A5},{A2,A3,A4,A6,A7}{A1,A2,A3,A4,A5,A6,A7}文献[33]的方法{A1},{A2},{A3},{A4},{A5},{A6},{A7}{A1},{A2,A3},{A4},{A5},{A6},{A7}{A1},{A2,A3},{A4,A6},{A5},{A7}{A1,A4,A6},{A2,A3},{A5},{A7}{A1,A2,A3,A4,A6},{A5},{A7}{A1,A2,A3,A4,A5,A6},{A7}{A1,A2,A3,A4,A5,A6,A7}文献[34]的方法{A1},{A2},{A3},{A4},{A5},{A6},{A7}{A1},{A2,A3},{A4},{A5},{A6},{A7}{A1},{A2,A3},{A4,A6},{A5},{A7}{A1,A2,A3},{A4,A6},{A5},{A7}{A1,A2,A3,A4,A6},{A5},{A7}{A1,A2,A3,A4,A6,A7},{A5}{A1,A2,A3,A4,A5,A6,A7}

造成这些差异的原因在于构造相似矩阵时所用的计算犹豫模糊集相关程度的公式上,本文的协相关度公式是源于统计学中相关系数的构造思想,因此有一定的理论支撑,它比文献[25]的相关系数公式复杂,这就保证了能充分利用决策矩阵中的数据,减少信息流失。此外,在计算论域里各元素的权重(属性权重)时,本文提出的交叉熵距离表示的差异程度相对于其他距离公式有更高的分辨率,用它得出的权重公式更加合理,能客观反映不同属性的地位差别。而文献[25]提出的方法需要权重矢量完全已知,没有充分挖掘决策信息本身,其结果与实际情况有一定的偏差。

文献[33]和文献[34]所用的聚类方法得到的分类结果与本文也有所不同。刘小弟等人[24]指出,文献[33]使用层次聚类法对犹豫模糊集进行聚类分析,利用最小距离作为聚类依据,一旦一组样本被合并,就需要利用犹豫模糊平均算子在新生成的类上重新计算聚类中心,这种反复性的计算很繁琐,而且平均算子的使用势必会造成一部分的信息丢失,导致最后的结果不可靠;文献[34]利用最小生成树(minimum spanning tree,MST)算法得到聚类结果,它所使用的距离公式分辨率不够高,且属性权重带有一定的主观性,计算出的结果有时与事实有较大偏差,这必然会影响最后的聚类。

本文利用犹豫模糊信息的交叉熵作为距离,基于离差最大化方法获得属性权重,提出加权的协相关度公式,使用模糊等价聚类方法,借助于计算机软件计算模糊等价矩阵,进而获得聚类结果。相比于其他方法,该算法设计合理,操作过程程序化,便于计算机处理,易形成动态聚类,且能有效保留信息,使计算结果客观可靠。

6 结束语

模糊集理论作为不确定理论中重要的一支,因能深刻真实地反映现实客观世界与人们内心世界而被广泛应用到运筹与管理、经济与决策各个领域,相继出现了直觉模糊集、模糊软集、区间型模糊集以及模糊数等推广演变形式,它们构成了一个模糊理论体系,但这些理论对实际问题刻画得不够细致具体。在进行重大决策时经常是多个决策者共同参与,这就势必会出现意见不统一或者决策者自身就徘徊不定的情况,因此犹豫模糊集被提出。它是经典模糊集的另一种推广,其隶属度允许一个或几个可能的值,这样就能全面描述人们的真实想法,且能避免使用各种算子来合成各个专家提供的数据,从而能直接处理它们,减少了信息的丢失。

聚类分析是数量统计中多元分析的一个分支,它是一种硬划分,把每个待辨识的对象严格地划分到某个类当中,具有非此即彼的性质,这种分类的类别界限是分明的。因为现实的分类往往伴随着模糊性,所以用模糊理论来进行聚类分析会显得更自然,更符合客观实际[35]。目前模糊理论在聚类分析方面的应用已得到很大发展,但数据类型是犹豫模糊元的聚类分析还不多见。本文针对犹豫模糊环境下的聚类分析,提出犹豫模糊集的协相关度的概念,在获取论域各元素的权重上,使用分辨率较高的交叉熵距离建立优化模型得到,以确保加权的协相关度公式在计算不同犹豫模糊集的关联程度时更加灵敏合理,构建的关联矩阵更能体现不同对象的差异性。基于这些理论成果,最后给出了犹豫模糊信息下的聚类方法,并通过具体实例说明了所提聚类方法的可行性与有效性。

References:

[1]Torra V,Narukawa Y.On hesitant fuzzy sets and decision[C]//Proceedings of the 18th IEEE International Conference on Fuzzy Systems,Jeju Island,Aug 20-24,2009.Piscataway:IEEE,2009:1378-1382.

[2]Torra V.Hesitant fuzzy sets[J].International Journal of Intelligent Systems,2010,25(6):529-539.

[3]Atanassov K T.Intuitionistic fuzzy sets[J].Fuzzy Sets and Systems,1986,20(1):87-96.

[4]Dubois D,Prade H.Fuzzy sets and systems:theory and applications[M].Orlando:Academic Press,Inc,1980.

[5]Yager R R.On the theory of bags[J].International Journal of General Systems,1986,13(1):23-37.

[6]Xia Meimei,Xu Zeshui.Hesitant fuzzy information aggregation in decision making[J].International Journal of Approximate Reasoning,2011,52(3):395-407.

[7]Xia Meimei,Xu Zeshui,Chen N.Some hesitant fuzzy aggregation operators with their application in group decision making[J].Group Decision and Negotiation,2013,22(2):259-279.

[8]Xu Zeshui,Zhang Xiaolu.Hesitant fuzzy multi-attribute decision making based on TOPSIS with incomplete weight information[J].Knowledge-Based Systems,2013,52(6):53-64.

[9]Zhu Bin,Xu Zeshui,Xia Meimei.Dual hesitant fuzzy sets[J].Journal of Applied mathematics,2012.doi:10.1155/2012/879629.

[10]Zhu Bin,Xu Zeshui.Some results for dual hesitant fuzzy sets[J].Journal of Intelligent and Fuzzy Systems,2014,26(4):1657-1668.

[11]Xia Meimei,Xu Zeshui.Entropy/cross entropy-based group decision making under intuitionistic fuzzy environment[J].Information Fusion,2012,13(1):31-47.

[12]Liu Xuecheng.Entropy,distance measure and similarity measure of fuzzy sets and their relations[J].Fuzzy Sets Systems,1992,52(3):305-318.

[13]Zeng Wenyi,Li Hongxing.Relationship between similarity measure and entropy of interval-valued fuzzy sets[J].Fuzzy Sets Systems,2006,157(11):1477-1484.

[14]Zeng Wenyi,Guo Ping.Normalized distance,similarity measure,inclusion measure and entropy of interval-valued fuzzy sets and their relationship[J].Information Sciences,2008,178(5):1334-1342.

[15]Zhang Qiansheng,Jiang Shengyi.Relationships between entropy and similarity measure of interval-valued intuitionistic fuzzy sets[J].International Journal of Intelligent Systems,2010,25(11):1121-1140.

[16]Xu Zeshui,Xia Meimei.Hesitant fuzzy entropy and crossentropy and their use in multiattribute decision-making[J].International Journal of Intelligent Systems,2012,27(9):799-822.

[17]Gerstenkorn T,Manko J.Correlation of intuitionistic fuzzy sets[J].Fuzzy Set Systems,1991,44(1):39-43.

[18]Hong D H,Hwang S Y.Correlation of intuitionistic fuzzy sets in probability spaces[J].Fuzzy Set Systems,1995,75(1):77-81.

[19]Hung W L,Wu J W.Correlation of intuitionistic fuzzy sets by centroid method[J].Information Sciences,2002,144(1/4):219-225.

[20]Bustince H,Burillo P.Correlation of interval-valued intuitionistic fuzzy sets[J].Fuzzy Set Systems,1995,74(2):237-244.

[21]Hong D H.A note on correlation of interval-valued intuitionistic fuzzy sets[J].Fuzzy Set Systems,1998,95(1):113-117.

[22]Xu Zeshui,Xia Meimei.On distance and correlation measures of hesitant fuzzy information[J].International Journal of Intelligent Systems,2011,26(5):410-425.

[23]Xu Zeshui,Xia Meimei.Distance and similarity measures for hesitant fuzzy sets[J].Information Sciences,2011,181(11):2218-2138.

[24]Liu Xiaodi,Zhu Jianjun,Liu Sifeng.Similarity measure of hesitant fuzzy sets based on symmetric cross entropy and its application in clustering analysis[J].Control and Decision,2014,29(10):1816-1822.

[25]Chen Na,Xu Zeshui,Xia Meimei.Correlation coefficients of hesitant fuzzy sets and their applications to clustering analysis[J].Applied Mathematical Modeling,2013,37(4):2197-2211.

[26]Xu Zeshui.Intuitionistic fuzzy hierarchical clustering algo-rithms[J].Journal of Systems Engineering and Electronics,2009,20(1):90-97.

[27]Wang Zhong,Xu Zeshui,Liu Shousheng,et al.A netting clustering analysis method under intuitionistic fuzzy environment[J].Applied Soft Computing,2011,11(8):5558-5564.[28]Xu Zeshui,Chen Jian,Wu Junjie.Clustering algorithm for intuitionistic fuzzy sets[J].Information Sciences,2008,178(19):3775-3790.

[29]Hwang C,Rhee F C H.Uncertain fuzzy clustering:interval type-2 fuzzy approach to C-means[J].IEEE Transactions on Fuzzy Systems,2007,15(1):107-120.

[30]Yang M S,Lin D C.On similarity and inclusion measures between type-2 fuzzy sets with an application to clustering[J].Computers and Mathematical with Applications,2009,57(6):896-907.

[31]Xu Zeshui.Uncertain multiple attribute decision making[M].Beijing:Tsinghua University Press,2004.

[32]Shen Hengfan.Probability theory and mathematical statistics[M].Beijing:Higher Education Press,2011.

[33]Zhang Xiaolu,Xu Zeshui.Hesitant fuzzy agglomerative hierarchical clustering algorithms[J].International Journal of Systems Science,2015,46(3):562-576.

[34]Zhang Xiaolu,Xu Zeshui.A MST clustering analysis method under hesitant fuzzy environment[J].Control and Cybernetics,2012,41(3):645-666.

[35]Hu Baoqing.Fuzzy theory foundation[M].Wuhan:Wuhan University Press,2010.

附中文参考文献:

[24]刘小弟,朱建军,刘思峰.基于对称交互熵的犹豫模糊信息相似度及聚类应用[J].控制与决策,2014,29(10):1816-1822.

[31]徐泽水.不确定多属性决策方法及应用[M].北京:清华大学出版社,2004.

[32]沈恒范.概率论与数理统计教程[M].北京:高等教育出版社,2011.

[35]胡宝清.模糊理论基础[M].武汉:武汉大学出版社,2010.

 
汪峰,毛军军,祖璇,邹斌
《计算机科学与探索》2018年第05期文献

服务严谨可靠 7×14小时在线支持 支持宝特邀商家 不满意退款

本站非杂志社官网,上千家国家级期刊、省级期刊、北大核心、南大核心、专业的职称论文发表网站。
职称论文发表、杂志论文发表、期刊征稿、期刊投稿,论文发表指导正规机构。是您首选最可靠,最快速的期刊论文发表网站。
免责声明:本网站部分资源、信息来源于网络,完全免费共享,仅供学习和研究使用,版权和著作权归原作者所有
如有不愿意被转载的情况,请通知我们删除已转载的信息 粤ICP备2023046998号