更全的杂志信息网

二分网络中多步物质扩散推荐算法的逼近分析

更新时间:2016-07-05

互联网技术的进步和电子商务的发展给人类的生活带来了极大的便利。当前,人们足不出户就可以购买到各式各样的商品。人们在享受互联网带来的便利的同时也面临着一项严峻挑战—信息过载。如何从浩如烟海的商品信息中找到自己真正需要的内容是一个充满挑战的课题。个性化推荐系统是解决信息过载的重要工具,由于推荐系统能极大地提高人们的购物效率并改善用户的购物体验,因此,近年来有关推荐算法的研究受到了广大学者的高度关注[1-3]。传统的推荐算法有协同过滤推荐算法[4-6]、基于内容的推荐算法[7-8]、基于上下文的推荐算法[9-11]以及基于混合推荐算法[12-14]。近年来,一些学者将物理系统中的扩散动力学过程引入推荐算法,并得到了很好的推荐效果[15-16],其中最受关注的一个算法为物质扩散算法[16],该算法根据用户和物品之间的购买关系生成一个“用户-物品”二分网络,然后在某个目标用户购买过的物品节点上放置一定的资源,这些资源首先从物品节点均匀地扩散到所有与其相连的用户节点,然后以同样的方式从用户节点均匀地扩散到物品节点,最后就可以根据物品节点上资源的多少来实现推荐(即把获得资源多的物品推荐给目标用户)。该算法由于其思路巧妙、准确率高且容易实现等优点引起了学者的广泛关注。之后人们在该算法的基础上做了许多改进,例如文献[17-18]通过对初始资源的分布策略进行优化,提高了推荐的准确率,文献[19]将物质扩散和热传导两个过程混合起来,从而提高了推荐的多样性,文献[20]根据实际情况在物质扩散过程中考虑了非均匀扩散的情况。

尽管人们已经对基于二分网络中的扩散推荐算法做了大量的研究,但是以往的研究几乎都只考虑两步扩散过程,而对多步扩散算法的研究和分析少有涉及。基于此,本文将从理论上对二分网络中的多步扩散过程进行分析,并揭示扩散步数趋于无穷时算法的特点。论文结构安排如下:首先对二分网络中的两步物质扩散算法进行分析,然后提出多步物质扩散模型,对扩散步数趋于无穷时模型的特点进行逼近分析并给出相关证明,最后对多步物质扩散的推荐算法的特点进行讨论,并通过实例对理论分析结果进行验证。

1 二分网络上的物质扩散算法

给定一个网络G(U,O,E),其中UO分别表示两种不同类型的节点集合,E表示UO之间的连边的集合,当边只存在于不同类型的节点之间时,这种网络被称为二分网络。现实生活中存在很多二分网络的例子,如作者与论文之间的发表关系、用户与商品之间的购买关系等都属于二分网络。假设图1表示的是用户与商品之间的购买关系,如果要对某个用户推荐商品,最容易想到的一种办法就是先看一下该用户曾经购买过什么商品,然后给他推荐与其购买过的商品最相似的物品,由于二分网络只记录了用户与商品之间的关系,而没有记录商品与商品之间的相似关系,因此需要对用户与商品之间的关系进行投影,从而得到商品与商品之间的相似关系。最简单的一种投影方式就是判断两件不同的商品是否有被同一用户购买,如果存在共同的购买者,则说明这两件商品之间存在一定的相似度,在对应的投影网络中这两件商品之间便产生一条连边。例如,对图中所示的二分网络进行投影后便得到商品相似关系网络,如果投影网络中两个商品之间存在连边,则说明这两个商品是相似的。接下来就可以利用商品相似关系网络对用户进行商品推荐。例如,由图1得知用户u1购买了商品o1o2,又根据投影网络可知商品o4同商品o1o2都相似,因此可以把商品o4推荐给用户u1

图1 二分网络及其投影

前面的投影方法得到的投影网络是一个无权网络,该网络只反映了两用户之间是否存在相似性,却无法刻画相似程度的大小。基于此,文献[16]提出了一个物质扩散算法来改进这种投影存在的缺陷。其方法描述如下:在二分网络中选择一个商品节点β,在该节点上放置1个单位的资源,该资源先从β节点以均分的方式扩散到与其相连的用户节点,然后再以同样的方式从用户节点扩散到商品节点,此时商品节点上资源的数量就代表了其与β节点的相似程度。如图2所示,如果最初在物品节点o1上放置1单位的资源,经过两步扩散后,o1,o2,o3,o4上的资源分别是5/12,5/12,0,1/6。

图2 二分网络中的物质扩散过程示意图

该扩散过程的资源分配方式可以表示为:

式中,kβ表示购买了商品β的用户数;ki表示用户i购买过的商品种数;用矩阵A记录用户与商品之间的购买关系,其元素a表示用户i是否购买了商品α,如果购买了其值为1,否则其值为0;wαβ为从β扩散到α的资源数量,表示购买了β的用户还会购买α的概率,值得注意的是wαβwβα,也就是说两个商品之间相互推荐的权重是不一样的。

利用该方法可以计算出任意两个商品之间的相似性,并由此生成一个有向含权投影网络,与该网络对应的是一个扩散转移矩阵WW中的每一个元素wαβ表示资源从β节点扩散到α节点的数量,代表购买了商品β的用户还会购买商品α的概率。将这种方法对图2所示的二分网络进行投影后,得到图3所示的有向含权投影网络,该投影网络对应的转移矩阵W为:

图3 基于物质扩散方法得到的投影网络

如果用向量fi=[fi1 ,fi2 ,… ,fin]T表示用户i的购买历史,其中f= 1表示用户i购买了商品αf=0表示其没购买该商品,可以计算用户购买其他商品的相对概率:

3、动之以情,晓之以理,让学生学会理性思考。待学生情绪平稳的时候,帮助她理性分析事情发生的原因,让当事人回归理性思维:这恰恰是因为青春期的冲动行为,心气高、性子急、自认为对环境熟悉、存在侥幸心理、缺乏安全意识而造成的严重后果!

例如,对于图2所示的二分网络来说,已知用户u1购买了商品o1o2,则有:

O=,其中k( u)和k( o)分别为二分网络中用户节点和商品节点对应的度,则投影网络对应的矩阵W为:

2.3.3 培育壮秧,增强抗性。壮秧根系发达,抗逆性强。春季要旱育稀植和喷施多效唑,是培育壮秧行之有效的方法。

因此,性质3成立。

输入:用户-物品购买关系数据集。

同时,所选文章专业性强、可应用度高。对于理工科德语学习者来说,其本身已具有了相应专业的知识基础,那么如何将这些知识转化为德语并将其应用到实际场景中便是一个很实际性的问题。比如在能源主题中所选的文章,这些文章来源于处在该领域的公司网站,其对于该领域的专业知识介绍专业性和应用性都相对较强,有助于同学们的实际运用。

根据性质1,W的每一列之和为1,所以WT的每一行之和为1,因此WT的特征值1对应的右特征向量,因此,1是WT的最大特征值,即主特征值。由Perron-Frobenius定理可知,对于一个不可约非负矩阵,其谱半径对应的主特征值一定是大于0的单重特征值,因此λ1=1是WT的单重特征值,所以成立,证毕。

步骤2):由矩阵A统计出每个用户购买过的物品数以及每种物品被多少个用户购买过。

步骤3):由式(1)计算出任意两个物品之间的相似度w,得到扩散转移矩阵W

步骤4):利用式(3)计算用户购买每件物品的相对概率。

提出了一种基于激光测径仪和激光二维扫描的光滑极限量规快速测量系统,系统地阐述了测量原理、测量流程、数据处理算法以及软硬件结构。其非接触式、无损式的测量方法,可以保证快速高效地完成塞规尺寸和形状误差项目的综合检定。通过不确定度分析可知,本系统满足给定尺寸范围内塞规检定的不确定度要求。本文所搭建的测量系统,为塞规一体化快速检定奠定了基础。

步骤5):根据步骤4)中的计算结果对物品进行降序排列,并去除用户已经购买过的物品。

输出:每个用户的物品推荐列表。

物质扩散投影方法克服了简单投影方法的两个缺点:1) 该方法考虑了商品之间连边的权重,两个商品拥有的共同用户越多,其相似性就越大;2) 从式(1)可以看出,如果kαkβ,则wαβwβα,这说明购买了冷门商品的用户再购买热门商品的概率要大于购买了热门商品再购买冷门商品的概率,这一点也是与实际情况一致的。正因如此,物质扩散算法与很多传统算法相比具有明显的优势。

2 多步物质扩散的逼近分析

从前面的分析可知,利用物质在二分网络中的两步扩散过程可以实现商品的推荐,既然二分网络中的两步扩散可以用于商品推荐,自然可以把该过程拓展到4步、8步、…、直至2N步扩散,又由于二分网络中的两步扩散等价于其投影网络中的一步扩散,所以二分网络中的2N步扩散就等效于其投影网络中的N步扩散(为方便起见,后面的讨论提到的扩散都只针对投影网络)。本文着重关注的问题是随着扩散步数的增加,网络中的资源分布最终会达到什么状态?而对应的推荐算法有具有什么特点?用向量表示用户i对所有商品节点配置初始资源的情况(如果用户i购买了某商品α,否则,经N步扩散后,各商品节点上的资源便为,显然,要回答前面的问题就必须对的特点进行研究,如果多步扩散之后资源的分布会稳定下来,就意味着当N→∞时fN收敛。假设 收敛,不妨令则有因此 便为矩阵W的特征值1对应的特征向量。又由于fN=WNf0,所以只有当WN收敛时fN才会收敛,因此WN是否收敛便成为关键问题,本文接下来利用矩阵分析的方法对W的性质进行分析,从而揭示多步物质扩散推荐算法的特点。

性质1:矩阵W每一列元素之和为1,即

证明:从物质扩散的过程可知,每一步扩散都遵守物质守恒定律,系统中物质的总量没有因为扩散过程发生变化,从任何一个商品节点出发的资源经过两步扩散后又都回到了商品端(所有商品节点构成的集合),反映在扩散转移矩阵上就是每一列元素之和为1。该性质也可以由式(1)出发进行证明:

性质2:若矩阵W不可约(对应的投影网络是强连通的),则W的主特征值λ1=1,且有

2.财务报表分析内容狭窄。财务报表分析内容涵盖面广,即包括企业财务数据对比分析,也包括财务数据背后相关业务数据的深入分析;既包括本企业财务数据比较分析,也包括企业与行业内主要财务数据比较分析;既包括某一时点财务数据比较分析,也包括某一时段趋势性财务数据分析等,可以说,财务报表分析报告应该是灵活、多样,内容可以“千变万化”,可以根据不同时期、不同人员的需要来设计。但在实际上,财务人员在撰写财务报表分析报告时,常常局限于当期、本企业这一狭小的范围内,分析思路僵化,分析面不够宽。

证明:由于WWT的特征值相同,所以只要证明WT满足性质2即可。由Gerschgorin圆盘定理可知,对于矩阵WT,一定存在某行元素(wα1,wα2,⋅⋅⋅,wαn),

但是后来形势变动,沙皇俄国“利用中国新旧政权交替无力顾及北部边疆之机”⑦ 李军.《唐努乌梁海历史研究》简评〔J〕.西域研究,2008(2):第128页。调整政策,打算用武力造成既成事实,然后迫使中国政府接受。首先在唐努乌梁海设置边境专员和协助推行移民计划的官员,然后让移民大量涌入,侵占土地。同时采用威逼利诱的手段,迫使唐努乌梁海上层官员同意接受俄国的“保护”。

步骤1):由输入的数据集生成购买关系矩阵A,其元素a的值表示用户i是否购买过物品α

性质3: (k( o1 ) ,k( o2),⋅⋅⋅,k( on))T是矩阵W的主特征值1对应的右特征向量。

证明:设Am× n为二分网络对应的邻接矩阵,m为用户数,n为商品数,其任意元素a的值为1或0,表示用户i是否购买过商品α

1.3 人员配备 医疗、护理、麻醉、病理检验等专业团队的存在是TURBT开展的基础。泌尿外科医师应具备充分的理论和实践基础,熟知患者围手术期管理、手术操作、器械基本维护与应用、意外情况处置,以及术后随访方法。护理团队具备基本的理论储备,并知晓手术方式、围手术期护理和患者管理方法。手术室配备专科麻醉、护理团队,熟悉TURBT流程,并具备闭孔神经阻滞、特殊情况管理等专业技术能力。

由于用户1已经购买了商品1和商品2,所以不必再推荐这两个商品,因此只要对其它商品按得分降序排列就可以得到推荐列表,这个计算过程反映在投影网络中其实就是资源做一步扩散的过程。对于用户1来说,在图3中将节点1和节点2分别放置1单位的资源,这些资源根据边的权重和方向进行扩散,扩散一步之后每个节点获得的总资源数就对应着用户1将会购买该商品的相对概率。二分网络中物质扩散推荐算法的步骤。

于是有:

对于机械通气新生儿的呼吸道管理是一个长期的需要不断摸索和总结的工作,我们需要不断改进呼吸道的管理措施,尽可能从各个细节入手,采用不断改进的集束化管理措施是可以有效地预防和控制呼吸道内细菌感染的。

性质4:当N→∞时,矩阵WN收敛,且WN中任意元素wαβ的值为

证明:根据Jordan标准型定理,对任意矩阵W,一定存在矩阵J,使得W=PJP-1,其中J为矩阵W的Jordan标准型,根据Jordan标准型定义,J满足式(5)所示的分块对角矩阵形式,矩阵J的每一项元素Ji都是一个Jordan块,Ji的形式如式(6)所示,其中λi为矩阵W的第i大特征值,根据性质2,λ1=1为W的单重主特征值,所以J1 =1。

STEP3:设备数据采集开始,设所有设备总数为n,建立与第i台设备连接,连接成功后对该台进行数据采集,遍历所有设备;

亚低温治疗后,A组心率明显低于B组,差异有显著性(P<0.05)。A组患者CVP高于B组,差异有显著性(P<0.05)。A组MAP高于B组,差异有显著性(P<0.05)。A组CI低于B组,差异有显著性(P<0.05)。A组EVLWI与B组比较,差异无显著性(P>0.05)。A组GEDVI高于B组,差异有显著性(P<0.05)。A组SVRI高于B组,差异有显著性(P<0.05),结果见表 2。

设向量p为矩阵P的第一列,pP- 1的第一行,则上式便化为:

W=PJP-1两边同时右乘P,得到WP=PJ,由式(7)所示的对角形式可知,p其实就是PJ的第一列,又由于WP的第一列为Wp,所以有Wp=p,因此,p为矩阵W的右主特征向量,根据性质3,p=ε1[k( o1 ) ,k( o2 ) ,… ,k( on )]Tε1为任意常数。同理,对W=PJP- 1两边同时左乘P- 1,得到P-1 W=JP-1,显然,JP- 1的第一行为p,又由于P-1 W的第一行为p* W,所以p* W=p*。因此,pW的左主特征向量,又由于W每一列元素之和为1,所以p*=ε2[1,1,… ,1]nε2也为任意常数。QP-1 P=IQp* p= 1,即:

ε=ε1ε2,则

由于当i≥2 时,λi<1,所以有,于是:

90年代末期,是化肥工业由计划经济向市场经济过渡时期,主要是进行老厂技术改造与产品结构调整。通过调整,小氮肥的数量减少到1998年的612家,部分中小型厂达到大氮肥规模,碳铵的产量比例由历史最高的60%下降为30%,尿素逐步实现了自给。

, 则p=[ε, ε, … ,ε]n

因此,根据式(9)可以计算得到收敛结果:

证毕。

下面用一个实例对这个结论进行验证,以图2所示的用户-商品二分网络为例,其对应的扩散转移矩阵如式(2)所示,下面给出扩散转移矩阵各次幂运算的计算过程:

2.1.3 整合其他社会资源 南京市六合区有较好的工业基础,有多个工业园区,企业资源丰富,可以通过企业捐助,定向扶持一个村庄,为农村地区居家养老服务的发展提供经济支持。同时,有市级以上现代农业园6个,农业资源丰富,可以从农村老年人的实际出发,为农村有工作能力和工作意愿的老年人提供工作机会。除此之外,还可有效利用当地村委会人员形成居家养老服务组织队伍,依靠老干部的管理能力、村内威望及熟悉村内具体情况的天然优势,为组织发展建言献策、提高工作效率并发挥余热,丰富晚年生活。

从上述计算过程可以看出,矩阵W在经过多次幂运算之后最终收敛到了一个稳定状态,该结果与用式(11)计算的结果一致,计算过程为:

3 讨 论

3.1 关于收敛速度的讨论

在前面的验证过程中,系统总共迭代了21步才使收敛结果精确到小数点后第四位。由此可以提出另一个重要问题——系统的收敛速度由什么因素决定?该问题需要进一步分析收敛速度与扩散转移矩阵之间的关系。由于WN=PJN P- 1,而PP-1与迭代步数无关,因此WN的收敛速度只由J决定,只有当JN能快速收敛到式(8)所示的形式,系统才能快速达到稳定状态,由式(7)可知,要使JN快速收敛到式(8),就得使 (i≥ 2 )尽快收敛至0,又由及式(6)可知,当λ2的值越接近0时系统收敛越快,因此多步扩散算法的收敛速度由扩散转移矩阵的第二大特征值决定,该特征值越小,系统收敛越快。

3.2 关于算法特点的讨论

根据上一节的分析,已经证明了N→∞时WN会收敛于一个稳定状态,又根据fN=WNf0,可推断fN最终也会达到一个稳定状态,这意味着在经过多轮扩散之后,资源的分布最终会稳定下来,对于推荐算法来说,最终的推荐列表会稳定下来,而不再随扩散次数的增加而变化。显然,这个稳定的推荐列表具有什么样的特点便成为我们最关心的问题。假设对于某个用户i,给其购买过的商品节点分别设置1单位的资源,则资源分布情况可以用向量表示,元素a的值为1或0,分别代表该用户是否购买过该相应的商品。假设用户i总共购买了ki件物品,则:

根据物质扩散推荐算法,在进行N步扩散之后其资源分布为,当N→∞时,其值为:

式(14)给出了最终的资源分布结果,从式中可以看出,在经过多轮扩散之后,资源在各商品节点上的分布比例完全由该节点的度决定,由于推荐列表是根据各节点最终获得的资源数从大到小进行排列,所以推荐算法最终将会根据商品节点的度从大到小生成推荐列表。进一步分析可以发现,该推荐列表的排序不仅与扩散前初始资源的分布无关,而且与用户也无关,不论是对哪个用户,不管他之前购买过什么样的商品,该算法始终只根据商品的热门程度给出推荐列表,此时的算法已经不会再根据用户之前的购买历史来推荐与其偏好相似的商品,而是不论针对什么用户一律只推荐热门商品,因此,此时的推荐系统表现得更像一个搜索引擎,不再具有个性化特点。事实上,算法逐渐失去个性化的过程是伴随着扩散步数的增加而发生的,当扩散步数为0时,f=f0,此时,算法推荐的是用户购买过的商品,虽然没什么意义,但从个性化角度来看肯定是最好的,随着扩散步数的增加,算法的个性化特点不断失去,最终只推荐热门商品。在实际应用中,可以根据个性化要求的程度选择合适的扩散步数。

4 结束语

本文通过对物质扩散推荐算法中的扩散转移矩阵W的几个重要性质的研究,深入分析了多步物质扩散推荐算法的逼近行为,证明了W的主特征值为1,并发现其对应的主特征向量与二分网络中物品节点的度相关,证明了当扩散步数趋于无穷时,转移矩阵WN会收敛,并且发现算法随着扩散步数增加不断失去个性化,最终当扩散达到稳定状态时,算法的推荐结果只与商品的热门程度有关。本文的研究揭示了物质扩散算法的扩散步数与个性化特点之间的关系,对物质扩散算法的实际应用具有一定的指导意义。

参 考 文 献

[1]RICCI F, ROKACH L, SHAPIRA B. Recommender systems handbook[M]. New York: Springer, 2015.

[2]CHEN G, QIU T, SHEN X Q. An improved recommendation algorithm via weakening indirect linkage effect[J]. Chinese Physics B, 2015, 24(7): 78901.

[3]SHANG M S, ZHANG Z K. Diffusion-based recommendation in collaborative tagging systems[J].Chinese Physics Letters, 2009, 26(11): 118903.

[4]GOLDBERG D, NICHOLS D, OKI B M, et al. Using collaborative filtering to weave an information tapestry[J].Communications of the ACM, 1992, 35(12): 61-70.

[5]HUANG C L, YEH P H, LIN C W, et al. Utilizing user tag-based interests in recommender systems for social resource sharing websites[J]. Knowledge-Based System,2014, 56(1): 86-96.

[6]HAN X, WANG L, CRESPI N, et al. Alike people, alike interests? Inferring interest similarity in online social networks[J]. Decision Support Systems, 2015, 69(1):92-106.

[7]OLIVEIRA E, MARTINS P, CHAMBEL T. Accessing movies based on emotional impact[J]. Multimedia Systems,2013, 19(6): 559-576.

[8]PANNIELLO U, TUZHILIN A, GORGOGLIONE M.Comparing context-aware recommender systems in terms of accuracy and diversity[J]. User Modeling and User-Adapted Interaction, 2014, 24(1): 35-65.

[9]YUAN T, CHENG J, ZHANG X, et al. How friends affect user behaviors? An exploration of social relation analysis for recommendation[J]. Knowledge-Based System, 2015, 88(C):70-84.

[10]ALHAMID M F, RAWASHDEH M, OSMAN H A, et al.Towards context-sensitive collaborative media recommender system[J], Multimedia Tools Applications,2015, 74(24): 11399-11428.

[11]MAYER J M, JONES Q, HILTZ S R. Identifying opportunities for valuable encounters: Toward context-aware social matching systems[J]. ACM Transactions on Information Systems, 2015, 34(1): 1-32.

[12]ADOMAVICIUS G, TUZHILIN A. Toward the next generation of recommender systems: a survey of the state-of-the-art and possible extensions[J]. IEEE Transactions on Knowledge and Data Engineering, 2005,17(6): 734-749.

[13]ZANKER M, GORDEA S, JESSENITSCHINIG M, et al.A hybrid similarity concept for browsing semi-structured product items[C]//International Conference on Electronic Commerce and Web Technologies. [S.l.]: [s.n.], 2006.

[14]ZANKER M, JESSENITSCHINIG M. Case-studies on exploiting explicit customer requirements in recommender systems[J]. User Modeling and User-Adapted Interaction,2009, 19(1): 133-166.

[15]ZHANG Y C, BLATTNER M, YU Y K. Heat conduction process on community networks as a recommendation model[J]. Physical Review Letters, 2007, 99(15): 154301.[16]ZHOU T, REN J, MEDO M, et al. Bipartite network projection and personal recommendation[J]. Physical Review E, 2007, 76(4): 046115.

[17]ZHOU T, JIANG L L, SU R Q. Effect of initial configuration on network-based recommendation[J].Europhysics Letters, 2008, 81(5): 58004.

[18]JIA C X, LIU R R, SUN D, et al. A new weighting method in network-based recommendation[J]. Physica A, 2008,387(23): 5887-5891.

[19]ZHOU T, KUSCSIK Z, LIU J G, et al. Solving the apparent diversity-accuracy dilemma of recommender systems[J].The Proceedings of the National Academy of Sciences of the United States of America, 2010, 107(10): 4511-4515.

[20]LÜ L, LIU W. Information filtering via preferential diffusion[J]. Physical Review E, 2011, 83(6): 066119.

周海平,沈士根,黄龙军
《电子科技大学学报》2018年第03期文献

服务严谨可靠 7×14小时在线支持 支持宝特邀商家 不满意退款

本站非杂志社官网,上千家国家级期刊、省级期刊、北大核心、南大核心、专业的职称论文发表网站。
职称论文发表、杂志论文发表、期刊征稿、期刊投稿,论文发表指导正规机构。是您首选最可靠,最快速的期刊论文发表网站。
免责声明:本网站部分资源、信息来源于网络,完全免费共享,仅供学习和研究使用,版权和著作权归原作者所有
如有不愿意被转载的情况,请通知我们删除已转载的信息 粤ICP备2023046998号