更全的杂志信息网

基于融合信任关系的协同过滤推荐算法

更新时间:2009-03-28

0 引 言

传统协同过滤算法是通过用户评分计算出用户相似度,从而产生项目的推荐。这种推荐往往忽略了用户信任度对推荐的影响。目前涉及到用户信任模型的研究越来越多,例如,文献[1]通过Beta信任模型来建立用户间的信任关系,文献[2]基于可靠性度量提出了由动态机制构建的用户信任网络。这些信任模型在某些给定场景下具有较好的性能,但是并未深入挖掘其他可能影响信任关系的潜在因素。为此,本文提出了一种新型的融合信任关系,综合考虑了两种潜在影响因素,并融入到传统的协同过滤推荐算法中,提高了推荐的准确度。

1 用户信任模型

用户信任模型能有效刻画用户之间的信任程度,在对用户相似度计算中考虑了用户的信任关系,使最后的推荐更加准确。本文提出的信任模型与传统的信任模型不同,刻画直接信任度时,综合考虑了评分时间和用户喜好度因素的影响,更加完备地刻画出直接信任关系;刻画间接信任关系时,在前面构建直接信任度基础上,通过用户间的信任网络关系生成间接信任度的计算方法,最后使融合信任关系的协同过滤推荐算法更加准确可靠。

2 信任模型的构建

2.1 融合信任关系

在推荐算法中,为了更加准确可靠地进行邻居用户的选择,需要考虑评分相似性和信任关系两方面因素。其中,在融合信任关系时,本文还引入评分时间因素和用户喜好度因素。

女性盆底功能障碍(PFD)是由于盆底支持组织的退化、创伤所导致的,主要表现为压力性尿失禁和盆腔器官脱垂等一系列盆底损伤与缺陷。研究表明,妊娠和分娩是PFD的独立危险因素[1]。目前研究多集中在关于分娩方式对盆底肌力的影响,但关于这两种不同分娩方式对盆底肌力的影响程度结论不一。本文通过对产后42天产妇进行盆底肌力筛查,观察妊娠期不同时期孕妇BMI对盆底肌力的影响,以及研究不同分娩次数、不同分娩方式对盆底肌力减退治疗前后的影响,探索其变化的机制,为改善妇女产后生活质量提供科学手段。

(1)融合信任关系:推荐系统中的目标用户综合考虑客观存在的时间、用户喜好度因素,通过直接和间接信任关系对用户推荐行为的可靠性进行度量。

(2)评分时间因素:由于用户对项目的评价不是在同一时间进行的,系统中的评分不能说明用户间真实交互信任关系。因此,对不同用户在不同时间的评分进行加权处理,使得每个评分都得到一个关于时间的权重,更准确地体现评分的实际价值。

式中,IuIv表示用户u和用户v已交互的次数,阈值d表示用户之间完全信任对方时的最少交互次数,若用户共同评分的项目数目没有超过设定的阈值,则交互次数在阈值d中的权重比例来衡量初始直接信任度;若两个用户共同评分的项目数目超过设定阈值,则权重值为1。

当然绿水青山非一日之功,而我们即便“走的很远很累”,也始终应记得出发时的初心。保护自然,亦需我们共同努力,相信在不久的将来,人类能真正与自然和谐共生。让绿水青山谱就人间华章。

2.2 直接信任度

2个用户对同一个项目进行评价产生一种信任关系,其值大小为项目推荐行为的直接信任度(Direct Trust,DT)。

在推荐系统中,一种有效获取DT的方法是让推荐用户与目标用户均参加项目的交互,根据项目的评价反馈信息进行彼此间的信任度量[1,3]。初始直接信任度如下:

2018年11月14日,司法部召开深入贯彻习近平总书记在民营企业座谈会上的重要讲话精神、改善民营经济发展法治环境的推进会,受司法部部长傅政华同志委托,司法部党组成员甘藏春同志主持会议并讲话,发展改革委、司法部、公安部、财政部、自然资源部、生态环境部、交通运输部、税务总局、市场监管总局、银保监会等部门法治机构负责同志就支持和促进民营企业发展、改善民营经济发展法治环境作了发言。

 

(1)

以“禅茶养生”为主题,紧扣庐山西海与庐山的佛教文化和茶文化起源进行微电影的拍摄。内容可以以云居山真如寺的发展历程为题材,讲述一位在寺中常年修行的高僧为了增强自己的修行阅历进行茶叶的种植、采摘、烘烤制作以及和寺外来的读书人在品茗中讲经说道的过程,以体现禅茶的悠久历史和它的深远影响。

继续医学教育》杂志是由天津市卫生和计划生育委员会主管,天津医学高等专科学校主办的综合类医学期刊,本刊的国际标准刊号为ISSN 1004-6763,国内统一刊号为CN 12-1206/G4。读者对象为各级卫生机构的管理、教学和临床实践的卫生工作者。本刊辟有继续教育实践、医学教育进展、卫生管理进展、医学人文研究、流行病学调查、医疗感染与控制、临床诊疗进展、护理经验探讨、医学检验前沿、医学影像观察、临床病理分析、药物研究进展、中医中药研究、社区卫生管理等栏目,所有栏目均接受作者投稿。栏目介绍如下:

仅以用户的评分交互次数来衡量用户之间的信任度是不符合真实情况的。故引入Logistic函数[4]来刻画用户兴趣随时间发生衰减的现象,时间衰减函数如下:

 

(2)

式中,tu,i表示用户u对项目i产生评价时间与系统时间的时间差,f(t)是单调递增函数,其加权值在(0,1)区间[4]。使Logistic函数值随时间变化,从而有效刻画出用户兴趣随时间变化。进一步融入评估因子来刻画时间加权差的评估标准,评估标准如下:

 

(3)

式中,ε表示评估因子,ru,i表示用户u对项目i的评分,rv,i表示用户v对项目i的评分。如果两个用户对同一项目的时间加权评分差不大于ε,则表示交互成功,相应的成功次数统计累加,直接信任度如下:

式中x为不同种植作物的亩产系数;y为不同种植作物的种植面积;i表示区县的序号;j表示不同作物。t表示规划水平年。

 

(4)

式中,Csuccess表示当两个用户交互成功的次数,Call表示两个用户总共交互的次数。

式(4)中的交互不管是成功的还是失败的,分配的权重都为1。在真实情况中,用户对不同项目的喜好度会存在差异,所以本文引入用户喜好度来刻画交互权重。其中,在刻画用户喜好度时,不同年龄层用户的喜好都会出现一定程度的差异,所以在表示用户喜好度时,需要融入用户的年龄层权重,年龄层权重如下:

 

(5)

本文设计了6组实验,其中,实验1—4是确定4个未知参数的实验,实验5—6是本文算法与其它算法进行推荐准确度的对比实验。

 

(6)

式中,Uc表示对项目c进行评分过的用户集合,m表示Uc中的用户,S(u,m)表示用户u与用户m的相似度,ωage表示由式(5)计算出的不同用户的年龄层权重。其中,用户u与集合Uc中的用户相似度越高,年龄层权重越大时,表示用户u对项目c的喜好度也越高。因此根据不同项目的权重存在差异性来构建直接信任度,其计算方法如下:

我国自20世纪80年代引起全科医学以来,在一定程度上缓解了全科医生严重不足的局面。接受全科医学完整训练的专业人才,可为个人、家庭、社区提供优质、便捷、经济、一体化的基层医疗保健服务,并提供生命与健康的全方位、全过程负责式管理[1]。如何教育和培训高质量的全科医生是未来全科医生培养亟待解决的问题。

 

(7)

式中,F(u,c)表示用户u对项目c的喜好度,F(u,i)表示用户u对项目i的喜好度,S表示交互成功的项目集合,A表示总共交互的项目集合。

选择SPSS21.0相关研究软件对数据进行研究和处理,计数资料主要以百分比来进行表示,而计量资料主要以(±s)来表示。P值低于0.05显示数据比较有差异。

2.3 间接信任度

对用户间存在信任关系的综合度量称为综合信任度(Comprehensive Trust,CT),由直接信任度和间接信任度共同组成。

根据用户间的信任关系可构造关系图,如果两个用户间有关联边存在,则表示这两个用户具有直接信任关系[1]。如果两个用户间存在长度等于2的通路,则表示这两个用户具有间接信任关系,其计算方法如下:

 

(8)

式中,m表示用户u的直接信任用户,E表示用户u的直接信任用户的集合。

耳鼻咽喉科ESS手术后术腔黏膜的恢复一直是临床医生关注的重点,其中瘢痕和粘连的形成是影响预后的重要因素。少数瘢痕体质的患者术区瘢痕化严重影响鼻腔黏膜的正常功能,使手术不能达到预期的治疗效果;又有部分患者因窦口黏膜瘢痕收缩导致窦腔狭小,甚至再度封闭,分泌物无法排出,反复扩张窦口又会损伤黏膜纤毛功能并加重瘢痕的增生,最后导致鼻窦炎复发。粘连容易引起鼻腔狭窄、结构异常、气流动力学改变、通气异常等,这既不利于鼻腔鼻窦分泌物的排出,又会改变鼻腔的正常生理结构,引起患者术后不适。耳鼻咽喉科常采用反复术后换药、切除瘢痕、分解粘连及糖皮质激素全身或术腔局部给药等方式来解决这类问题。

2.4 综合信任度

用户间不存在共同交互的项目时,需要经过用户间若干次直接信任关系的传递而产生的一种信任关系,其值的大小称为间接信任度(Indirect Trust,IDT)。

这里采用动态生成权重因子δ协调直接信任度和间接信任度在综合信任度中的权重,取值范围为(0,1),权重因子如下:

 

(9)

式中,TDT(u,v)表示直接信任度,TIDT(u,v)表示间接信任度。再由直接信任度和间接信任度计算出综合信任度,其计算方法如下:

Ctrust(u,v)=δTDT(u,v)+(1-δ)TIDT(u,v)

(10)

2.5 基于融合信任关系协同过滤算法步骤

本文将上面构建的时间和信任的方法运用到传统CFIR算法中,构建了一种基于融合信任关系协同过滤算法,其具体步骤描述如下:

《青松红杏图》一直被认为是智朴和尚的自画小像,然而关于该画还有很多疑惑不解,如《青松红杏图》何时落入崇效寺至今不明。 虽然相关资料有说,这幅图最早被游寺的康熙朝臣王士祯与朱彝尊等人看到,并题今名,但具体时间不明。 按智朴为1642年松、杏战役时的俾将,推算1690年作画时他至少应该七十岁了,智朴1702年下江南,自江南还山后几乎不再出山。 由此推算《青松红杏图》大致寄存时间在作画后十年左右。

(1)根据收集好的数据集构建user-item评分矩阵;

(2)根据传统的皮尔森公式[1]计算目标用户与其他用户之间的用户相似度;

(3)根据式(7)和式(8)计算用户直接信任度TDT(u,v)和间接信任度TIDT(u,v);

微网站和微信公众平台之间有一定的独立性,但并不是完全隔离。微网站的主要栏目和页面都开发出来以后,需要与微信公众平台做进一步的链接和功能整合。在微信公众平台中设置关键字回复,可以链接至微网站首页或某个栏目;微信公众平台的主菜单可以添加链接,跳转至微网站或微网站的某个栏目;微信公众平台原本发布的图文消息,也可以被微网站调用。丰富多样具有交互性的调用形式使这种模式构建的学习平台更加灵活、便捷、高效。

(3)用户喜好度因素:通过相似度计算把有相同兴趣的用户聚集起来,使每个用户在同一兴趣组中对项目的喜好度进行有效刻画。不同年龄层的用户成长背景和价值观不同,所以,在衡量用户内在喜好度时,还需要对用户年龄层进行划分,更精确地刻画出用户喜好度。

(4)根据式(9)和式(10)计算用户综合信任度Ctrust(u,v);

实验采用由研究小组GroupLens创建并维护的Movielens数据集[3],本文从Movielens中随机选取5组数据,将每组数据集中每个用户的最近评分数据用作测试,其他数据用作训练。

(6)选取Top-N用户邻居集,为用户未评分的项目进行预测估计,其中,C(u,v)表示用户uv的综合相似度,v表示用户u的最近邻居,N表示用户u的最近邻居集;

西汉建元二年(公元前139年),一位叫张蹇的人手持旌节率队出了长安西城门。见惯了冠盖云集的喧闹长安城,也许并没太注意到这队人马,更没料到享誉世界的丝绸之路将从这队人马的脚下开始,以丝绸搭桥直抵罗马。

(7)根据步骤6计算用户预测评分值,并从高到低推荐项目。

3 实验验证分析

3.1 实验数据及预处理

(5)在综合信任度和用户相似度得到综合相似度时,计算综合相似度其中,η表示综合信任度所占的权重,1-η表示用户相似度所占的权重;

3.2 评价标准

平均绝对误差(Mean Absolute Error,MAE)是推荐质量度量指标之一[1,3]。通过预测评分值与实际评分值的平均差值来衡量算法的准确度,当MAE值越小,表明算法的准确度越高,平均绝对误差如下:

 

(11)

式中,pi表示对目标项目的预测评分,qi表示目标项目的实际评分,Utest表示用户测试集,n表示用户测试集的数量。

3.3 实验结果与分析

式中,ρ表示年龄基准,uage表示用户u的年龄,vage表示用户v的年龄。当两个用户之间的年龄差小于这个基准就认为两者用户不受年龄的影响,年龄层权重为1。否则,就按基准值所占年龄差的百分比来计算年龄层权重,从而不同年龄层对项目喜好度进行了更有效的刻画。如式(5)所示,当年龄差越大时,年龄层权重就越小,反之,年龄层权重就越大。用户喜好度用下式来表示:

实验1 式(1)中阈值d的取值范围为30~100时,对数据集的推荐准确度SMAE的影响如图1所示。

实验2 式(3)中评估因子ε的取值范围为1,2,3时,对数据集的推荐准确度SMAE的影响如图2所示。

  

图1 不同d值对SMAE的影响

  

图2 不同ε值对SMAE值的影响

由图1可以看出,随着d取值的递增,SMAE先下降后上升,当d=80,SMAE最小,说明两个用户完全信任对方的最少交互次数取80次时,算法的推荐准确度达到最优。

由图2可以看出,在任意邻居用户数下,当ε=2,即两个用户交互的项目的评分差标准为2时,算法的推荐准确度在该邻居用户数下达到最优。

实验3 式(5)中年龄基准ρ的取值范围为5~15时,对数据集的推荐准确度SMAE的影响如图3所示。

实验4 式(10)中信任比例参数η的取值范围为0~1时,对数据集的推荐准确度SMAE的影响如图4所示。

  

图3 不同ρ值对SMAE值的影响

  

图4 不同η值对SMAE值的影响

由图3可以看出,当ρ的取值过大或过小时,算法性能都不能达到最优。当ρ=10时,SMAE最小,说明年龄基准取10时,算法的推荐准确度达到最优。

由图4可以看出,当η的取值过大或过小时,算法性能都不能达到最优。当η=0.7时,即信任比例为0.7时,算法的推荐准确度达到最优。

  

图5 不同算法SMAE值的比较

实验5 为了验证本文提出的算法的准确度,分别在算法中引入信任关系、时间变化等不同推荐策略,参数分别为:d=80,ε=2,ρ=10,η=0.7。算法包括传统基于用户的协同过滤算法(UBCF)、融入传统信任关系的协同过滤算法(TUBCF)、在信任评估中融入Logistic函数时间权重的协同过滤算法(TIUBCF)、融入用户喜好度到信任关系中的协同过滤算法(WTUBCF)、本文提出的同时融入Logistic函数时间权重与用户喜好度到信任关系的协同过滤算法(WTTIUBCF),结果如图5所示。

由图5可以看出,随着邻居用户数变大,SMAE减小,准确度逐渐升高;当邻居用户数过大时,准确度开始下降。当邻居用户数为60时,算法的推荐准确度达到最优。

 

表1 不同算法的最优SMAE

  

推荐算法最优SMAE值动态机制构建信任网络的推荐算法0.779 5融合项目特征和移动信任关系的CFIR0.810 2基于图聚类信任的CFIR0.797 0本文改进算法WTTIUBCF0.761 2

实验6 本文算法还与其他3个算法进行了最优SMAE值对比,包括动态机制构建信任网络的推荐算法[2]、融合项目特征和移动信任关系的CFIR[5]、基于图聚类信任CFIR[6]等不同推荐策略,各算法的最优SMAE值如表1所示。

由表1可知,相比于其他信任关系的推荐算法,本文算法的SMAE值最小,即推荐的准确度最好。

月在水中上上下下,风又瑟瑟地走过去,波上起了粼粼的纹理,光影如梦,波痕是诗,风月水三者一聚首,很妙的天趣。

4 结束语

本文融合用户信任关系中的评分时间与用户喜好度对推荐的准确度影响的两个因素,提出了一种新型的融合信任关系的协同过滤推荐算法。相比传统推荐算法,在推荐准确度上有较大提升。但算法在时间性能上还有待改善,下一步将聚类算法与之结合,使推荐算法在时间性能上得到进一步提高。

参考文献

[1] 王海艳,杨文彬,王随昌,等.基于可信联盟的服务推荐方法[J].计算机学报,2014,37(2):301-311.

[2] MORADI P, AHMADIAN S. A reliability-based recommendation method to improve trust-aware recommender systems[J]. Expert Systems With Applications, 2015,42(21):7386-7398.

[3] 王茜,王锦华.结合信任机制和用户偏好的协同过滤推荐算法[J].计算机工程与应用,2015,51(10):261-265.

[4] 郑志高,刘京,王平,等.时间加权不确定近邻协同过滤算法[J].计算机科学,2014,41(8):7-12.

[5] 胡勋,孟祥武,张玉洁,等.一种融合项目特征和移动用户信任关系的推荐算法[J].软件学报,2014,25(8):1817-1830.

[6] MOADI P, AHMADIAN S, AKHLAGHIAN F. An effective trust-based recommendation method using a novel graph lustering calgorithm[J]. Physica A-statistical Mechanics & Its Applications, 2015,436:462-481.

 
刘智捷,徐小良,王宇翔
《杭州电子科技大学学报(自然科学版)》2018年第03期文献

服务严谨可靠 7×14小时在线支持 支持宝特邀商家 不满意退款

本站非杂志社官网,上千家国家级期刊、省级期刊、北大核心、南大核心、专业的职称论文发表网站。
职称论文发表、杂志论文发表、期刊征稿、期刊投稿,论文发表指导正规机构。是您首选最可靠,最快速的期刊论文发表网站。
免责声明:本网站部分资源、信息来源于网络,完全免费共享,仅供学习和研究使用,版权和著作权归原作者所有
如有不愿意被转载的情况,请通知我们删除已转载的信息 粤ICP备2023046998号