更全的杂志信息网

基于室内定位技术的图书馆推荐算法

更新时间:2009-03-28

现有图书馆图书推荐算法的研究多集中在将图书/读者标签[1-3]、读者活动[4]、可视化技术[5]等与协同过滤算法结合的研究上,这些研究取得了一些成果,但在数据稀疏的情况下使用协同过滤算法很难做出正确的推荐[6].

对阳极泥尾矿进行XRF分析,尾矿中共有二十种元素,其中主要金属元素为Pb、Ba、Ag、Sb、Au,主要非金属元素为S、O、Cl、Si等。对重要元素进行定量分析,阳极泥尾矿中Au含量为0.28%,Ag含量为9.04%,Pb含量为26.72 %,分析结果见表1所示。

近年来,在推荐系统领域,部分研究者尝试将位置信息引入推荐算法中,不但切实满足用户体验,提高了用户满意率,而且增强了系统的适应性和推荐精度,逐步成为研究热点[7].如何利用位置信息,解决图书馆推荐系统存在的问题,提高用户满意度,是一个值得研究的问题.在基于位置的图书馆图书推荐方面,张闪闪等[8]利用邻近算法、RFID技术对读者进行定位,使用一卡通与安装在书架上的小读写器通信,获得用户大致位置,给用户推荐其附近书架上的图书,这种推荐算法是实时推荐算法,对系统性能要求较高,没有考虑用户过往的借阅历史.李胜等[9]通过构建书籍分类本体,结合用户偏好和区域组偏好,在考虑推荐处理触发机制问题下进行推荐,有效提高了推荐精度、相关度以及集合的多样性,但算法相对复杂.

借阅了《Java语言基础》、《使用案例学习Java》、《Java语言从入门到精通》的几个读者都是Java语言初学者,虽然借阅图书不同,但学习目的、内容相同,他们是具有相同兴趣的读者.图书馆中,同一书架上总是摆放具有主题相近、内容相似的图书,可以近似认为,阅读同一书架上图书的读者具有相似兴趣.基于此,本文将室内定位技术与传统基于用户的协同过滤算法相结合,利用室内定位技术,根据读者在图书馆中所处的地理位置,以书架为单位,获得读者停留点,确定读者借阅图书偏好,并将读者的偏好信息引入协同过滤算法,计算读者相似程度,从而进行推荐,提出一种基于室内定位的图书馆推荐算法IPLR(indoor positioning based library recommendation algorithm).

1 室内定位技术

读者在图书馆的借阅行为发生在室内,要获取读者借阅图书的上下文信息必须突破室内定位技术.然而,室外定位中最常用的GPS系统由于多径衰落、建筑物阻挡等原因,在室内信号强度低、可靠性差,定位效果并不理想[10].随着无限传感网络及物联网技术的广泛兴起和迅速发展,很多室内定位相关的新技术涌现出来,包括红外线、RFID、蓝牙、超声波、WLAN、超宽带、磁场、计算机视觉、LED可见光等.基于白光LED可见光通信,定位精度可在1 m之内,且环境适应性强、安全性高、易于安装部署,成为室内定位的优先选择[11].

2017年8月30日,针对三都县委、县政府存在的不聚焦精准脱贫工作、目标发散、力量分散等问题,黔南州委、州政府对三都提出批评并“约法三章”,梁嘉庚口头答应却不执行。2018年6月22日,梁嘉庚因严重违纪违法被开除党籍、开除公职。

1.1 LED定位原理

首先,拖腔的功能主要是渲染情感,而过腔虽然也有这方面的功能,但其重点在于连接,而不是渲染情感,也因此,纯粹的以抒情和渲染情感为主的过腔,其实并不多见。

  

图1 可见光通讯及定位原理Fig.1 Visible light communication and positioning principle

1.2 基于LED图书馆室内定位模型

在图书馆中,由固定在天花板上的LED灯发出带有LED灯ID等信息的光信号,读者进入LED灯具照明区域,使用智能手机接收并识别光信号,解析出灯具发送的识别信息.智能手机将所获取的识别信息上传到云端服务器,服务器中的定位算法匹配地图数据库,确定读者位置信息并返回给手机,通过手机与服务器的这种交互完成定位(图2).

步骤2 通过式(3)求出目标回波信息值H(Ai),若dIJ≤α,|H(Ai)-H(Aj)|<ε的条件成立时,通过H(Ai)=H(Aj)+H(Ai), H(Ai)=H(Aj)对满足该条件的目标回波信息值进行积累,并把积累结果作为该区域目标回波异常程度计算权值wi;

  

图2 基于LED的图书馆室内定位Fig.2 Indoor positioning of library based on LED

2 基于读者轨迹的兴趣点发现

2.1 停留点检测

LED进行室内定位的精度在1 m之内,普通书架的宽度在1.5~3 m之间,所以使用LED进行定位能将图书馆内的读者精确定位至每个书架前.以书架为单位绘制地图,每个书架对应地图中的一个点,则图书馆的一层可以表示为一张二维点组成的平面图,图书馆可以表示为多张这样的平面图.读者在图书馆立足于书架前,浏览、选择图书,随身携带的安装了定位系统的手机即可自动开启摄像头,与周围的LED灯进行通讯,完成读者的定位功能,将读者定位在图书馆地图的某个点.

使用UserCF与IPLR算法进行推荐,需要创建读者-图书借阅矩阵,如果矩阵过于稀疏则无法计算.读者-图书借阅矩阵的稀疏度S定义为

 

(1)

其中:pi表示读者停留的点;Δti表示在这个点停留的时间.这些停留点抓住读者行为重点,同时为后续数据处理做好准备.

2.2 读者兴趣点发现

分析读者某段时间的停留点序列,读者在某个点停留,表示读者对这个点对应书架上的图书感兴趣,读者在某个点停留的时间越长,表示读者对对应书架上的图书越感兴趣.对于一个给定点,判断该点是否为兴趣点,必须设定一个约束值,如果读者在这个点停留时间大于等于这个约束值则读者对这个点对应书架上的图书有兴趣,反之没有兴趣.约束值的定义考虑读者以往的借阅习惯,如下面各式所示:

 

(2)

Tu=min(Tu,j) (1≤jm)

(3)

 

(4)

其中:Tu,j表示读者uj次去图书馆选借单本图书在书架前停留的最短时间;S是读者uj次去图书馆所借图书集合对应的书架集合;Δtj,pS表示读者uj次去图书馆在书架p前停留的时间;nj,p表示读者uj次去图书馆借阅的图书放置在书架p上的个数;Tu表示读者um次去图书馆选借单本图书停留的最短时间;Fu表示读者u去过图书馆并且借书的次数;m是一个经验值,如果读者u去图书馆的次数大于等于m,则约束值Tconst就是Tu,如果读者u去图书馆次数小于m,则约束值Tconst等于a;a是一个常量,参考以往所有读者Tconst的最小值.

确定约束值Tconst后,判断某停留点pi是否兴趣点的公式为

 

(5)

其中:IP为读者兴趣点集合.当读者停留的时间大于等于约束值时当前这个点是读者的兴趣点,反之亦然.

2.3 兴趣点度量

基于LED定位,确定读者兴趣点,下一个步骤是判断读者对某个兴趣点的喜好程度,设scorei为读者对某兴趣点的喜好程度:

 

(6)

3 推荐算法

以书架为定位单元,基于读者在图书馆的活动轨迹获得读者的兴趣偏好后,须将偏好信息引入推荐算法,发现兴趣相似读者,进行推荐.

3.1 协同过滤算法

协同过滤算法分为基于物品的协同过滤算法ItemCF和基于用户的协同过滤算法UserCF两种.基于物品的协同过滤算法适用于物品数量远少于用户数量的情况,基于用户的协同过滤算法适用于用户数远小于物品数量的情况[13].在图书馆推荐系统中,尤其是高校图书馆推荐系统中,有效读者数量远小于馆藏图书数量,所以使用UserCF算法更为适合.

步骤2:邻近读者选择.选择与当前读者最相近的K个读者,即使用Top-N方法.

经过范围矫正的绿色建筑潜力分布图共计2291个图斑,根据广州市城乡规划一张图GIS管理平台,经初步核算,所有潜力地块的建筑总量约为34506万m2,远超出“十三五”预期的8600万m2绿色建筑总量目标1)。因此,需要根据地块潜力评价值区间及对应的绿色建筑总量情况(表7),对绿色建筑潜力地块进行核减矫正。经绿色建筑潜力GIS模型模拟矫正,选取地块潜力评分值在0.42以上的地块,约770个,作为绿色建筑空间分布潜力地块。同理,确定绿色建筑二星级以上1300万m2建筑量对应的是潜力评分值在0.67以上的地块,约157个。最终确定绿色建筑一星级及二星级以上的潜力分布规划图(图6)。

3.2 IPLR算法推荐步骤

步骤1:读者相似度计算.读者xy的相似度计算使用皮尔逊相关系数法,定义为

 

(7)

其中:sim(x,y)表示读者x和读者y之间的相似度;表示读者x对兴趣点s的评分;Sxy表示读者xy共同评分的兴趣点集合;表示读者x和读者y对所有兴趣点评分的均值.

使用UserCF算法进行推荐时一般经过用户相似度计算、邻近用户选择、物品预测评分计算和物品推荐几个步骤.IPLR算法图书推荐部分基于UserCF算法,推荐步骤与UserCF相同.

步骤3:图书预测评分计算.推荐产生的过程,就是计算读者未来对某种图书的预测评分的过程,采用加权平均值法:

 

(8)

其中:Pu,i是读者u对图书i的预测评分;NB是读者u的邻近读者集.

步骤4:图书推荐.选择当前读者预测评分最高的M本书进行推荐,即使用Top-N方法.

3.3 IPLR算法数据模型

使用上节所述数据,使用2.1、2.2、2.3、3.2节所述算法,计算读者相似度,选择与当前读者最相近的K个读者(以K取5为例),某4个读者运算结果见表1和表2.

4 实验和结果分析

实验分为两部分,第一部分使用UserCF方法进行推荐,第二部分选择相同样本使用IPLR算法进行推荐,并对结果进行对比.实验中将读者行为数据按照均匀分布随机分成8份,挑选1份作为测试集,剩余7份作为训练集,将8次实验结果的平均值作为最终的评价指标.如果部分读者的兴趣点信息有缺失,则使用借书记录推演得到.推演时,使用读者持有图书时间的长短来判断读者对图书的喜好程度作为读者对图书的评价值Score-RB,对数据进行规约,再根据图书所在书架,计算读者对这个书架上图书的评价Score-RS.

实验基于PC实现,硬件环境为Intel Xeon i5 CPU 2.5 GHz 、8GB内存、64bit的Windows7 操作系统,算法基于Python编程实现.

在信号发射端,将需要传输的信息编译成一段调制信号,用脉宽调制的方法附加到LED灯具的驱动电流上,LED光源根据信号高频闪烁,传播信号.在信号接收端,信号接收模块接收带有信息的光信号,经过解码、解调等信号处理后恢复出原始信号.得到原始信号后,再由定位算法分析得到移动目标的位置,其定位原理如图1所示[10].

4.1 实验数据的选择与清洗

定位系统实时记录读者的移动轨迹以及在每个区域停留的时间,最终形成读者在图书馆的活动轨迹,这些轨迹是一系列停留点,这些停留点包含重要的语义信息.一个读者在图书馆内活动的历史轨迹可以表达为一个停留点序列:

 

(9)

其中:U表示有借阅史读者集合;I表示有借阅史图书集合;R(u)表示读者u借阅过的图书集合.

2018年1月1日起施行新的《企业会计准则第14号——收入》在境内外同时上市的企业以及在境外上市并采用国际财务报告准则或企业会计准则编制财务报表的企业,自2018年1月1日起施行;其他境内上市企业,自2020年1月1日起施行;执行企业会计准则的非上市企业,自2021年1月1日起施行。同时,允许企业提前执行。

实验数据选取广东某高校图书馆的实际借阅数据,将借阅数据按2015~2016年度借阅量对学生进行排序后,选择借阅量15本以上的学生进行实验.借阅量15本以上的学生共2 053人,借阅总数为56 798次,有借阅历史的图书13 108本.使用式(9)计算读者-书籍借阅矩阵稀疏度为2.11×10-3,后续实验基于此数据进行.

4.2 邻近读者选择实验

IPLR算法中数据分为两组.第一组:读者对某兴趣点(书架)评分记录,包括读者标识、兴趣点标识和兴趣点评分(ReaderID、ShelfID、Score-RS),主要用来作读者相似度计算,以书架为单位,寻找和当前读者兴趣相似的读者集合.第二组:读者对图书评分记录,包括读者标识、图书标识和读者对该图书评分(ReaderID、BookID、Score-RB),主要用来做图书推荐.

试验采用田间沟垄覆膜(宽1.2 m)种植。播种为穴播、播种量13.3 kg/hm2,苏丹草行距和株距分别为40 cm和60 cm。试验采用随机区组设计,9个处理,6个重复,54个小区,每个小区面积30 m2(表2)。

 

表1 使用UserCF算法得到的邻近读者及相似度评分

 

Tab.1 Neighbored readers and evaluation score of similarity obtained with UserCF algorithm

  

当前读者学号邻近读者及相似度评分16001150205(16001150207,0.08397),(16103150205,-1),(15301130112,-1),(1520115209,-1),(15201150211,-1)16103150214(16001150205,-1),(15301130112,-1),(15201150209,-1),(15201150211,-1),(16106150148,-1)15301130112(15301150211,0),(16103150205,-1),(16001150205,-1),(15201150209,-1),(16106150148,-1)15201150209(16103150205,-1),(16001150205,-1),(15301130112,-1),(15201150200,-1),(16106150148,-1)

 

表2 使用IPLR算法得到的邻近读者及相似度评分

 

Tab.2 Neighbored readers and evaluation score of similarity obtained with IPLR algorithm

  

当前读者学号邻近读者及相似度评分16001150205(16008140128,0.62500),(15302130339,0.51031),(16001150124,0.39036),(16002150124,0.37688),(15108140110,0.35575)16103150214(16102150113,0.62858),(15303150317,0.45184),(15202150124,0.44872),(160011420206,0.44721),(15201150234,0.43750)15301130112(15301130320,0.43155),(15202150112,0.46580),(15301140106,0.27947),(16106150148,0.20096),(15201150106,0.20063)15201150209(15201130632,0.62500),(15201140119,0.54233),(16102150113,0.51619),(15208140219,0.43644),(15208140128,0.42857)

根据结果,使用传统UserCF算法时,4个读者的20个相似性数据中,仅有1个取正值,有18个取值为-1,即没有相关性.使用IPLR算法进行推荐,4个读者的20个相似性数据均取正值,即每个读者都能找到与自己具有相同爱好的读者.

合作社现有理事会成员7名,监事会成员3名,由村两委干部和村民小组组长担任,理事长由村书记担任。在合作社运行初期专门聘请执行经理1名,负责日常经营管理工作,财务由村会计兼职,季节性竹林管护临时聘请人员,涉及重大事项由合作社理事会商讨决策。合作社建立了规范的议事制度、监事制度和财务制度,严格按照制度执行。

对邻近读者K取不同个数时,通过两种算法所得到的相似度为正值的邻近读者个数进行统计,结果如图3所示.使用传统的UserCF算法几乎无法找到相似度为正值的邻近读者,无法对该图书馆图书进行推荐.使用IPLR算法,当邻近读者数量K增大时,相似度为正值的邻近读者个数也在增多,能有效解决邻近读者选择问题,可依据此计算结果进行图书推荐.

  

图3 邻近读者选择结果Fig.3 Neighbored reader selection result

4.3 性能评估实验

使用UserCF算法进行图书推荐主要包括两个步骤:第一,找到与当前读者兴趣相似的读者集合;第二,找到这个集合中读者喜欢的,且当前读者没有选择的图书推荐给当前读者.其中,第一步找到邻近读者,由4.2节计算结果得知,使用UserCF算法无法找到当前读者的邻近读者,推荐算法的第二步无法进行,无法完成图书推荐,故只对IPLR算法做性能评估.

图书馆推荐系统的推荐准确度可以定义为:推荐给读者并被读者借阅的图书数目与推荐给读者的图书总数的比例.由图4可知,当推荐图书数目逐渐增加时,推荐准确度逐步提高,当邻近读者数目达到30后增长缓慢,40时达到峰值,之后开始缓慢下降.

  

图4 IPLR算法准确率Fig.4 Accuracy rate of IPLR algorithm

召回率可定义为:推荐给读者并被读者借阅的图书数目占其借阅的图书总数目的比例.由图5可知,召回率的变化趋势类似推荐准确率.

  

图5 IPLR算法召回率Fig.5 Recall rate of IPLR algorithm

覆盖率可以定义为:推荐给读者的图书数目占总图书数目的比例.由图6可知,覆盖率总体呈下降趋势,是因为随着邻近读者数量的增大,算法趋向于向读者推荐热门图书,所以造成覆盖率呈下降趋势.

  

图6 IPLR算法覆盖率Fig.6 Coverage of IPLR algorithm

4.4 实验结果分析

高校图书馆同一图书的馆藏量一般在2~5本不等,借阅图书的时间在10~30 d之间,按照平均一本书3本馆藏量,借阅20天,中间无借阅间隔,去除寒暑假计算,同一藏书一年最大的借阅数量是40次.事实上,同一图书即使是热点图书实际的借阅量也远低于此.同一图书的较少馆藏量严重限制了同一图书的借阅量,造成读者相似度矩阵数据稀疏.

基于IPLR算法,借阅同一书架上图书的读者具有相似兴趣,本文使用书架对图书进行分类,相同书架上的图书归为一类,每个书架上的图书100~400本不等,使用书架做单位,相同书架上的图书使用相同ID,可以将同一图书的借阅数量最多提高2个数量级,有效解决数据稀疏问题.

1.1.1 主要的仪器设备:①梯度PCR仪(德国eppendorf公司)②紫外凝胶成像系统(Cell Biosciences公司)③Universal水平电泳仪 (BIORAD 300,美国伯乐公司)

“双唇薄薄涂上一层,就能掀起一波‘回忆杀’,想想都令人开心和向往。”许多“80后”的网友这样评论大白兔润唇膏。而众多的“90后”的吃货妹子们更关心唇膏口味,不少人有趣地认为这应该是史上最甜蜜“好吃”的润唇膏。

5 结语

本文提出一种基于室内定位的图书馆推荐算法,有助于读者快速找到需要的图书,有效解决了图书馆推荐系统存在的数据稀疏问题.文中室内定位功能借助LED技术实现,实际中除LED技术外,WiFi、RFID、蓝牙等技术在图书馆室内定位中均有一定的研究和应用,随着室内定位精确度的不断提高、成本不断降低和智能手机的普及应用,文中算法的应用范围将更加广泛.

参考文献

[1] 李 默,梁永全.基于标签和关联规则挖掘的图书组合推荐系统模型研究 [J].计算机应用研究,2014,31(8):2390-2393.

[2] 罗 琳,梁桂生,蔡 军.基于分众分类法的图书馆书目推荐系统 [J].现代图书情报技术,2014(4):14-18.

[3] 尹彦飞.基于查询日志分析的主动标签推荐系统 [D].杭州:浙江大学,2015.

[4] 谭龙江.基于读者活动的个性化图书馆推荐系统 [J].系统工程,2015,33(8):154-158.

[5] 秦 健.基于信息可视化与数据挖掘的高校图书馆推荐系统的设计与实现 [D].北京:北京交通大学,2014.

[6] O’SULLIVAN D,SMYTH B,WILSON D.Preserving recommender accuracy and diversity in sparse datasets [J].International Journal on Artificial Intelligence Tools,2004,13(1):219-235.

[7] 刘树栋,孟祥武.一种基于移动用户位置的网络服务推荐方法[J].软件学报,2014,25(11):2256-2274.

[8] 张闪闪,黄 鹏.基于LBS的图书馆个性化推荐系统的构建 [J].图书馆杂志,2015(12):61-68.

[9] 李 胜,王叶茂.一种基于本体和位置感知的图书馆书籍推荐模型 [J].现代图书情报技术,2015(3):58-66.

[10] 赵嘉琦,迟 楠.室内LED可见光定位若干关键技术的比较研究 [J].灯与照明,2015,39(1):34-41.

[11] 吴 楠,王旭东,胡晴晴,等.基于多LED的高精度室内可见光定位方法 [J].电子与信息学报,2015,37(3):727-732.

[12] KUO Y S,PANNUTO P,HSIAO K J,et al.Luxapose: indoor positioning with mobile phones and visible light [C/OL].[2017-01-20].http://www.doc88.com/p-0468915325779.html.

[13] 项 亮.推荐系统实战 [M].北京:人民邮电出版社,2012.

 
马元元,蒋子规,刘艳飞,郝海涛
《兰州理工大学学报》2018年第02期文献

服务严谨可靠 7×14小时在线支持 支持宝特邀商家 不满意退款

本站非杂志社官网,上千家国家级期刊、省级期刊、北大核心、南大核心、专业的职称论文发表网站。
职称论文发表、杂志论文发表、期刊征稿、期刊投稿,论文发表指导正规机构。是您首选最可靠,最快速的期刊论文发表网站。
免责声明:本网站部分资源、信息来源于网络,完全免费共享,仅供学习和研究使用,版权和著作权归原作者所有
如有不愿意被转载的情况,请通知我们删除已转载的信息 粤ICP备2023046998号