更全的杂志信息网

基于K-MEANS聚类算法对众包任务定价的计量分析

更新时间:2016-07-05

0 引言

随着互联网越来越发达,经济全球化日趋迅速,众包作为一种新型商业模式逐渐在市场崭露头角[1],将这种高效方法应用于任务定价是大势所趋,本文将在K-MEANS算法应用的基础上对众包任务定价方式进行计量分析.

对户用沼气全生命周期的环境排放进行调查。户用沼气全生命周期的环境排放主要包括以下3个部分:①沼气发酵产气及沼气输出阶段沼气泄露(没有扣除发酵原料生长阶段吸收的CO2);②沼气使用阶段环境污染气体的排放;③沼液沼渣使用阶段有机物、氮、磷等营养物质的排放。生产400m3沼气全生命周期的环境排放清单如表1所示。

1 数据来源与模型假设

数据来源于2017年“高教社杯”全国大学生数学建模竞赛B题.为便于解决问题,对本文提出以下假设:⑴本文所使用的数据均真实有效,具有统计分析价值;⑵任务定价主要受会员与任务距离影响,忽略其他因素对定价的影响;⑶会员的配送能力能够满足该区域内所有的配送需求.

2 基于K-MEANS聚类分析的距离体系

2.1 研究思路

通过查阅资料与相关文献,选取恰当的方法探索任务定价模型.首先,用数学软件挖掘数据信息通过任务与会员的位置对任务与会员聚类,将任务与会员打包[2];然后,根据已完成任务的价格进行加权合计得到任务定价函数;最后对新任务与会员分类预测新任务的定价.

2.2 研究方法

根据研究思路,对数据做如下处理挖掘数据信息,求解会员中心到任务中心的距离.

⑴运用K-MEANS聚类算法根据任务位置信息将已结束项目聚成m类[3],得到各类的中心的位置为(Wi,Ei),其中,i=1,2,…,m;根据会员位置信息将会员聚成n类,得到各类的中心的位置为(Wj,Ej),其中,j=1,2,…,n.

㊴Mitchell Timothy,“Society,Economy,and the State Effect”,in George Steinmetz(ed.)State/Culture:State- Formation after the Culture Turn,Corner University Press,1999,pp.76 ~97.

根据所求(2)式所求价格与完成度的关系,计算出在将任务点划分成6类时打包发布的任务完成度,并与之前分散发布的任务度对比可知,修改之前的定价模型后,各地区的任务完成度处于大致持平状态,缓解了偏远任务点无人问津的状况,有利于提高整体任务完成度,任务完成度前后对比如图4所示.

图1 经纬度求解距离示意图

已知,A、B 两点的经纬度分别为 Aj、Aw、Bj、Bw,c 为弧长对应的圆心角,地球的半径为R.

第一步,利用球面余弦公式,

其中,角C等于角A-OC-B,即面AOC与面BOC的二面角,即Bj-Aj.于是,公式等价于:

权重是指某一因素在集合中的重要程度[8],即在其他因素不变的情况下,该因素的变化对定价结果的影响程度,计算公式为:

第三步,将角度化为弧度求距离:

这种是传统电子商务转型社交电子商务的常用方法。采用该模式的商家本身就是做电子商务的,在自己原有的网站平台上开辟社区,引导商家与客户,客户与客户之间的沟通交流,从而增加客户粘性,提高购买率。比较典型的有淘宝里面的微淘、淘直播、淘达人等。

⑶根据距离远近关系将任务与会员分为N个区域,N=min(m,n).

2.3 结果分析

对原始数据进行数据挖掘,运用SPSS软件根据位置信息分别对已完成任务与会员聚类,得到聚类结果[4].根据聚类结果将任务最终聚成20类,最终聚类中心的位置和每一类包含的任务个数如表1所示.

如果这是一条健康的狼,那末,他觉得倒也没有多大关系;可是,一想到自己要喂这么一只令人作呕、只剩下一口气的狼,他就觉得非常厌恶。他就是这样吹毛求疵。现在,他脑子里又开始胡思乱想,又给幻象弄得迷迷糊糊,而神智清楚的时候也愈来愈少,愈来愈短。

企业若想使自身市场竞争力获得有效提升就必须更加重视物流成本管理,由于我国的物流市场需求十分庞大,所以我国企业在物流成本方面仍具有一定的优势,且物流发展空间相对良好,而企业若想抓住以上优势就必须认真开展物流成本管理,对企业物流成本管理目标予以整体把握,提升企业成本会计制度的完善程度,更加致力于成本控制机制的创新,对物流流程予以整合及优化,提升企业资源的利用效率,只有这样企业才能在降低成本的同时持续提升自身服务质量,达到增加自身市场竞争能力的根本目的。

表1 任务聚类结果

类别 1 2 3 4 5 6 7纬度 23.15854 22.7675 22.83828 23.15163 23.81611 22.63449 22.84069经度 113.2872 113.8086 114.1109 112.962 113.9579 114.0841 113.2392任务个数 126 48 37 29 1 53 36类别 8 9 10 11 12 13 14纬度 23.01522 23.03279 22.5612 23.03023 22.68691 23.8784 23.55107经度 113.3916 113.6934 113.9369 113.8741 114.2733 113.5397 113.5785任务个数 78 56 61 56 27 1 16类别 15 16 17 18 19 20 —纬度 23.04868 22.918 23.72312 23.42524 22.81064 23.2821 —经度 113.1189 112.9773 113.7394 113.2098 113.5744 113.3229 —任务个数 86 20 1 39 31 33 —

根据聚类结果将会员最终聚成4类,最终聚类中心的位置和每一类包含的会员个数如表2所示.

表2 会员聚类结果

类别 1 2 3 4 5 6 7纬度 22.82238 23.25263 23.10071 23.14061 23.5639 23.27834 23.12257经度 114.129 113.3237 113.35 113.2399 113.5869 113.7321 113.5005会员数 58.000 115.000 200.000 207.000 13.000 18.000 62.000类别 8 9 10 11 12 13 14纬度 22.70401 22.88022 22.87068 23.04696 22.90278 23.41898 22.98569经度 114.278 112.9213 113.6986 113.776 113.324 113.2327 113.9596会员数 71.000 19.000 73.000 89.000 79.000 45.000 103.000类别 15 16 17 18 19 20 —纬度 22.75039 22.56493 22.67346 23.13767 22.99703 22.58492 —经度 113.8439 113.9285 114.0236 112.9291 113.1204 114.1152 —会员数 152.000 117.000 148.000 31.000 97.000 174.000 —

运用MATLAB软件计算会员聚类中心到任务聚类中心的最小距离[5],为模型的简便不考虑只有一个任务的类5,类13,类17.于是任务分为17类会员分为20类,最终形成17个区域,即分成17个包.区域组合及区域内的任务密度、加权价格如表3所示.

参考文献

3 模糊加权平均定价体系

3.1 研究思路

受滴滴打车的启发,考虑打包定价的方法.利用K-MEANS聚类算法对离散的任务聚类,聚类后将任务联合在一起打包发布.根据聚类结果对原始定价模型进行修正,建立模糊加权平均定价模型.

对我国的地铁建筑工程施工安全风险管理进行有效的分析,得知我国地铁建筑工程施工安全风险管理的技术和规范非常落后,缺乏有效的管理技术和规范,已经不能满足现代化社会发展的需求。因此各级土建施工单位应该建立完善、全面的规范体系。

3.2 数据处理

⑶任务定价

图2 任务点聚类分布图

根据聚类分析结果,得到各类别下的任务定价,如表4所示.

元和二年十二月,史官李吉甫等撰《元和国计簿》十卷,总计天下方镇,凡四十八道,管州府二百九十三,县一千四百五十三,见定户二百四十四万二百五十四。其凤翔、鄜坊、邠宁、振武、泾原、银夏、灵盐、河东、易定、魏博、镇冀、范阳、沧景、淮西、淄青十五道七十一州,并不申户口数。每岁县赋入倚办,止于浙西、浙东、宣歙、淮南、江西、鄂岳、福建、湖南等道,合四十州,一百四十四万户,比量天宝供税之户,四分有一。[注]王溥:《唐会要》卷84,北京:中华书局,1955年,第1552-1553页。

3.3 研究方法

表3 区域组合信息表

区域 任务 会员 密度 加权价格1 B1 126 A3 A4 407 0.309582 66.32937 B2 48 A15 152 0.315789 68.05208 3 B3 37 A1 58 0.637931 72.97297 4 B4 29 A18 31 0.935484 74.5 5 B6 53 A17 A20 322 0.164596 67.38679 6 B7 36 A12 79 0.455696 71.13899 7 B8 78 A7 62 1.258065 67.00641 8 B9 56 A6 A11 107 0.523364 68.76786 9 B10 61 A16 117 0.521368 66.32787 10 B11 56 A14 103 0.543689 71.02679 11 B12 27 A8 71 0.380282 70.12963 12 B14 16 A5 13 1.230769 71.875 13 B15 86 A19 97 0.886598 70.05233 14 B16 20 A9 19 1.052632 73.1 15 B18 39 A13 45 0.866667 71.51282 16 B19 31 A10 73 0.424658 71.29032 17 B20 33 A2 115 0.286957 67.89394 2

表4 各类别任务价格分布

价格/元 65 66 67 68 69 70 71 72 73 74 75 1 7 72 35 5 7 27 3 5 4 0 16 2 25 67 9 5 5 21 2 4 2 1 17 3 26 50 21 11 5 10 3 7 5 4 8 4 2 31 13 11 1 17 4 17 7 5 17 5 5 33 23 21 12 17 3 32 1 0 15 6 0 0 0 0 0 12 0 0 0 0 7价格/元 76 77 78 79 80 81 82 83 84 85 1 0 0 0 0 2 0 0 0 0 4 2 0 0 0 0 3 0 0 0 0 3 3 0 0 0 0 1 0 0 0 0 1 4 0 0 0 0 5 0 0 0 0 12 5 0 0 0 0 1 0 0 0 0 7 6 0 0 0 0 1 0 0 0 0 0

⑴权重的确定

第二步,用反余弦函数求圆心角:

Pij表示某个定价出现的次数,例P11表示第一类别的任务有7次定价为65元.

系数kij(i=1,2,…,n)称权,他说明这系数后面的数据,在整个统计数据中占的比重,也说明这个数据对统计结果的影响程度,其中

系数kij(i=1,2,…,n)称权,他说明这系数后面的数据,在整个统计数据中占的比重,也说明这个数据对统计结果的影响程度,其中

加权平均定价模型是指将产品或服务的所有可能的定价与其各自权重乘积的和,得出综合各种情况的定价W,其数学表达式为:

xi(i=1,2,…,n)表示拍照任务所有可能的定价65≤xi≤85;

⑵加权平均定价[9]模型

红袍子说完,紫袍子接着讲:“你就是丢不了财色这两口浊气,难怪座师说你的文章写得狗屁不通,像吃了三斤黄豆憋着气,又像一孔瓦窑散不了烟。我们见到了药王他老人家,还不赶紧磕头,求他将长生不老仙丹的法子传给我们,老神仙由太宗朝活到高宗朝,又接着给武曌皇帝看病,跑到侠客岛去装死人好多年,现在又在万花谷里做活神仙,我们进了谷,要求就趁早求个不死方!”

根据任务点分布图(图2)可以看出,任务点的分布具有离散性的特点.“拍照赚钱”任务在时效性方面有要求,在配送区域划分的时候考虑将距离作为主要的划分标准.采用K-MEANS聚类算法对任务点区域进行划分,通过利用K-MEANS算法聚类[7],聚成6类,各个任务点聚类后的结果如图2所示.

由(1)式可求出各种价格在不同类别任务下的权重,带入(2)式可求出各类别任务在打包发布时的定价(见表5).

表5 各类别任务在打包发布时定价

类别 1 2 3 4 5 6价格(元) 68.61 68.45 67.98 71.39 69.88 72.25

3.4 结果分析

在计算出各类别任务在打包发布时定价后,根据附件一求出每价格下已结束任务的任务完成度(见表6),据此拟合出任务完成度与价格的关系,如图3所示,可知任务完成度为[10]

表6 各定价下任务完成度

定价 65 66 67 68 69 70 71 72 73 74 75 80 85任务完成度 0.54 0.45 0.47 0.83 0.63 0.80 0.75 0.70 0.70 0.20 0.76 0.69 0.89

图3 定价与任务完成度的关系

图4 是否打包发布完成度对比

⑵计算各任务聚类中心与会员聚类中心的距离dij.结合地理知识与数学知识,根据地球表面任意两点距离的求解方法计算各任务聚类中心到各会员聚类中心的距离,如图1所示,计算步骤如下:

4 结束语

本文利用K-MEANS聚类分析方法和球面距离处理数据,得到“众包”任务定价,合理考虑了地理位置与任务密度对任务定价的影响.为提高任务完成度,合理考虑不同价格在不同分类中的权重,提出模糊加权平均定价模型,使任务定价更加合理.如此定价方式,相比传统的市场调查方式确定任务定价,可以缩短调查周期,节约调查成本,实现企业与会员双方利益共嬴.

运用MATLAB软件分析加权价格与密度的关系并拟合加权价格和密度的函数关系[6],拟合结果为:

〔1〕孙坳,何明珂.基于结构方程模型的众包物流风险识别与分 析 [J/OL].管 理 现 代 化 ,2017,(06):105-109(2017-11-22).http://kns.cnki.net/kcms/detail/11.1403.C.20171122.1207.028.html.

〔2〕朱建平.应用多元统计分析[M].北京:科学出版社,2016.

开行快慢车需在白芒站、罗租站、同观路站、东周路站、长春北站共5处避让站设置越行线(见图7)。但其中白芒站、罗租站、同观路站的越行线兼顾停车线功能,对于常规站站停模式也需要设置停车线,东周路站为出入段线,因此仅长春北站一处为专门增设的越行配线,在计算越行线所增加的工程投资比较中应考虑这些因素。

〔3〕李磊,王俊熙,贺易,詹鹏,刘方方,汤弋.基于 K-means聚类粒子群算法的多点PV-DG日前分配计划[J].高电压技术,2017,43(04):1263-1270.

其次,从数学教学模式来看,教学内容与数学思想、方法相分离。目前不少高职院校数学教学把传授知识当作唯一内容,使学生只能简单地学习知识,不能感知相关的数学思想,培养数学精神,丰富数学方法,训练数学逻辑思维。而蕴涵数学思想方法的教学,伴随着学生对数学的欣赏,能够触及学生的灵魂,在体验数学美妙的同时产生心灵震撼。

〔4〕朱家明,任晓翮.基于AHP-熵值法的精明增长计量分析[J].安徽大学学报(自然科学版),2017,41(6):61-67.

〔5〕姜启源,等.数学模型(第三版)[M].北京:高等教育出版社,2003.8.

〔6〕孙信昕,赵兴龙.基于K-means遗传算法的众包配送网络优化研究[D].北京交通大学,2016.

〔7〕赵文杰,朱家明,吴晓蔓,等.基于C均值聚类下出租车资源配置的优化[J].佳木斯大学学报(自然科学版),2016,34(02):267-271.

〔8〕李震,洪添胜,曾祥业,等.基于 K-means聚类的柑橘红蜘蛛图像目标识别[J].农业工程学报,2012,28(23):147-153+299.

〔9〕何玲,朱家明,蔡经纬,等.基于马尔可夫预测法邮轮定价策略的研究[J].商丘师范学院学报,2016,32(09):1-5.

笔者从事市场技术服务期间,了解到一线存在诸多渔药、饲料企业从业人员及经销商,为了销售产品,提高个人业绩,对于养殖过程中出现的一些小问题,开出来的处方用药成本高达数千元,虽然一时间销售业绩上去了,拿到了优厚的业务提成,但是养殖户养殖效益不能随之提高,那么,这就是一个失败的处方。一个处方是否有价值,不仅仅关乎我们的销售业绩,里面还附带公司的声誉。多开“处方”,一定要科学合理、简单明了,不做杀鸡取卵之事。

〔10〕杨桂元.数学建模[M].上海:上海财经大学,2015.

孙晓玲,朱家明,贺晓剑,殷德香
《赤峰学院学报(自然科学版)》2018年第4期文献

服务严谨可靠 7×14小时在线支持 支持宝特邀商家 不满意退款

本站非杂志社官网,上千家国家级期刊、省级期刊、北大核心、南大核心、专业的职称论文发表网站。
职称论文发表、杂志论文发表、期刊征稿、期刊投稿,论文发表指导正规机构。是您首选最可靠,最快速的期刊论文发表网站。
免责声明:本网站部分资源、信息来源于网络,完全免费共享,仅供学习和研究使用,版权和著作权归原作者所有
如有不愿意被转载的情况,请通知我们删除已转载的信息 粤ICP备2023046998号