快捷分类

基于MAS的时序数据集成管理模型设计∗

更新时间：2009-03-28

1 引言

随着对人工智能研究的不断深入和发展，基于时序数据的研究成果已经广泛应用于工业生产和企业管理领域［1］，并发挥极大的作用，如MASCH系统，横截生产数据分析系统等。由于信息化的普及，相关生产数据的完整性和准确性不断提高，伴随时间增长带来的数据激增和数据量级提高，于是提高数据处理和分析效率，降低数据噪音影响成为提高智能化应用准确度和有效性的关键。时序化方法以时间为维度建立关联关系，提高了大数据量分析松散度，突破数据关系分析的限制，解决了智能推理过程中由数据关系带来的繁冗和高复杂度，使大数据分析指导领域辅助决策更有意义。

海量涉及生产和管理相关的时序数据处理效率和准确率对于智能化应用至关重要［2］。虽然通过多线程、算法优化等手段可以很好地提高数据处理效率和速度，较好地解决相关领域内的浅层数据分析，粗值计算等问题，但是依旧存在以下缺陷：1）多线程数据处理方式仅对数据体本身实施切割，处理过程保持纵向流程不变，对于数据处理缺乏针对性，处理效率较低［3］；2）数据处理过程间缺乏关联性，协调能力较弱，数据的可直用性差，数据预处理结果不符合应用需要；3）由于缺乏对数据本身表象特征分析，忽略数值计算方法的改变，导致数据处理的适应能力差，处理效率和鲁棒性较低，同时在高阶拟合、余音处理方面存在响应时间过长，结果精确度差等问题［4］。

针对上述问题，提出基于MAS（Multi-Agent System）的时序数据集成管理模型（DM-MAS模型）的设计。为解决时序数据复杂度高、数据运算量大、数据转换和处理效率低及数据可直用性弱的问题，采用时序数据模型，通过数据建模技术集成数据。以SCSM结构为基础，引入MAS技术，从Agent单体结构、MAS框架和管理策略三方面进行研究，设计出基于MAS的时序数据集成管理模型，实现生产数据的有效集成和整合，达到了提高数据的处理效率和鲁棒性的目的［5］。

式中：CAPr为厂家提供性能曲线制热量与名义工况制热量的比值；COPr为厂家提供性能曲线COP与名义工况COP的比值；to为环境温度，℃；tg为热泵机组出水温度，℃.

根据中国互联网协会在2017年中国互联网大会上发布的《2017年中国社交电商和微商行业发展报告》中对社交电商的定义，将其定义基于人际关系网络，利用互联网社交工具，从事商品或服务销售的经营行为，是新型电子商务的重要表现形式之一。相对与传统电商而言，社交电商有着显著的特征。

2 时序案例样本结构的设计

案例样本结构由样本属性集和时序数据体组成。图1所示的一种样本属性集包括案例样本标识、单元信息、生产类型、起始/终结时刻、时间跨度、时间粒度、数据摘要等七部分组成［6］。

各体系结构描述如下。

图1 样本属性集结构

其中样本属性集各属性描述如下：1）案例样本标识：用于描述案例的唯一性，与案例的静态属性相关；2）单元信息：描述发生该案例的生产单元的相关属性；具体包括所属区块、井号、作业区等。3）生产类型：案例所描述和反应的生产类型；4）起始/终结时间：时序数据体的数据截取时间点，通常起始/终结时间为墓碑时刻，来源依据标志型数据的措施数据实体。描述的是两次异常发生时间点；5）时间跨度：终结时间-起始时间；6）时间粒度：反应时序数据体的最小数据单元的时间粒度，对于不同粒度的数据，需要通过等粒度化方法进行统一；7）数据摘要：用于描述时序数据体的数据实例。如图2所示，数据摘要由数据实例名称和数据行为算法组成。数据摘要描述数据实例数量就是时序数据体的维度。

图2 数据摘要结构

时序数据体是以相同维度构成的多维数据集合［7］，每一维度的数据称为数据实例。时序数据体的构成要求如下：1）数据实例可由一个或多个数据项经过计算组成；2）数据实例内的数据必须具有相同时间粒度，为精确描述，时间粒度要求以最小时间粒度为准。

在基于MAS的数据集成管理模型中控制中心由调度Agent和Agent工厂组成［12］。控制中心提供一个具有全局知识控制、调度和决策的调度Agent，通过它可以实现对多Agent的统一管理，对众多Agent发送的请求、业务的需求进行任务的分解或者分配。Agent工厂主要是通过对业务的需求分析来定制特定的Agent。通过对工厂动态原始数据的分析，主要是用到三种数据处理模型，分别是行为业务响应模型、固定业务处理模型和I/O交互模型。

3 基于多Agent的数据集成管理模型设计

工厂动态数据模型其本质就是围绕着模型的数据主题，对生产原始数据进行抽取、清理和转换等措施，消除生产原始数据本身所具有的异构性、多维性等这些特点所导致在数据集成过程中的差异性，将数据由原子粒度级逐级处理为面向某个决策或汇总的高粒度信息。为了实现数据模型的自主性，消除数据冗余等问题，采用多Agent技术来实现该数据集成模型［8］。首先，通过构建Agent单体的体系结构，包含Agent交互界面、知识表达、决策推理、通信控制来实现Agent单体的建造；其次，依据数据实体和业务的需要构建异质Agent，来适应不同的数据处理需求，最后，建立起MAS框架，包含多Agent的管理策略，调度策略。实现通过MAS技术来实现工厂生产数据的集成与管理。

3.1 Agent单体结构设计

单体Agent的体系结构主要描述的是Agent的基本的功能模块以及各个模块之间的联系和交互的机制。在多Agent系统中［9］，Agent的单体结构是模型设计的核心，它具有的自主性和社会性，满足了异质Agent间的通信与交互的需求。通过建立单体Agent的体系结构，实现Agent间的相互操作以及可重用性。Agent单体结构都具有如下图3的框架结构：

图3 单体Agent的体系结构图

企业的活动要以企业的发展为目标，全面提高企业经济运行质量。全新的财务理念是以实现企业目标为方向，以低成本创立最佳效益为中心，构建全新的管理运行机制。要将财务管理作为企业管理的中心，将财务管理融入到企业的生产、运营等一切的经济活动中来。根据全新的财务管理理念建立财务、物资、工程、成本、审计等部门的职责与分工体系，明明确各项业务流程和各个部门的职责，发挥各部门的职能，让企业的财务管理规范化、系统化，实现企业的可持续发展。

1）交互界面。交互界面是用户和Agent之间的一个桥梁［10］，用户可以通过交互界面向Agent提出请求，同时Agent可以通过交互界面回馈信息，实现人机之间的交流。

通过工厂处理业务的特点，结合动态生产数据模型为基础，采用多Agent系统，设计基于多Agent的数据集成管理模型［11］，如图4所示。模型由I/O交互模型、固定业务处理模型、行为业务响应模型及控制中心等四个子模型组成。

㉖马克·弗里曼:《传统与对自我和文化的回忆》，载哈拉尔德·韦尔策编《社会记忆历史、回忆、传承》，季斌等译，北京大学出版社2007年版，第38～39页。

由表1可知，1000口油井的数据处理时间为32h；3000口以上的部分数据处理由于线程占用资源过大导致系统发生阻塞，6000口以上的油井数据处理已经导致系统完全阻塞并崩溃。由此可得出结论：以聚驱生产管理单位的资源环境，采用多线程方式是无法满足现场需要的。

3）决策推理。级别不同的Agent拥有不同的决策权限，部署在客户端的Agent因其知识库的容量较小，通过固定的推理机制可以快速高效地进行工作，适用于单一固定的业务执行。而安置在远程服务端的核心Agent凭借其更庞大、更完善的知识库，可以根据不同的现场数据实体、业务的复杂度而选择多种不确定性推理机制，为其得到最佳解决方案。

我感到老婆的双手一片冰凉，从她的体温中，在她的眼神里，我感觉到了她对我的关爱，我还有什么理由拒绝她呢？更何况，听说气管里长东西，我的心也提到了嗓子眼，也更加倾向于在哈尔滨做。

4）通信控制。通信控制模型是单体Agent体系结构的基础。Agent间的通信采用已有的通信机制如黑板系统，单体Agent通过发送通用语言描述的消息到黑板上，其他Agent可以在任何时候查看黑板，使得Agent间可以相互交流，实现Agent的社会性。

3.2 模型框架设计

2）知识表达。知识表达就是将知识符号化并输入到计算机的过程和方法。知识表达在智能Agent的建造中起到了关键作用，正是由于以适当的方法表示了知识，才导致智能Agent展示了智能行为。在某种意义上，可以将知识表示视为数据结构及其处理机制的综合。其中恰当的数据结构用于存储要解决的问题、可能的中间结果、最终解答以及与问题求解有关的世界的描述。这里提出了知识库来存储知识。

有机-无机杂化铅卤基钙钛矿材料主要指ABX3原子结构中A原子为有机基团的化合物，如，等。其中，甲氨基铅卤钙钛矿(CH3NH3PbX3 (X=Cl, Br, I))[18-19]具有大的消光系数、大的双极性载流子输运特性、合适且可调的禁带宽度和较大的载流子扩散长度，受到更多关注。

图4 基于MAS的数据集成管理模型

行为业务响应模型由多个响应式Agent组成，主要任务是对数据模型中的数据变化做出相关反应，实时保持数据的一致性和完整性。

任务的合理化调度可以使得网络均衡，使得资源的利用率达到最大化。系统主要是通过统一的调度Agent来实现整个MAS系统的Agent的调度问题以及出现的突发状况。首先系统获取到要执行的任务，然后根据任务的大小分解成若干个子任务，对于这些子任务进行分类，然后调度Agent根据这些子任务的请求和执行的需求条件如资源大小，时间和优先度来选择不同的调度算法来确定调度方案。执行Agent根据调度Agent的要求来具体到各个节点上去进行任务处理。调度模型图如图5所示。

I/O交互模型：由多个界面Agent组成，主要任务是主动收集人工交互信息并做出相应反应。

3.3 Agent管理策略

Agent的管理策略主要是如何通过有限的时间和资源完成指定的多个任务。在多Agent系统中，各个功能的Agent分布在不同的网络的节点上，所执行的任务包含计算任务和逻辑推理任务会存在一定的并行性，同时系统中会有执行的规则，包含执行优先级、所需资源的大小、消耗时间的长短等。

在MAS的框架中对于多Agent的管理是很重要的部分，决定了框架是否稳定的关键所在。Agent在分布式的工作中存在以下难点问题：1）工作流程固定，对于突发情况无法进行智能处理，会造成整个框架的瘫痪；2）在调度过程中存在资源有限，从而导致调度死锁的情况发生，导致工作的终止；3）在多Agent并发执行时候，造成的数据冲突的问题。

基于MAS的时序管理集成管理模型是在多Agent技术的基础上进行的改进。Agent调度定义了Agent本体资源占有量、运行时间及负载均衡［13］。初始情况下，一种对Agent的调度分配策略说明如下：1）单体Agent在执行的任务过程中所花费的时间必须在规定的时间内完成，不能超出规定的最长时间；2）单体Agent在某个时刻请求的某类资源一定要小于这类资源的总数。3）在任务的执行过程中，需要保持当前的Agent的执行优先度要高于即将要执行的Agent的优先度。

固定业务处理模型由多个定时式Agent组成，主要任务是保持数据模型中数据的时序性和实时性，执行周期性的数据处理和计算，对大数据量实施提前处理和统计动作。

图5 调度Agent结构图

4 实例测试及效果综合分析

Agent的运行数量影响数据处理的效率［14］。Agent并行数量过少，导致分析和处理数据能力较为受限；Agent并行数量过多，将导致通信的响应时间过长，甚至导致通信阻塞。所以研究Agent并发数量，合理地安排Agent启动时间，是维护多Agent系统的重要任务。

4.1 多线程数据处理综合效果分析

传统的数据处理方法采用多线程方式应对并发和大数量计算等问题。根据生产数据处理的特点，采用多线程方式对数据模型的五类数据进行处理。为体现同等环境下的对比效果、线程数与Agent处理业务数量，共选取122项服务作为测试项目。处理时间跨度为7天，处理对象为8000口油井。

本次研究选取2011年1月—2018年6月在我院接受甲状腺结节手术的76例患者作为研究对象，76例患者共90个甲状腺结节。其中男性33例，女性43例，最小年龄19岁，最大年龄79岁，平均年龄（43.2±3.2）岁，所有患者均接受超声检查，且临床资料齐全，术后病理诊断明确。

表1 多线程数据处理效果

样本数量（井数）1000 3000 5000 6000～8000数据处理时间（h）静态数据8 11 18-动态数据14 22开发数据14动态管理12智能分析16总计64--------------

4.2 多Agent数据处理综合效果分析

选用122项服务作为测试项目，选用不同的时间跨度，处理对象为8000口油井，对多Agent系统进行测试，测试结果如表2所示。

表2 多Agent系统数据处理效果

数据处理时间（h）时间跨度（天）总计0.8 2 3.6 4 6.4 60 1（日报数据）7（周报数据）10（旬报数据）15（半月报数据）30（月报数据）365（年报）静态数据0.2 1.0 1.4 3.0 4 34动态数据0.2 1.0 1.4 2.8 4.4 36开发数据0.6 2 2.6 3.0 4.6 44动态管理0.8 2 3.0 3.2 6 44智能分析0.8 2 3.6 3.8 6 60

由表2得到如下三点结论。

1）由于采用并发处理，所以总处理时间不累加。

一般应在怀孕后15～20周内做唐氏综合征筛查，在20～26周前做胎儿大体畸形筛查，包括脑积水、无脑儿、脊柱裂、心脏畸形、唇腭裂、肢体短缺等。如果错过了筛查时间，等孩子出生后可以存活时，再发现畸形就晚了，也无法终止妊娠，只好面对孩子畸形的现实，这是非常残酷和悲惨的。所以，奉劝已经怀孕的准父母们，一定要重视产前筛查。

2）不同时间跨度的均处理时间逐渐缩短，说明在应对大数据量时，会由调度Agent进行任务分配。

我叫他去县城的时候到我那里玩玩。他说，他经常去县城的，现在城里人比乡下人还要重视风水，年纪大的亡故，墓地选择之外要择定下葬的具体时辰；买新房子要看楼盘，选择单元位置；买老房子要问明吉凶，去晦除邪。他说，连不少单位都常常请他去的。有一个单位，20层的大楼，主楼裙楼，围墙花园，建得既豪华又气派，但入住之后不久，两个一把手相继因经济问题而入狱。再后来的继任者怀疑风水出了问题，不知怎么找到了他。他去看了看，叫他们把原来朝南开的大门封掉，改朝东开。小先生所说的这个单位，和我家在同一条路上，当时搞不清好好的南大门，为什么封掉重开，想不到还有这样一段故事。

3）年报数据处理周期过长，且在实际测试中发现部分数据处理发生错误和阻塞，主要原因是由于各月报错误导致的漏失放大。

5 结语

论文提出了基于MAS的时序数据集成管理模型，以时序数据模型为基础，结合业务管理流程及工作特点，设计时序案例样本结构（SCSM结构）；采用SCSM结构，引入MAS技术，借鉴Center-Round中控管理模式，完成基于MAS的时序数据集成管理模型设计。同时通过实例测试和效果对比分析验证了该模型的可行性，以此解决时序数据运算量大，数据转化处理效率低及数据可直用性差等问题，达到提高系统鲁棒性和数据精细化处理程度的目的。

参考文献

［1］姜高霞，王文剑.时序数据曲线排齐的相关性分析方法［J］.软件学报，2014，25（9）：2002-2017.JIANG Gaoxia，WANG Wenjian.Stability Analysis of Sequential Data Curve Arrangement［J］.Journal of Software，2014，25（9）：2002-2017.

［2］解维国，张文.一种先进的系统、综合的生产数据分析方法［J］.国外油田工程，2008，24（11）：16-21.JIE Weiguo，ZHANG Wen.An advanced system，integrated production data analysis method［J］.Foreign Oilfield Engineering，2008，24（11）：16-21.

［3］魏玲，郭新朋.基于并行处理机制的数据复用策略研究［J］.计算机应用研究，2017，34（8）：1-6.WEI Ling，GUO Xinpeng.Study on data reuse strategy based on parallel processing mechanism［J］.Application Research of Computers，2017，34（8）：1-6.

［4］Deng Xiaoming，Wu Fuchao，Wu Yihong.An Easy calibration method for central catadioptric cameras［J］.Acta Automation Sinica，2007，33（8）：801-808.

［5］Michael Negnevitsky.人工智能智能系统指南［M］.北京：机械工业出版社，2012.Michael Negnevitsky.Artificial Intelligence Intelligence System Guide［M］.Beijing：Mechanical Industry Press，2012.

［6］张可佳.基于混合智能的聚驱区块生产动态预警方法研究［D］.大庆：东北石油大学，2016.ZHANG Kejia.Study on dynamic early warning method of production block based on hybrid intelligence［D］.Daqing：Northeast Petroleum University，2016.

［7］李建中，高宏.一种数据仓库的多维数据模型［J］.软件学报，2000，11（7）：908-917.LI Jianzhong，GAO Hong.A Multidimensional Data Model for Data Warehouse［J］.Journal of Software，2000，11（7）：908-917.

［8］赵龙文，侯义斌.Agent的概念模型及其应用技术［J］.计算机工程与科学，2000，22（6）：77-78.ZHAO Longwen，HOU Yibin.On the conceptual model of Agent and its application technology［J］.Computer Engineering and Science，2000，22（6）：77-78.

［9］董红斌，王建华.多Agent技术研究［J］.计算机应用研究，1999，16（10）：29-30.DONG Hongbin，WANG Jianhua.Study on Multi-Agent Technology［J］.Application Research of Computers，1999，16（10）：29-30.

［10］高波，费奇，陈学广.Agent交互层次模型［J］.计算机科学，2001，28（8）：105-106.GAO Bo，FEI Qi，CHEN Xueguang.Agent Interactive Hierarchy Model［J］.Computer Science，2001，28（8）：105-106.

［11］Jennings N R，Sycara K，Wooldridge M.A Roadmap of Agent Research and Development［J］.Autonomous Agent and Multi-Agent Systems，1998（1）：275-306.

［12］孙浩，薛霄.基于多Agent建模的电子商务生态系统演化实验研究［J］.计算机工程，2016，42（7）：27-32.SUN Hao，XUE Xiao.Experimental Research on Evolution of E-commerce Ecosystem Based on Multi-Agent Modeling［J］.Computer Engineering，2016，42（7）：27-32.

［13］毛新军.面向Agent软件工程：现状、挑战与展望［J］.计算机科学，2011，38（1）：1-7.MAO Xinjun.Processing Agent Software Engineering：Status Quo，Challenges and Prospects［J］.Computer Science，2011，38（1）：1-7.

［14］HERMANS B.Intelligent software Agent［J］.A I Magazine，1998，（9）：11-12.

作者

李春生，张勇，张可佳，宋佳

出处

《计算机与数字工程》 2018年第05期

上一篇：基于深度学习的商品评价情感分析与研究∗

下一篇：基于句法结构分析的中文文本聚类方法研究∗

《计算机与数字工程》2018年第05期文献

强规划的最小期望权值求解算法∗ 作者：袁润，文中华，戴良伟，陈秋茹

基于ELM-AE的迁移学习算法∗ 作者：邓万宇，屈玉涛，张倩

基于改进词包模型的车型识别算法∗ 作者：康珮珮，于凤芹，陈莹

基于人工蜂群算法的数据分类感知研究∗ 作者：王小君

基于Rife算法的跳频信号瞬时频率估计算法研究∗ 作者：孙微涛，张志宝，罗文峰，汪帆

引入主题链接块因子的候选链接搜索策略研究∗ 作者：周雪，刘乃文

预测Motifs算法的改进评价策略∗ 作者：张斐

基于模糊隶属的低消耗航材界定研究∗ 作者：曾翔，徐廷学，安进，李志强，李凯

基于CS-LDP和LCCP特征融合的人脸识别算法∗ 作者：汤啸，张戈，刘增力

GPS标准定位服务偏移误差的预测和改善∗ 作者：张宝军，王亚辉

基于加权非线性最小二乘的无源协同定位∗ 作者：李思奇

基于区间数学的全局优化算法及其应用探讨∗ 作者：王锦瑞

一种改进的双站时频差目标跟踪高斯和滤波算法∗ 作者：曹亚琴，秦宁宁，杨乐

基于模糊综合评价法的“走出去”企业与华人华侨合作稳定性的仿真与评价∗ 作者：梁雨欣，汪群，李卉

基于深度学习的商品评价情感分析与研究∗ 作者：刘智鹏，何中市，何伟东，张航

基于MAS的时序数据集成管理模型设计∗ 作者：李春生，张勇，张可佳，宋佳

基于句法结构分析的中文文本聚类方法研究∗ 作者：尹积栋，谢茶花，彭崧，刘红，曾昭虎

带有边界条件的城市DEM构建方法研究∗ 作者：林春华，万栋平，邵为真

基于序关系分析法的电力市场监管指标体系评价∗ 作者：陈宏，谢国荣，王迟

用于短文本关键词抽取的TTM_DMM主题翻译模型∗ 作者：王瑞，秦永彬，闫盈盈

基于LSA的历史工作票问题分类异常检测∗ 作者：张航，徐建

基于无线自组网的边境视频监控系统∗ 作者：庞泽峰，刘增力

异构云环境下能效优化的任务调度算法∗ 作者：容会

一种针对正规树模式的复杂事件查询方法∗ 作者：郑利强，廖湖声，苏航，高红雨

直觉模糊满意态模型∗ 作者：鱼先锋，万世昌

面向生产过程的异构数据服务描述语言IO-DSDL的设计与实现∗ 作者：陈彦萍，郭超，杨为惠

海量通信数据管理平台的设计与实现∗ 作者：曾伟忠

面向电力大数据的多数据流实时处理技术研究∗ 作者：孟庆强，胡牧，孙立华，郑浩泉

贝叶斯网络参数学习中的连续变量离散化方法研究∗ 作者：刘晓明，李盼池，刘显德，肖红

基于骨架的单幅图像三维建模∗ 作者：张淑军，刘文晓

杂志信息网