更全的杂志信息网

面向试验数据的装备大数据模型

更新时间:2016-07-05

0 引言

在装备试验工作过程中,积累了大量的历史数据资源,真实记录了装备试验、训练、演练的第一手资料数据,随着数据采集手段的不断拓展和综合试验演练类任务的深入推进,试验数据积累量将呈指数级增长。

这些数据资源是反映装备性能、可靠性,评价装备体系能力水平,研究装备发展路径的重要依据。但是,由于建设初期信息技术尚不发达,受网络、计算、存储及数据处理技术等因素限制,早期缺乏统一的系统规划设计,目前大量武器装备试验数据分散存储在不同试验终端,缺乏统一管理和分析应用机制,大量隐含在数据中的有价值信息没有得到有效地挖掘与开发[1-2]

在信息技术领域,大数据平台技术生态链取得了飞速发展,出现了 Hadoop、HBase、Storm、Spark等众多的开源的大数据分布式存储、并行计算处理框架。大数据计算技术解决了海量数据的收集、存储、计算、分析的问题。大数据技术已经在医疗、金融、交通、教育、环保、舆情监管等众多民用领域取得了实际应用,驱动了相关领域的业务模式的创新发展,取得了良好的经济社会效益。在军事装备领域,航天、风洞等领域试验数据得到了一定应用,但其本质还停留在传统的数据挖据领域,尚未形成对大数据技术的应用成果。

本文结合装备试验数据管理需求,研究提出了一种基于装备试验大数据的装备大数据模型,该模型可以指导如何抽取利用装备试验的历史资料数据,利用大数据处理技术挖掘建立装备决策分析模型知识库,并基于知识库提供装备管理智能化决策支持服务,从而提高装备数据资源的处理分析利用率,将数据资源转化为智能化的决策分析服务。

1 装备试验数据的特点

装备试验数据一般涵盖装备试验过程中产生的所有数据,长期以来,试验部门积累了PB级的历史试验数据资源,包括纸质报告、电子文档、胶片、电子照片、音视频数据、雷测数据、遥测数据等,分散在不同的试验终端单位,缺乏统一的数据组织与管理规范平台。这些试验数据资料具有以下特点:

样品主要来自超市、农贸市场、便利店、网店、餐饮店等,不同采样地点餐桌酱油、烹调酱油中菌落总数≥10 cfu/mL的样品比例相比差异均无统计学意义(χ2=7.194,P=0.207;χ2=0.897,P=0.970)。

(1)试验数据种类繁多。随着装备试验范围的拓展,试验数据包括的范围也越来越广,在试验大类方面包括:各型装备的性能试验数据,作战试验相关的装备能力效能评估数据,装备体系推演数据等;针对单项试验则包括:装备、气象、地理水文环境、人员保障、业务流程等数据。

(2)资料数据的形式多样化,结构化的数据库数据,又有非结构化的文本、图像、影像资料,还有半结构化的资料数据;此外,还存在海量的未数字化文档等。

基金项目体现了某个领域的学术研究前沿,图4为2004—2018年移动阅读研究论文的基金资助文献量,2009年开始出现基金资助论文,2013年达到顶峰44篇。2014—2016年虽然数量上略有下降,但仍保持了较强的支持力度,2017年基金资助论文回升到39篇。数据源541篇论文中包含基金资助论文228篇,占42.1%。228篇基金资助论文中,国家级课题72篇、教育部课题23篇、省市级课题82篇、校级课题35篇、其他课题16篇① 标注两个及以上基金资助的论文,本文仅统计最高级别课题。。国家级课题资助的论文数量占比较大,说明国家层面对移动阅读研究的关注促进了学者们的深入研究。

(2)试验任务评估需求:基于试验任务的试验数据,可以评估本次试验任务的实际效果;基于同类装备的历次试验任务,可以进行装备的技术发展演化画像分析,辅助进行装备技术改进点的挖掘分析决策。

(4)数据不断增长。随着后期体系级装备试验和贴近实战的装备作战试验的深入展开,试验数据资源量将承指数级迅猛发展。将有越来越多的试验数据需要管理、分析和利用,传统的数据仓库方式的数据中心方案将很难满足未来发展的需要,需要建立分布式的基于大数据的数据中心平台。

2 装备试验数据的管理需求分析

对装备试验数据的管理需求主要包括以下4个方面:

式中:y()为气样中C6及更重组分加和峰的摩尔分数,%;y(C5)为气样中异戊烷与正戊烷摩尔分数之和,%;A)为气样中C6和更重组分加和峰的峰面积,μV·s;A(C5)为气样中异戊烷和正戊烷的峰面积之和,μV·s;M(C5)为戊烷的相对分子质量,取值为72;M()为C6和更重组分加和峰的相对分子质量,取值为92。

“老魏,不能再错了!告诉我,库内水位升到多高?会不会漫坝?”情急之下,迟恒全忘了他只能是个旁观者,不能搅和。

(3)潜在价值高,价值相对稳定。与商业数据不同,随着时间的的推移,历史数据细节不再重要,武器装备试验数据对于装备全寿命管理周期有效期很长,可以长达十几年,数据价值随时间变化不敏感。

(1)数据建模需求:当前海量的试验数据资源的价值处于沉睡状态,由于其底数不清,格式各异,尚不能对其进行较为深入地应用分析,因此对海量试验数据资源进行建模,形成有效的管理、治理手段是当前需要解决的首要问题。

(3)多装备体系化试验评估需求:通过对装备、环境、保障、任务协同等多专业类别的融合挖掘,基于试验数据形成可视化的试验进程态势,辅助进行体系效能的综合评估。

试验数据层。试验数据按照资料数据的类型主要分为文本、图像、测试测量数据等。

装备试验大数据的根本目标是为装备试验活动提供智能信息服务和管理决策,并能够为后期装备使用、装备维护保障和装备技术发展提供支撑,所以装备试验大数据模型首先需要考虑数据平台的服务内容,具体包括:装备画像,装备建模,装备健康管理,装备体系化评估等。例如:如图1所示,通过装备大数据进行装备画像,可以对装备的质量、性能、适用的环境、维护保障、健康状况与剩余寿命、技术发展过程等进行定量定性的分析。

3 装备试验大数据数据模型—ETBDIS

(4)我们将向“一带一路”沿线发展中国家提供20亿元人民币紧急粮食援助,向南南合作援助基金增资10亿美元,在沿线国家实施100个“幸福家园”、100个“爱心助困”、100个“康复助医”等项目。我们将向有关国际组织提供10亿美元落实一批惠及沿线国家的合作项目。

本文面向装备试验数据建设的根本目标,构建设计了一个装备试验大数据模型ETBDIS(Equipment Test Big Data Intelligent Service)。

图1 装备画像

3.1 ETBDIS模型

ETBDIS模型包括试验数据层、数据预处理层、数据资源体系层、大数据知识挖掘层、装备智能服务层等(如图2所示),各层的主要功能如下。

在中国知网检索国内进行医院经济运行分析的重点文献[5-7, 14, 17-24, 29, 32-48],并对其使用的投入和产出指标进行归纳(见表1)。投入指标中,提及率较高的指标是人力部分为职工总人数、在职职工数与卫生技术人员数;财力部分为业务支出;物力部分为固定资产总额、实际开放床位数与医疗机构床位数。产出指标中,提及率较高的指标在数量部分为出院人次数、门急诊人次数与业务总收入;效率部分为病床使用率与平均住院日。

图2 装备大数据模型ETBDIS

(4)装备健康管理需求:基于装备试验数据建立装备的健康管理模型,基于模型可以预测装备的剩余寿命,根据装备实际状态制订精准的按需的维护保障计划。

结合海军装备试验业务实际,ETBDIS模型的主要特点如下:

数据预处理层。根据数据类型选择相应的数据预处理方法,比如文本类数据,可以进行实体提取、摘要提取、关键词提取等处理,提取出其中的装备、质量、性能、专业技术、事件等实体数据,以便后续进行实体关联、事件关联挖掘分析使用;测试测量数据则需要相应的专用数据处理软件,对数据进行初步的分析和预处理。

数据资源体系层。对原始数据经过相应预处理后,得到经过分类、标注的结构化数据,进而构成可以处理分析利用的装备大数据资源。包括:装备的质量、性能、环境、技术等维度的数据主题,基于这些结构化的数据资源可以通过大数据挖掘、机器学习等方法提取相应的装备知识库。

大数据知识挖掘层。对于装备数据资源中的数据主题,可以通过相应的机器学习方法进行动力学模型建模、分类规则挖掘、模式挖掘、特征提取、多实体关系知识挖掘等处理,从数据中学习建立关于装备的各类知识库。

装备智能服务层。基于数据挖掘构建的装备知识库,可以提供相应的基于装备试验大数据的智能信息服务。如:装备画像,装备健康管理决策,装备试验任务评估,不同环境体系下的装备试验仿真推演态势分析等。

3.2 基于ETBDIS的海军装备试验数据管理特点分析

直接数字化摄影检查技术是依据非晶硒平板检测器来转换X线形成数字图像,不发生光学成分失真以及衰减现象[2],有利于图像信息真实性和图像质量的保证,直接数字化摄影技术的时间减影即为不同时间下两次数字摄影胸片相减的结果,可对病变动态变化进行充分显示[3-4],且能量减影有利于对某些特定组织的显示,可将肋骨遮挡祛除,进而对肺组织病变以及淋巴结钙化进行更好地显示。直接数字化摄影检查具有曝光宽容度大、易于控制、不必洗片、不必重照等优势,可减少辐射,提升工作效率。且存在更高的图像清晰度以及密度分辨率,拥有丰富的图像层次,提升图像质量[5-6]。

(1)模型采用分层的架构,可以通过标准规范接口,实现系统内的不同层间的数据通信;各层内是模块化结构,可以采用微服务的方式,进行灵活的层内模块集成。对于海军装备试验数据而言,首先是通过对试验文书资料、摄录像等图像资料和测量测试等数据资料完成对试验数据的统一管理,测试测量数据根据试验项目的不同可能用到不同的采集分析工具,数据解码方式也不尽相同,为此形成对试验数据的分布采集框架。

(2)服务驱动。面向装备大数据智能信息服务需求。由于海军装备试验数据涉及装备门类多,在数据层基础上通过预处理形成统一的试验数据体系,形成各类型主题库,建立试验数据间的基础关系,进而达到服务于装备画像、装备试验评估、装备健康管理、不同环境体系下装备的试验评估等装备管理,既保障了数据中心的根本建设目标,又较好低保障了数据采集处理的必要性。

(3)开放的架构。装备试验数据涉及多个利益相关方,既包括各组织装备试验的实体部门也包括装备论证、研制、使用方,因此,各参试单位需按照数据标准、接口标准,在平台上实现各自专业领域的数据的存储,管理、服务,采用开放的基础架构,实现按专业的合理分工和统一的平台上实现大数据融合处理分析。

(4)数据深度融合处理。装备试验涉及海量图片、文档等海量非结构化处理的处理。例如在海军装备试验过程中涉及各类试验相关会议文档、试验音视频等,进而建立了质量、性能、保障维护、技术发展等多维度的数据资源,从而达到可以利用机器学习、数据挖掘等知识库构构建过程,提高了数据处理深度的目的。

4 结论

装备试验工作积累了大量的装备相关的资料数据,本文以整合各单位的试验资料数据,建立装备试验数据资源体系,提供装备数据智能信息服务为目标,研究给出了一个装备试验大数据模型。该模型具有分层开放的架构,各参试单位可以按照该模型在统一的平台上,进行试验数据的采集处理分析,实现跨部门多专业数据的融合,利用装备数据资源平台,进行相应的知识构建与智能信息服务,并以海军装备试验数据管理为例分析了模型的主要特点,进一步展示了模型的可用性。在未来研究中,将选几个典型装备进行模型平台的分步构建示范应用。

Th1/Th2细胞因子水平:取上述血清2 ml,立即置于-70 ℃待测。采用酶联免疫法检测干扰素-γ(INF-γ)和白细胞介素-4(IL-4)。

参考文献

[1]齐剑锋,李三群,杨素敏.装备数据工程导论[M].北京:电子工业出版社,2016.

[2]龚昕,周大庆,鞠亮,等.武器装备试验数据工程理论与实践[M].北京:国防工业出版社,2017.

[3]ChrisLoeffler.如何进行出色的数据中心设计[J].电源技术应用,2011(9):72-73.

[4]张新宇.大数据时代的数据架构设计[J].中国金融电脑,2015(8):32-35.

[5]朱玉立,任义廷,高甲子,等.浅谈大数据时代下的数据中心运维管理[J].信息系统工程,2015(11):101-102,106.

[6]杨彬.云计算数据中心资源的节能管理[J].电脑编程技巧与维护,2015(22):61-63.

[7]陈剑.浅谈传统数据中心与模块化数据中心[J].智能建筑与城市信息,2015(11):74-75.

[8]陆江东,戴卓臣,郑奋.基于云平台的虚拟化机房管理系统[J].兵器装备工程学报,2013,34(12):64-65.

[9]钱琼芬,李春林,张小庆,等.云数据中心虚拟资源管理研究综述[J].计算机应用研究,2012,29(7):2411-2415.

[10]张俊卫,王晶,张伟功,等.基于大数据的高能效数据中心服务器研究[J].计算机工程,2017,43(8):74-81.

陈峰,李一,马跃飞
《电子技术应用》 2018年第05期
《电子技术应用》2018年第05期文献

服务严谨可靠 7×14小时在线支持 支持宝特邀商家 不满意退款

本站非杂志社官网,上千家国家级期刊、省级期刊、北大核心、南大核心、专业的职称论文发表网站。
职称论文发表、杂志论文发表、期刊征稿、期刊投稿,论文发表指导正规机构。是您首选最可靠,最快速的期刊论文发表网站。
免责声明:本网站部分资源、信息来源于网络,完全免费共享,仅供学习和研究使用,版权和著作权归原作者所有
如有不愿意被转载的情况,请通知我们删除已转载的信息 粤ICP备2023046998号