更全的杂志信息网

数据挖掘技术在高校招生数据管理中的应用研究

更新时间:2016-07-05

0

高校的招生工作是高校一项重要工作,是进一步进行人才培养的基础。近年来,高校招生规模逐年扩大,招生方面的数据量在成倍增长,如何有效管理和利用这些数据成为当今高校急需解决的问题。随着信息技术飞速发展,物联网、大数据技术得到突飞猛进发展,为高校招生工作的数据管理带来了新机遇和挑战。为了能够在招生工作中提高效率,很多高校已经开始展开积极探索,利用信息技术解决招生工作的一些问题,但是大部分高校在自己的招生数据管理系统中仅仅是进行简单的事务管理,在招生决策上也是仅仅处于靠经验的层面上,如何利用数据挖掘技术来辅助高校招生工作是高校面临的新课题。将数据挖掘技术应用到招生工作中,挖掘数据中的潜在信息,为高校管理、决策提供有力支持,提高高校招生工作的效率和决策水平[1]

1 数据挖掘技术概述

数据挖掘(Data Mining,简称DM)技术是对海量数据处理,从有噪声和随机的数据中提取出潜在有价值的信息和知识。数据挖掘技术是知识发现的基础,由多学科融合的交叉学科,包括数据库、统计学、人工智能等学科。随着数据种类增加,对存储和管理数据的技术要求也不断提高。数据库技术和硬件技术飞速发展,因此保存数据的成本不断下降。海量数据使人们对数据处理技术的要求越来越高,数据挖掘技术的出现正好能够迎合人们的数据处理要求[2]

第二,各项规划要合理衔接。始终牢记并遵循园区开发宗旨——“整体性规划,阶段性开发”+“先规划后建设”+“基础设施、地下网络和公共设施建设优先”。园区在一开始就已经纳入苏州新城的发展规划中,如东部为中央商务区(位于园区中心)、中部为居民区、外围为工业区,该设计为产城融合打下了坚实的基础。

在数据挖掘的过程中主要经历四个步骤,分别是挖掘问题定义、准备数据、数据挖掘和模式评价以及解释。首先在数据挖掘之前进行数据挖掘问题定义,对目标问题进行明确定义,即决定到底要解决什么问题。数据准备步骤包括数据集成、选择和预处理。接下来进入数据挖掘步骤,在这一步骤中根据问题选择合适的数据挖掘算法。第四步骤的模式评价以及解释是对数据挖掘的结果进行评估和解释,将结果表示出来,方便理解,进一步进行解释和评价。最后针对不足进行分析,优化前面过程,直到满足用户需求[3]。数据挖掘流程如图1所示。

数据挖掘技术在国外起步较早,广泛应用在各领域,包括天文、空间等。我国在数据挖掘方面的研究最初主要在高等院校和科研院所,国家对这方面的研究也提供了大量的资金支持,包括国家自然科学基金项目以及省基金项目。目前数据挖掘技术在各行各业得到广泛关注和应用,数据挖掘技术可以分析所有有规则的数据库。

数据挖掘开始要进行数据准备,高校招生数据的准备包括数据选择和预处理。招生的数据量一般很大,涉及范围广,而且有一些数据还与数据挖掘的定义问题无关,不将这些数据筛除会给数据挖掘带来麻烦,因此首先要进行数据选择。将影响数据挖掘结果的数据去除。数据预处理是将经过初步筛选的数据进行清理、转换、集成、离散和规约处理,经过这个过程之后的数据作为数据挖掘的对象,因此,此步骤的质量是影响数据挖掘效果的关键。

1 数据挖掘的流程

2 数据挖掘技术的功能

数据挖掘技术的功能包括关联分析、分类与预测、聚类和偏差分析[4]。数据挖掘技术功能结构如图2所示。(1)关联包括单关联、时序关联和因果关联。关联分析功能是从海量数据中分析关联关系。(2)分类与预测是对数据进行探究和摸索,进而进行分类。分类受分类函数和模型影响,可以将数据库中的数据传送到指定数据库中,构成分类器,应用模型样本数据集完成传输任务。预测是利用初步模型,将新的数据作为输入项,得到数据倾向值,获取属性值。(3)聚类是根据数据的差异性以及不同特点,将数据进行归纳分类,使得同一种类的数据差异尽可能小,同时拉大不同种类数据之间的差异性。分类是提前要给数据定义模型样本和类别,聚类是不需要提前预定数据类别和模型样本,是根据事务的相似性总结为同类数据。(4)偏差分析是对个体的差异性进行描述,描述个体与其他事务差别,找到观测结果和参照值间的差别。其中偏差包括不符合事实的特例、反常事务等[5]

2 数据挖掘技术功能结构

3 高校招生数据管理问题描述

招生数据准备是将高校的招生系统、教务系统以及学生管理系统等中的数据根据实际需要进行选择和集成,减少数据挖掘的数据量。选择发现型数据挖掘方法,提出预先假设,选择适合的算法,在招生数据挖掘中可以选择聚类算法、频繁项集关联规则算法,根据决策支持技术对挖掘结果进行处理。数据准备工作主中聚集是对数据对象合并,抽样是将有意义的数据进行集中抽取,维归约是删除数据中不相关的特征,特征子集的选择是去除了不相关的特征,特征创建是创建新的数据特征,最后通过连续属性离散化将数据转换为有利于数据挖掘算法的属性。

4 数据挖掘技术在高校招生数据管理中的应用

4.1 数据准备

“艺术作为文化特殊体系致使对艺术的研究最终会回到对文化的研究上来,一个文化或者说某一个群体的文化是由各种文化要素所构成的它是各个要素构成的统一体或整合系统,而不是若干文化要素的偶然堆积。”[1]在独特的自然环境及丰富多彩的民族文化,在贵州版画发展进程中体现了其多样化的艺术样式。下面就从几位艺术家的案列进行分析,并就他们的作品所显示的“多彩贵州”地文化特征以及在现当代语境下所产生的艺术价值进行分析。

随着网络技术发展,在高校招生工作中,基本上实现了网络进行的模式,此模式提高了招生工作的效率,降低了人力和物力成本,但却存在新问题。包括数据格式不统一,为后续录取、总结以及与学校其他系统连接等带来一些麻烦。招生数据要求准确无误,这关系到考生切身利益,必须严肃对待招生数据。我国高校招生主要是通过高考,通过教育部招生录取系统进行,此系统导出的数据详细、规范,但功能单一,只有网上录取,不能很好利用系统的数据,数据只是在校内进行传输、转发,对数据利用上也仅仅是查询、统计等,不能充分利用这些数据进行有价值数据挖掘,数据挖掘技术正好可以满足高校招生工作的数据处理需要,实现自动化、现代化招生工作。

逻辑模型建立是将主题和维度对应到数据库表中,高效招生的数据挖掘采用星形模型,此模型方便包图的维度、指标及粒度对应。逻辑模型如图4所示。

4.2 数据仓库建模

在高校招生数据仓库的建立中主要包括概念模型、逻辑模型和物流模型建立。概念模型采用信息包图方法,分析招生数据的多维性,根据招生数据挖掘的主题确定数据维度、指标和粒度,设计维度表、事实表和概念表。概念模型如图3所示。

招生数据仓库建立主要通过数据驱动的方法,从招生系统、教务系统和学生管理系统中获得的数据存储到数据仓库中,根据数据决策的目标,实现高校招生数据有效和科学的决策分析。数据挖掘技术的应用选择SQL Server数据库,分别建立概念模型、逻辑模型和物理模型三种模式构建数据仓库。数据挖掘建模是指采用数据挖掘技术和数据挖掘工具建立实际问题模型的过程。在高校招生数据挖掘建模中,通过建模提供优化的招生决策。

3 概念模型

讨论 AP是临床常见急腹症,可导致全身炎症反应综合征和多器官功能衰竭。AP病情及预后与机体炎症反应密切相关,IL-1β、IL-6、TNF-α等炎性递质在胰腺炎性反应中具有关键作用,抑制炎性递质的合成可减轻AP胰腺病理损伤。研究表明[9-10],AP炎症递质的合成释放受NLRP3炎症小体的调控,抑制其激活可减轻AP的炎症程度。作为炎症因子的启动子,NLRP3炎症小体可活化细胞因子前体,释放炎症递质和细胞因子,激发和调节AP炎症反应,与AP的发生、发展存在密切关系[11-12]。

以学生创业进行实景模拟,调动学生的积极性和兴趣,可更多地进行翻转课堂,为学生提供更多的发挥主观能动性的机会。

4 逻辑模型

物理模型是确定数据的存储结构和位置。数据仓库的物理模型包括图4中的各个维表,各表中的字段按照星形模型设计,依据概念表和维表创建对应的数据库,完成招生数据挖掘的数据仓库设计。

4.3 关联规则算法的应用

由于目前高校专业一般设置比较多,加之招生的类型很多,使得招生的数据管理比较繁杂,在招生数据分析管理中将数据挖掘技术应用在其中能够使考生的志愿填报、专业了解方面起到积极作用,同时能够增加学生的报到率。根据招生数据管理需要,以考生填报志愿指导为例,将关联规则算法应用其中。此算法能够从大量的招生数据中找出数据之间联系。在算法中建立“填报专业”视图,包括考生ID、专业名称和专业代码。将此视图作为数据源,考生ID作为关键字,专业名称为预测列。将输入的数据80%作为训练集,剩下的作为测试集,经过训练和处理得出依赖关系其中的一部分,如图5所示。从图5中可以看出,专业之间的关联性强弱不一。在“规则”的查看中,最小概率设为0.60,最低重要性为0.3,得到对应的关系规则有623条,接下来可以通过DMX规则导出,将招生数据挖掘的结果用于考生志愿的填报指导。

5 关联规则依赖关系网络部分图

5

笔者研究了数据挖掘技术在高校招生数据管理中的应用,介绍了数据挖掘技术以及数据挖掘技术的功能,对高校招生数据管理方面的问题进行了说明,结合高校招生数据管理需要,将数据挖掘技术应用在高校招生数据管理中,对数据挖掘中的数据准备、数据仓库的建模和算法应用进行了分析。数据仓库建模包括概念模型、逻辑模型和物流模型建立。在算法应用方面,以考生填报志愿指导为例,将关联规则算法应用其中,此算法能够从大量的招生数据中找出数据之间的联系。数据挖掘方法可以挖掘出数据中潜在的信息,为高校招生数据管理及决策提供有力支持,提高高校招生工作的效率和决策水平。

[参考文献]

[1] 郭载勋.数据仓库与数据挖掘技术在高校招生决策中的应用研究[D].北京:北京工业大学,2014.

[2] 杜江毅,边馥苓.面向大数据的空间数据挖掘综述[J].地理空间信息,2017,15(1):8-12.

[3] 任福栋,孙菲,任福捷.基于距离和的数据挖掘技术在中考成绩处理中的应用[J].齐齐哈尔大学学报(自然科学版),2010,26(4):35-39.

[4] 古亮, 刘培艳.数据挖掘技术在招生数据管理中的作用[J].电脑知识与技术,2016,12(14):1-2.

[5] 朱丽丽.数据挖掘在高校招生中的应用研究[J].计算机与现代化,2012(8):190-194.

阿布力米提·卡依木
《大庆师范学院学报》2018年第03期文献

服务严谨可靠 7×14小时在线支持 支持宝特邀商家 不满意退款

本站非杂志社官网,上千家国家级期刊、省级期刊、北大核心、南大核心、专业的职称论文发表网站。
职称论文发表、杂志论文发表、期刊征稿、期刊投稿,论文发表指导正规机构。是您首选最可靠,最快速的期刊论文发表网站。
免责声明:本网站部分资源、信息来源于网络,完全免费共享,仅供学习和研究使用,版权和著作权归原作者所有
如有不愿意被转载的情况,请通知我们删除已转载的信息 粤ICP备2023046998号