基于ID3算法的高校学困生归因分析
0 引言
目前我国对学困生的研究主要针对的是中小学生,很少涉及到高校学生。然而大学生作为一个特殊的社会群体,他们朝气蓬勃、富有理想,是社会的精英、国家的栋梁、民族的希望。对他们培养的不合格会影响学生的一生,也会影响整体的教育质量,甚至影响国家的发展命运,因此对高校学困生的研究也应是不容忽视的重要问题。
1) 学困生概念的厘定
自1963年,美国特殊教育学家Kirk第一个提出“学业不良”LD (Learning Disabilities)的概念之后,该概念受到教育界和心理界的广泛关注。近四十年来的研究,使人们对学习存在障碍或学习存在困难的学生有了较深入的认识。然而目前在“学业不良”的界定上,国际上仍没有统一的标准。在美国,被广泛认可的定义是由美国学习困难联邦委员制定的,他们把学习困难定义为:理解或运用语言、读、写、推理和计算等方面能力的缺乏[1]。这一概念包括知觉缺陷、脑损伤、轻微脑功能失调、发展性失语症等,但不包括视觉、听觉或运动缺陷、智力落后、环境、文化及经济不利等因素造成的“学业不良”。
我国关于“学业不良”的研究起步较晚,80年代以来研究者对于这一群体的相关称谓不尽统一,如“学习障碍”、“学习失能”、“学习困难”、“学业不良”等。根据我国的国情,国内对于学困生的研究主要关注的是学生的学习结果(学习成绩),现今在学术界主要持有“学业不良的绝对性,学业不良的相对性” 这两方面的观点[2]。“学业不良的绝对性”是指那些身心健康,智力正常,但是学习成绩没有达到教学大纲的最低标准者;而“学业不良的相对性”是指身心健康的情况下,学习成绩和其智力的潜在能力的差异。
截止到今天,有关学业困难的讨论和研究仍在继续,但在理论上对“学业不良的相对性”理念得到了基本的认同。由于研究者根据现行的教育体系,将“学业不良”的具体界定概括为三种类型[3]:①学习成绩未达到合格标准者(即学校规定学生达到的最低合格水平);②学生的学习成绩与其潜在的智力能力具有一定的差距者;③因其心理出现了某些问题,身心出现障碍,没有能发挥出自己潜在的能力者。因此,我们对“学业不良”的相对性定义为:当前学业能力还没有发挥出自身学习的潜在能力。存在这种现象的各个群体中包括个体本身学习成绩比较差;还包括学习成绩还行,但可以发挥得更好或是还没发挥出潜能的学习者;另一个可能是存在着智力与成就之间的客观差异,或是学习者自身存在的的主观意向,处于一种感觉自己能力高却没有发挥出自己潜能的状态,而对自己的表现不是很满意[4]。
(2)设属性A具有v个不同值{a1,a2,…,av}。可以用属性A将S划分为子集{s1,s2,…,sv},其中sj上的样本在属性A上具有相同的值aj(j=1,2,…,v)。设Sij是子集Sj中类Ci的样本数,由A划分的子集的熵或信息期望如下所示:
基于上述分析,在本文的研究中,主要以大学生这一群体作为研究对象,采用上海教育科学研究院吴增强教授的定义,即“学习困难的学生是指智力正常,学习效果低下,未达到学校教育规定的基本要求的学生”。因此在本文中我们把学习成绩作为学困生的主要参考标准。
2) 归因理论
2.2.7 3组小鼠最大呼气中期时间比较 对照组和脂多糖组在6、18、36 h后的最大呼气中期时间比较,差异无统计学意义(P>0.05)。18、36 h后,甲强龙组最大呼气中期时间较脂多糖组下降,差异有统计学意义(P<0.05);6 h后,两组最大呼气中期时间比较,差异无统计学意义(P>0.05)。
所谓归因,是指人类的一种普遍需要,生活中的我们每个人都有一套从自身经验所总结出来的行为原因与其行为之间的联系的看法和观念。1958年,海德(Heider)在他的著作《人际关系心理》中,提出了归因理论。归因理论最初只包含一个维度,即控制点(Locus Of Control)。之后,美国心理学家维纳(B. Weiner),对行为结果的归因进行了系统的总结,并把归因定义为三个维度:内部归因和外部归因(Internal Attribution, External Attribution)、稳定性归因和非稳定性归因(Stability Attribution, Unstability Attribution)、可控制归因和不可控制归因(Control Attribution, Uncontrollable Attribution)。
近年来,随着我国高等教育教学质量的提升,教育部门和各高校也加强了相应的研究,其中对于影响大学生成绩因素的相关研究成果也愈加丰富。文献[5]认为大学生的上课出勤率,对期末考试成绩具有明显的正面影响。文献[6]认为大学生的学习观及其内生动机、一般自我效能感、学习效能感与期末考试成绩存在明显的正相关关系,与其外生动机多呈现为负相关关系。文献[7]认为学生个体城乡间的教育质量差异较为明显。传统的家庭因素依然对成绩型教育有着较大的影响,非传统家庭因素对学生学业成绩的影响也比较大。文献[8]发现积极情感因素中的师生关系、自尊心、学习兴趣等因素和消极情感因素中害怕任务太难的焦虑、害怕犯错被批评的焦虑以及担心犯错而不敢参加语言活动的抑制心理,均对学生成绩有着明显的影响。然而,这些研究多从单一方面出发,缺乏整体考虑和分析,为此本文引入了多个变量,就个人主客观因素与其学习成绩之间的关系进行了探讨。本文主要从“性别”、“是否恋爱”、“是否参加社团和学生会”、“上课玩手机的时间”、“作业完成情况”和 “课堂学习效果”6个方面,探讨它们与学习成绩之间的关系。
收集这些数据的目的在于找出我们定义的学困生,并分析导致学生学业困难的原因。此过程既可以人工手动实现,也可以编程自动实现。若筛选的数据量相对较小,则手动筛选相对简单;若筛选的数据量较大,则借助编程的方式来实现筛选。由于我们采集到的有效调查问卷只有340份,数据量并不大,因此我们并不需要用编程实现筛选。
1 数据来源及学困生的筛选
本文的研究对象是我校信息科学与工程学院某专业的四届368名毕业生。因为研究对象均为高校学生,所以他们均接受过入学体检,这就保证了他们不存在智力缺陷的问题。首先我们从学校教务处那里获得了他们每个学期期末考试成绩,并将其作为实验数据。然后我们通过网络,在聊天群里让他们填写了调查问卷(我们向其保证调查问卷仅用于本次研究,不会向外泄露他们的任何信息),为了保证问卷的真实可靠性,并与我们获得的数据进行匹配,调查问卷采用记名的方式。对于影响学生成绩的因素,我们选了如表1所示的几个有代表性的问题进行了调查。最后,通过仔细的核对,得到了340份有效的调查问卷。
表1 高校学习情况调查表
是否恋爱是否参加社团上课玩手机情况作业完成情况课堂学习效果姓名性别班级籍贯
(注:是否恋爱与是否参加社团这两项的回答为填写是或否;上课玩手机时间填5分钟、5-15分钟或>15分钟;作业完成情况填全部完成、基本完成或部分完成;课堂学习效果填很好、一般或较差。)
本文首先对学困生的概念做一个概述,详细介绍国内外有关学困生的研究现状及其发展背景;其次搜集了研究数据,从中筛选出了学困生;最后对学困生进行归因分析,并采用ID3决策树算法,对影响学困生的因素进行了深度分析。得出学生课堂学习效果是影响学困生的主要因素。
通过对本地某学校初高中价值观与自我价值观关系之间的相关研究,我们大致可以了解到自我观除了与个人取向之间存在的既定人际价值感关系外,与其他自我价值感基本上均存在负相关关系,并无明显的正相关关系。换句话说,青少年作为自我观发展的关键个体,如果自身价值观感越高,青少年个体将会愈加重视自我的全面发展,比较侧重于实现个人的自我价值。
具体步骤如下:首先将从教务处得到的研究对象的期末考试成绩导入Excel表中;然后计算他们的平均成绩;最后利用Excel自带的筛选功能,按期末成绩平均分“小于60”、“大于等于60且小于75”、“大于等于75且小于90”和“大于等于90”的条件筛选,并将其定义为“优良中差”四类学生。我们将期末成绩平均分小于60的学生定义为学困生。接下来对这些学困生进行归因分析。
2 学困生成绩的归因分析
2.1 决策树
决策树是以实例学习为基础的一种算法。它需在一组无顺序、无规律的数据中,推理并判断出决策树表现形式的分类规则。通常,我们所提到的决策树分为两种:一种是对分类型输出变量实现分类的分类决策树,简称分类树;另一种是对数值型输出变量实现预测的回归决策树,简称为回归树。两者分类预测所实现形成的决策树是一种类似于流程图的结构。它将分类和预测的结果都体现在叶节点上[9,10],如图1所示。
图1 决策树算法流程图
决策树算法主要是用新变量以图形或文本的表现形式,来描述或预测数据的一种算法。它采用自顶向下的递归方法,对输入样本训练集进行分类学习。决策树的主要算法包括:ID3算法、C4.5算法和CART算法。由于ID3算法是决策树算法中最具有影响力的算法,因此本文采用ID3算法进行数据挖掘。
1) ID3决策树算法
ID3算法是一种贪心算法,它采用自上而下、分而治之的递归方式构造一棵决策树。ID3算法的核心内容是:在决策树各级节点上用信息增益(Information Gain)作为属性的选择标准来选择属性,使得我们在每一个非叶子节点都能够获取被测试记录的最大类别信息。
决策树的分枝准则,是构建一个决策树所面对的核心问题[11,12]。ID3决策树以信息增益率为标准来确定最佳分组变量和分割点。其具体方法是:检测所有的属性,选择信息增益最大的属性产生决策树节点,并由该属性的不同取值建立分支,然后再对各分支的子集递归调用该方法建立决策树节点的分支,直到所有子集仅包含同一类别的数据为止。最后得到一棵决策树,它可以用来对新的样本进行分类。
I(s1,s2,s3.s4)=I(71,94,87,88)
(1)
(5)N的测试属性test_attribute=Y_attribute list中具有最高信息增益的属性;
老福想到这里,翻身下床找了一只笔准备写辞职报告。这时候听见了敲门声,他母亲推门进来了:“还不睡呀?深更半夜折腾什么?”
(2)
熵值越小说明子集划分的纯度越高。
(3)对于给定的子集s,其信息期望为
(3)
上式中Pij=sij/s,是Sj中样本属于Ci的概率。
(4)在属性A上分支将获得的信息增益是:
Gain(A)=I(s1,s2,…,sm)-E(A)
(4)
2) ID3算法的伪代码描述
ID3formtree(Y,Y_attribute list)如下:
(1)创建根节点N;
(2)If Y都属于同一个类M then返回N作为叶节点,以类M标记;
(3)If Y_attributelist为空,则返回N作为叶节点,标记为Y中出现最多的类;
(4)For each Y_attribute list中的属性,计算信息增益Gains;
其中Pi=Si/S是任意样本属于Ci的概率。
(6)For each test_attribute的取值{
由节点N长出一个新叶节点;
If 新叶节点对应的样本子集Y’为空
则不再分裂此叶节点,将其标记为Y中出现最多的类;
else
在该叶节点上执行ID3formtree(Y',Y_attributelist),
对它继续分裂}.
其中,设Y代表当前样本集,用Y_attribute list表示当前候选属性集,侯选属性集中的所有属性都为离散型(连续型必需事先经过预处理转化为离散型)。
决策树的生长过程将反复上述过程,并不断对样本进行分组,直到整个树各分支的继续分组不再有意义为止,一棵完整的决策树就形成了。该过程是一种“贪心”搜索过程[13]。
2.2 学习成绩的归因分析模型
本节以学校教务处获得的数据和调查问卷获得的数据作为训练样本集,采用ID3算法获得相应的决策树,通过有效数据处理,生成预测模型,对学困生成绩的影响因素进行挖掘分析。通过虑样本数量及其代表因素的情况,对课堂学习效果和作业完成情况等属性进行分析,研究这些属性与学困生成绩之间存在的内在联系。
1) 数据预处理
若某一等级最低水平者通过某试题的几率是,而此试题的满分是,计算等级得分率的公式就是:。在计算公式中,n代表的就是试题的数量,而等级标准就是得分率和总分数的乘积。
数据预处理是数据挖掘中的一个重要步骤。因为现在的数据可能是脏数据并且有些数据缺失,或一些数据的格式不适用于决策树算法,因此我们需要对这些原始数据进行预处理。即对脏数据进行数据清除,对缺失的进行填补,对冗余的数据进行集成和删选以及对不符合格式的数据进行格式转换。
本文的研究对象在统计的数据中籍贯是山东的学生占比为90%以上,因此这个属性不具有辨识性,为了提高数据挖掘的效率,我们把这个属性删除。在调查时出现的缺失值,我们进行了补充但是带有部分主观性,因此我们采用随机插补的方法来消除补充缺失值的主观性。
用于挖掘学困生的属性较多,而我们所获得数据有限,为了便于决策树模型的建立,我们选择了其中与成绩相关较大的“性别”、“是否恋爱”、“是否参加社团和学生会”、“上课玩手机的时间”、“作业完成情况”和 “课堂学习效果”这几个属性,作为判别学困生的依据,生成新的学生成绩基本数据表。如表2所示,经过数据预处理后,有效的学生记录共有340条。为了后面可以更好地对决策树模型进行评估预测,在这里预留了三分之一的记录作为测试数据,三分之二的记录作为建决策树模型所需的训练集,共220条记录。
2) 决策树模型的建立
将从教务处获得的学生期末成绩划分为四个等级,即优、良、中、差。期末成绩平均分大于90的为优,大于75小于等于90的为良,大于60小于等于75的为中,小于60的为差(即本文中研究的学困生)。具体分类方法我们采用的系统聚类。利用这些整理好的数据,以确定学生平均得分是否优秀为
表2 学生信息统计表
研究对象,建立决策树模型,挖掘分析影响学困生成绩的因素。具体方法如下:
SPSS19.0统计,计量资料给予的检验方式是t检验,计数资料则实施χ2检验,P<0.05显示差异显著。
(1)计算每个属性的信息增益率。
(2)选择信息增益比率最大的属性作为根结点,并按它的值划分数据集合,如果该属性只有一个值则停止划分。
(3)对划分的每个子数据集递归执行(1)~(2)。
接下来介绍具体的实现过程。
设C1 为优,C2为良,C3为中,C4为差。样本总数为340,其中C1类包含71个样本,C2类包含94个样本,C3 类包含87个样本,C4类包含88个样本。为了计算每个属性的信息增益,首先利用式(1)计算出所有的信息量。
(1)通过计算每个属性的信息增益,比较它们的大小,从而获得具有最大信息增益的属性。设S是数据样本的集合,假设类标号属性具有m个不同值,并定义m个不同类Ci(i=1,2,…,m)。设Si是类Ci中的样本数。对一个给定的样本分类,所需的期望信息如下:
半专业劳务派遣森林消防扑火队是指经过森林防火技能培训,有基本的防护和通讯装备,能够熟练使用扑火机具,以退伍军人、营林生产工人、附近村民为主,组建一支规模在30-40人的半专业国有林场应急森林消防队。队员条件:要求男性;年龄18-55周岁,身体健康,体力好;掌握科学扑火和火场安全逃生基本知识。
接下来计算每个属性(即每个待测因素)的信息熵。
(1)性别(gender)的信息熵
根据性别在优、良、中、差四个类别的分布,由式(3)可以计算出在每个分布中对应的信息熵。
Gain(homework)=0.197,
All the relevant examples were adapted from Bo Bing’s An Advance English Grammar(2001),Zhang Zhenbang’s A New English Grammar Course Book(2003),and the pattern of the presentation of EMCintroduced thefifth edition of the Longman Dictionary of Contemporary English(LDOCE).
I(s11,s21,s31.s41)=I(33,37,43,49)
对于gender=“女”:S12 =38,S22 =57,S32 =44,S42=54
I(s12,s22,s32.s42)=I(38,57,44,54)
由式(2)可计算出,若根据属性gender对样本集合进行划分,所需要的信息熵为
由此获得利用属性gender对样本集合进行划分,所获得的信息增益为
Gain(gender)=I(s1,s2,s3,s4)-E(gender)=1.988-1.005=-0.017
很快选好一款跑步鞋,售货员小伙子说,如果扫码加品牌微信号,鞋子即可五折,如果不扫,则是七折。扫个码便宜两成,我想这划得来。扫完码之后,手机屏幕出现注册画面,要求填写姓名、性别、年龄、手机号;因为扫了码,手机号码已经自动出现在注册栏里。这一下引起了我的警觉。姓名、年龄、性别、手机号已是我的基本身份信息,依据这些信息甚至可以在网上对我进行定位跟踪。
以此类推,由表2可以求得“是否恋爱(love)”、“是否参加社团或学生会(activity)”、“上课玩手机的时间(phone)”、“作业完成情况(homework)”和“课堂学习效果(classroom learning)”这些属性的信息增益分别为
综上所述,供给侧维度下的高职院校旅游管理专业就业教育改革对于学生的发展和社会的稳定具有重要的意义,高职院校、政府部门要对其给予足够的重视,从旅游管理专业就业指导供给侧方面进行有效优化,从而为毕业生的有效优质就业提供广泛契机,也为国家的经济文化建设创造有利条件。
在互动过程中,教师要善于鼓励学生,使他们的注意力得以维持。学生会随着活动的深入,对所学内容的兴趣有所下降,教师要适时鼓舞,为学生注入“兴奋剂”,使学生对互动学习的兴趣充满热情。
Gain(love)=0.166,
Gain(activity)=-0.043,
Gain(phone)=0.378,
对于gender=“男”:S11 =33 ,S21 =37 ,S31 =43,S41=49
没想到他笑眯眯地从兜里掏出个口琴,来了段口琴独奏。嘿,看不出这呆子还真有两下子。嗯?啥时学的?我咋不知道?只听说站长会,莫非?
中国公共图书馆服务品牌发展的五大逻辑:从一般需求到更高需要的读者逻辑;从数量增长到质量提升的转型逻辑;从独体建设到共建共享的发展逻辑;从传统品牌到网络品牌的创新逻辑;从城域服务到面向世界的时代逻辑。
Gain(classroom learning)=0.398。
本刊联系地址:541006广西桂林市雁山区雁山镇良丰路26 号桂林旅游学院旅正楼313 室《旅游论坛》编辑部;电话:0773-3691702; E-mail:tourismforum@sina.com。
通过上面的计算可知,“课堂学习效果(classroom learning)”的信息增益最大,所以选择它作为测试属性,用于产生当前的分支节点,如图2所示。
3) 决策树的分类规则
决策树和推理规则的联系极为密切。推理规则就是决策树的文字形式,即逻辑比较。推理规则表达的是,输入变量取值及不同输入变量之间逻辑与或逻辑或关系与输出变量取值的内在联系,一般表示形式为“如果<条件>则<结论>”。
每个叶节点都可以产生一条规则,其中,<条件>是从根节点到叶节点全部节点的条件组合,<结论>是叶节点上样本输出变量的类别。同时,由此产生的多个推理规则之间是相互独立,绝不干扰的,其排列的前后顺序对新数据的分类预测结果不会产生影响。
在上述决策树中,从根节点到每个叶节点都代表了一种分类。从图2的决策树中得出的推理规则如下:
Rules for 差 -contains 1 rule(s)
Rule 1 for 差(9; 0.889)
If 课堂学习效果 in [“C”]
and 作业完成情况 in [“B/C”]
图2 影响学生成绩因素的决策树
and 是否恋爱 = A
Then 差
Rules for 良 -contains 3 rule(s)
Rule 1 for 良 (2; 1.0)
If 课堂学习效果 in[“A”]
and 上课玩手机时间 in [“A”]
and 作业完成情况= B或C
Then 良
Rule 2 for 良 (8; 1.0)
If 课堂学习效果 in[“A”]
and 上课玩手机时间 in[“B”“C”]
Then 良
Rule 3 for良(3;1.0)
If 课堂学习效果 in [“B”]
and 是否恋爱 = B
Then 良
Rules for 优 -contains 1 rule(s)
Rule 1 for 优(5;0.8)
If 课堂学习效果 in[“A”]
and 上课玩手机时间 in[“A”]
and 作业完成情况 = A
Then 优
Rules for 中 -contains 3 rule(s)
Rule 1 for中(19; 0.895)
If 课堂学习效果 in[“B”]
and 是否恋爱 =A
Then 中
Rule 2 for 中 (9; 1.0)
If 课堂学习效果 in[“C”]
and 作业完成情况 in[“A”]
Then 中
Rule 3 for 中 (6; 0.833)
If 课堂学习效果 in [“C”]
and 作业完成情况 in「“B”“C”]
and 是否恋爱 = B
Then 中
Default:中
3 结果分析
由图3可知,决策树以学生“课堂学习效果”为第一个最佳分组变量,说明学生课堂学习效果信息增益率最大,是决定学生平均成绩的关键因素。在课堂学习效果节点下的最佳分组变量为 “上课玩手机时间”,以此类推分别是“作业完成情况”和“学生是否恋爱”。而“学生是否参加社团”以及“性别”这两个属性,对学困生影响的信息增益率较小,都没有进入决策树,说明这两个属性不是导致学生学业困难的主要因素。
图3 决策树结果分析图
从决策树分析图中可以直观地看出,“课堂学习效果”是影响学生平均得分的关键因素,因此也是导致学困生产生的最主要原因。对于学困生来说,一定要注意上课时集中精力,认真听教师讲课,跟随教师思路积极思考,认真对待每节课的重点难点。次要因素是“上课玩手机时间”,说明学生在上课时一定要集中注意力,不能分心做其他的事情。最近几年各大高校都在落实手机入袋的举措,本文的结论为这一举措的实施的必要性提供了有力的依据。“作业完成情况”和“是否恋爱”这两个属性对学困生的影响不是很大。在研究中我们还发现,无论学生平均成绩是否优异,男女生占比大致相同,而且都有部分学生在参加社团或学生会,这说明“性别”和是“是否参加社团或学生会”对学习成绩的影响也并不大。
4 结语
本文利用从学校教务处获得的数据和调查问卷获得的数据作为训练样本集,采用ID3算法获得相应的决策树,对我校大学生的一些学习行为进行分类决策,通过有效数据处理,生成预测模型,对影响学困生成绩的因素进行挖掘分析。最后我们发现“课堂学习效果”是导致学困生的主要因素,“上课玩手机时间”是影响学困生的次要因素。针对这两个因素,我们建议采取以下措施:
(1)明确教学目标,突出重难点。为了让学生明确本节课的重点,教师在上课开始时,把本节要点提纲列出来,以便引起学生的重视。
(2)激发学生兴趣,营造一个更加自由活跃的课堂环境。激发学生的自主性让学生真正能参与到课堂教学中来,而不是一味的教师讲学生听。可以尝试对换角色,让学生自己成为授课者,从而提高学习效率。
(3)现在很多高校都在实施手机课上入袋的规定,本文的研究结果更为这一举措实施的必要性提供了依据。手机入袋可以使学生更好地集中精力听课,有效提高学习效率。
本研究存在以下不足:
(1)数据量不足。研究对象只是某专业的部分学生,而且通过问卷调查得到的信息的数据部分可能缺乏代表性,不能完全真实地反映众多学生的实际情况。
(2)决策树生成的分类规则会与实际情况存在一定的误差。由于本文在数据收集的属性选择上具有主观性,还存在许多影响学生的因素并没有考虑,对学生调查问卷的内容也不全面,因此存在挖掘的数据信息有可能不是最佳的数据集。
针对这两点不足,我们将在以后的研究中丰富研究数据,使数据更具客观性,使研究结果更具权威性。
[1] Silver L B.Learning Disabilities:Introduction [J]. Acad Child Adolescent Psychistry. 1989,28(3):309-313.
[2] 曹贞.大学生学业不良的因素分析及对策[J].长春:职业技术教育,2006,27(11):5-7.
[3] 卢婧.关于学业不良问题的研究综述[J].长沙:文学界(理论版),2011(03):273-274.
[4] 沈烈敏.学业不良的相对性涵义及测定的实证研究[J].上海:心理科学,2004(01):88-91.
[5] J.M.伍德里奇.计量经济学导论[M].北京:中国人民大学出版社,2007:114-118.
[6] 王学臣,周琰.大学生的学习观及其与学习动机、自我效能感的关系[J].上海:心理科学,2008(03):732-735.
[7] 涂咏梅,徐彦坤.家庭因素对学生成绩影响的实证分析[J].武汉:统计与决策,2013(02):116-119.
[8] 凃朝莲.情感因素特征状况及其对学习成绩的影响--基于英语专业大学生的实证研究[J].西安:西安外国语大学学报,2013,21(03):62-65.
[9] 元昌安,邓松,李文敬,刘海涛.数据挖掘原理与SPSS Clementine应用宝典[M].北京:电子工业出版社,2009.
[10] 王亮红,宋代清,徐娜.聚类分析在学生成绩分析中的应用[J].吉林:东北电力大学学报(社会科学版),2009,29(04):35-38.
[11] 毛国君等.数据挖掘原理与算法[M].北京:清华大学出版社,2005.
[12] Jesse M.R., College performance predictions and the SAT[J]. Journal of Econometrics, 2004(121):297-317.
[13] Tan P.Steinbach M, Kumar V. 数据挖掘导论[M].范明,范宏建,译.北京:人民邮电出版社,2006.
上一篇:微波传输线双倒L型等效电路的分析
下一篇:电子电路分析设计中的工程思维