更全的杂志信息网

基于粗糙集理论的试卷质量分析研究

更新时间:2016-07-05

随着我国高等教育事业的蓬勃发展和高等教育制度改革,高校教育评估已越来越受到重视。考试作为教学过程中的一个重要环节,也是教学效果和学习能力最有效的检验手段。在当前提倡素质教育的社会背景下,要进行科学合理的考试,试卷的质量是至关重要的,因此对试卷的质量进行分析与评价是科学考试的必要环节,缺少了这一环节,就等于没有完成考试。这样说来,与分数的获得相比,考试结束后的试卷分析才是真正收获的手段,考试的结果既可以反映学生的学习态度,也可以反映教师的治学态度和教学水平及学校的教学管理水平。通过试卷分析,可以了解学生掌握知识的程度,以便调整教学内容和教学方法,改进教与学的关系,同时也可以为今后的教学提供改进措施。

试卷分析是教育测量学的主要内容,我们要想判断一份试卷有没有达到预期的效果,就需要对试卷进行科学地分析与评价。从一次考试中所能获取的信息,绝不仅仅是一堆分数;而信息的反馈,也不只是把分数通知给考生那么简单。通过对试卷中试题的有关信息进行分析,不仅可以检查试卷命题是否符合课程教学大纲,同时也可以检查课程教学中教与学的效果,并对试卷命题质量做出科学的评价,为进一步改进教学、提高教学质量提供重要的反馈信息,从而更好地指导教学。事实上,对试卷进行评价是一个多因素、多指标的复杂过程,传统的试卷分析方法多数是基于经典测量理论中的信度、效度、区分度、难度、标准差、平均分等这些数理统计指标对试卷质量进行分析。此外,刘美宏[1]将教育测量学与模糊数学知识相结合,利用模糊数学的知识对试卷进行综合性模糊评判,给出了试卷综合评价的方法。这些方法都无法评价试卷中是否存在冗余试题,也无法判断试题的重要性程度。本文给出了一种基于粗糙集理论的试卷质量分析方法,利用属性约简挖掘出试卷中的冗余信息,并计算出试卷中每道试题的重要度,得出对试卷综合、客观的评价。

1 传统的试卷分析方法

传统的试卷分析一般都是应用教育测量学原理和数理统计理论对试卷进行定量分析、定性分析。

定量分析是指通过对试卷和考试成绩的数理统计分析,得到关于考试的成绩分布及试卷的平均分、标准差、试题难度、区分度、考试的信度、效度等数据特征,用以说明试卷命题质量、教师教学和学生学习效果。一份质量较高的试卷,理想的考试成绩分布曲线图应该是呈正态分布,课程考试作为一种目标参照性考试,学生成绩呈正态或近似正态分布,都是正常、合理的。平均分反映了卷面试题的整体水平,平均分较高说明试卷难度较小,平均分较低说明试卷难度较大。标准差反映考试成绩的波动大小,说明考生群体成绩的个体差异程度,标准差理想控制范围在7~10。难度是指试题的难易程度,它是衡量试题质量的一个重要指标参数,一般认为试卷难度指数P在0.3~0.7之间难度适中,低于0.3试题偏难,高于0.7试题偏易,0.5左右最好。区分度是指整份试卷或某道试题对不同水平的考生加以区分的能力,区分度高的试题,能将不同水平的考生区分开来。一般认为区分度D<0.2时试题质量非常差,必须淘汰或修改;0.2≤D<0.3时试题质量一般;0.3≤D<0.4时试题质量较高;D≥0.4时为优秀试题。信度是指试卷的稳定性和可靠性程度,教育测量学理论认为,对于高校课程合格性考试,信度指数大于0.9时,试卷可靠性较好,信度指数在0.7以下的试卷不宜采用。效度是考试有效性或准确性的质量指标,反映了考试内容与教学大纲或考试大纲的吻合程度[2~3]

定性分析是指在定量分析数据结果的基础上,结合考试的具体情况对试卷做出恰当的评价,同时也可从分析中获得考试所提供的教学反馈信息,了解教师和学生在教、学中存在的问题,促进教学过程的反思,从而为改进今后的教学工作提供依据。

2 粗糙集理论的基本知识

粗糙集理论是波兰数学家Z.Pawlak于1982年提出的一种处理模糊信息及不精确、不完整知识的新的数据分析理论,它的主要思想是在对所得数据和知识进行分析、分类的基础上推导出数据之间的内在关系与提取规则,并在保持规则分类能力不变的前提下,通过知识约简删除不相关或不重要的知识,得出问题的决策结果[4]。粗糙集理论可以评价属性的重要性程度,并且不需要提供所需处理问题的数据集合之外的任何先验信息,因此应用粗糙集理论对问题的不确定性进行描述或处理相对客观,不仅能够挖掘出隐藏在数据中的事实而不需关心数据的任何附加信息,还可以克服传统不确定处理方法的不足,为处理不精确、不完全数据的决策问题提供了更接近人类认识的数学工具[5]

经典集合论是粗糙集理论的基础,为本文讨论需要,下面介绍几个粗糙集理论的相关概念。

“雪龙号”水上部分有七层,水下部分有两层,它的船体采用高等级的钢板制作,即使外界温度低到零下40摄氏度,船体也不会变形。船上的各类设施十分齐全。它装配有先进的导航、定位、自动驾驶系统和通讯系统,还有一个580平方米的洁净实验室和海洋物理、化学、生物、地质、气象等一系列科学考察实验室。每个实验室里都有自己的“看家宝贝”,比如水文资料采集室,里面不仅有鱼探仪,有能在航行时测定海水流速、方向的多普勒海流计,还有用来测量海水温度、盐度、深度的探测仪器(CTD)等一大批先进的设备。

定义7[5] 在决策表S=(U,C∪D,V,f)中,C为条件属性集,D为决策属性集,r∈C,称sig(r,C,为条件属性r相对于决策属性D的重要性程度,简称重要度,其中|·|表示集合·的基数。

在实际应用中的信息系统我们常用一个二维信息表来展示,要研究的对象用行展示,对象的属性用列展示,对象的信息通过指定对象的各属性值来表达,并且每一列属性对应一个等价关系,一个二维信息表对应一族等价关系[6]

试卷分析是指考试阅卷结束后,对试题的内容和学生答卷情况进行综合分析,评价试卷和试题的质量,是课程考核统计分析工作的重要组成部分,它是对试卷中存储信息的再利用。

因为粗糙集理论强调对于对象的分类,且只能通过离散的数据来实现,也就是说粗糙集理论只能处理离散型的数据,所以在应用粗糙集方法进行指标约简之前,需要先将连续的指标数据转化为离散数据。结合试卷特点,在此按一般的等级划分标准,分别用1、2、3、4和5表示不及格(<60)、及格(60~69)、中等(70~79)、良好(80~89)和优秀(90~100),比如填空题满分14分,某同学实际得10分,经转化计算100=71.4,得该同学对应属性值为3,其余类似计算。离散化后得到如表2所示的决策表,其中论域U={1,2,…,10}表示随机选取的10名样本学生,条件属性C={a1,a2,a3,a4}表示四个题目,决策属性D表示总分。

定义5[7]设S=(U,A,V,f)是一个决策表,对∀X⊆U,R是U上的一个等价关系,记为X的下近似,为X的上近似,其中[x]R是关于R的等价类称为X的R正域,它表示根据知识R判断必定属于X的U中的元素的集合。

定义3[7]设U为论域,若U的一个非空子集族π={X1,X2,…,Xn}满足条件:①Xi≠φ;②Xi∩Xj=φ,对于i≠j,i,j=1,2,…,n;③,则π称是U的一个划分。

定义4[7]设R为论域U上的一个等价关系,表示由R的所有等价类构成的集合,[x]R表示包含元素x∈U的R等价类。

定义2[7]设S=(U,A,V,f)为一信息系统,其中的U,A,V,f意义同定义1,A=C∪D是属性集合,C∪D=φ,C称为条件属性集,D称为决策属性集,具有条件属性和决策属性的知识表达系统称为决策表。

定义6[7] 在决策表S=(U,C∪D,V,f)中,C为条件属性集,D为决策属性集,r∈C,若posC-{r}(D)=posC(D),则称r是C上D可约去的;否则称r是C上D不可约去的。

流感病毒M2蛋白相对分子质量为15 000,如图5所示,2株纯化单克隆抗体3G3和3G4能与融合蛋白及不同亚型的流感病毒株(PR8、Memphis、A ichi)感染后的MDCK细胞裂解液结合,但不与未感染MDCK细胞裂解液结合,说明2株单克隆抗体检测流感病毒的特异性,也说明不同流感亚型对于单克隆抗体检测没有限制性,2株抗体初步具备广谱检测性。

下面计算D的相对正域:

定义1[5]信息系统是一个四元组 S=(U,A,V,f),也称为知识表示系统,其中U称为论域,是由对象构成的非空集合;A={a1,a2,…,an}称为属性集合,其中的每个元素ai(i=1,2,…,n)称为一个属性;称为属性值的集合,Va是属性的值域;信息函数 f:U×A→V定义了U中每一个对象x的属性值,即∀a∈A,x∈U都有一个f(x,a)∈Va与之对应。

3 基于粗糙集理论的试卷分析

不过,2016年的时候,出于某些原因,斯沃琪集团品牌也曾全部缺席当年GPHG日内瓦钟表大赏;2017年,只有浪琴一只“大眼”计时码表参加最佳复刻表的评比,并最终获得该奖项;2018年,已经有多只浪琴、美度和汉米尔顿腕表出现在最新一年的GPHG报名名单里。

3.1 样本数据采集

粗糙集理论是针对不确定性问题提出的,它的特点是不必提供问题所需处理的数据集合之外的任何先验信息,而是直接从给定问题的数据出发,找出该问题的内在规律。本文结合我校财务管理专业班学生《线性代数》期末考试原始成绩,研究怎样运用粗糙集理论对试卷中各题重要程度和试卷中的冗余信息进行分析,并对整份试卷进行客观、综合的评价。试卷中共有四个大题:填空题(14分)、选择题(15分)、计算题(51分)、证明题(20分),班级中共有51名学生,不失一般性随机抽取10名学生作为样本,分别用序号1,2,…,10表示(见表1)。

在教学方案上,改进前期基于案例项目的学徒式设计,延续“做中学”的教学模式,采用以产品为导向的渐进式项目。摈弃散碎的知识点罗列,通过项目贯穿和衔接知识点,采用合适的项目产品连接抽象理论知识与具体产品,在项目中学习知识,帮助学生体会抽象知识的工程价值。

表1 样本学生原始成绩数据

序号 填空题 选择题 解答题 证明题 总分1 4 9 29 10 52 2 10 12 37 18 77 3 8 6 12 1 27 4 4 9 46 2 61 5 14 12 40 20 86 6 8 15 18 1 42 7 6 6 27 18 57 8 14 12 47 20 93 9 12 12 39 20 83 10 8 9 15 2 34

3.2 数据离散化处理

决策表是一类特殊的也是重要的信息系统,多数决策问题在具体应用中都可以用决策表来解决[5]

⑩《初夏怀故山》“淹泊蛮荒感慨多”;《寒食》“又向蛮方作寒食”;《久病灼艾后独卧有感》“卧闻鸢堕叹蛮烟”;《林亭书事》“约束蛮僮收药富”;《谢张廷老司理录示山居诗》“憔悴经年客瘴乡”。

表2 样本学生原始成绩数据离散化所得决策表

U a1 a2 a3 a4 D 1 1 2 1 1 1 2 3 4 3 5 3 3 1 1 1 1 1 4 1 2 5 1 2 5 5 4 3 5 4 6 1 5 1 1 1 7 1 1 1 5 1 8 5 4 5 5 5 9 4 4 3 5 4 10 1 2 1 1 1

3.3 属性冗余信息分析

接下来根据定义5,通过计算来判断试卷中是否存在冗余的试题,先求U上各等价类的划分[7]

拱架置换施工开挖断面与前盾段脱困开挖断面一致,置换顺序为自原上导坑最末榀拱架往尾盾方向进行,如图7所示。置换时自进口方向右侧向左侧将拱架逐榀分段剥除,剥除时如果围岩面松弛掉快,可初喷砼稳固岩面,也可根据现场情况布设超前小导管稳固之,进行既有支护的剥除。拱架安装位置原则上采用既有拱架间内插,如拱架间距过大,可适当减小拱架间距,增加拱架榀数,具体支护参数与前盾脱困施工一致。

posC-{r}(D)是指U中所有根据属性集C-r划分后,仍可准确划分到的等价类D中的对象集合。

山东省首批中医药健康旅游示范创建单位包括中医药教育、农业种植、工业生产、商业流通、卫生健康服务等不同的产业门类,涵盖传统旅游的吃、住、行、游、购、娱六个方面,概括而言示范建设单位其所拥有的中医药旅游资源千差万别,这既体现中医药资源的综合性,也体现全域旅游发展背景下涌现的旅游新业态,也基本可以体现当前旅游具有的文、商、养、学、闲、情、奇发展趋势。为深刻展现研究的价值,本研究选择山东宏济堂制药集团股份有限公司为典型样本开展调查,计划完整展示中医药旅游的现状、发展存在的障碍,并拟提出针对性建议。

通过上述计算可以看到,posC-{a2}(D)=pos C-{a4}(D)=posC(D),说明即使删除a2和a4被划分到的信息并没有减少,因此对于这份试卷来说选择题和证明题出得不太科学,是冗余的、不必要的,但并不意味这两题的得分与总分无关。为了提高试卷质量,需对这两个题做进一步的修改、完善或者改用其它题型;pos C-{a1}(D)≠posC(D),posC-{a3}(D)≠posC(D),说明a1和a3均不冗余,都是必要的。

3.4 属性重要度分析

一般地,一个决策表中不同属性的重要性也可能有所不同。粗糙集理论的核心问题之一就是属性约简。约简通常作为数据挖掘的一个预处理步骤,主要研究和讨论决策表中哪些属性是必要的,并且在保持规则分类能力不变的前提下,删去不必要的属性。如果去掉某个属性之后相应分类变化较大,就说明这个属性的重要性较高;反之则说明其重要性较低。

根据定义7计算出每一个属性的重要度分别为:

对于所选取的样本数据来说,我们用 sig(ai,C,D)来表示在试卷中删除属性ai之后,关于决策属性即总分D的分类信息变化情况。如果分类信息变化越大,则说明题目ai相对于总分D重要程度越高;反之,分类信息变化越小,说明题目ai相对于决策属性即总分D重要程度越低。通过上述计算可以得到 sig(a3,C,D)>sig(a1,C,D)>sig(a2,C,D)=sig(a4,C,D)。

一般说来,一份试卷中如果根据所给数据通过计算所得到的各题重要程度顺序与出试卷时的预期目标是一致的,说明该试卷的质量较高,试题重要度主次分明,符合教学大纲和考试大纲要求;否则,为了使考试成绩能够真实、客观、准确地反映学生的学习情况,就必须对试卷题的质量提出更高的要求。根据上面的计算可以看出,在这份试卷中计算题的重要度最高,填空题次之,选择题和证明题的重要度最低,从试卷的整体质量方面考虑,还需对选择题和证明题加以修改或完善。

4 结语

考试是反馈教学信息、评价教学质量、调控教学过程的重要手段,是教学工作中不可缺少的重要环节。试卷质量分析与评估是考试之后的一项重要工作,试卷质量分析与评估的结果是对考试工作进行总结并给予恰当评价的重要依据。本文利用粗糙集理论中的属性约简和重要度等概念,对试卷质量和各题的重要性进行分析,做到客观、有效地检验教师的教学效果和学生的学习水平,对今后改进教学方法、提高教学质量及改善和提高试题库质量有重要的指导作用。

经过三个昼夜的苦思冥想,甲洛洛把希望寄托在了自己身上,他决定不惜一切代价,自己去侦查谁是小偷,并根据以下情况列了排序:

参考文献:

[1]刘美宏.试卷质量分析与评估技术的研究与实现[D].沈阳:沈阳工业大学,2009.

[2]韩放.试卷分析算法的应用研究[D].大连:大连海事大学,2010.

[3]王伟.试卷综合评判方法的应用 [J].中国高等教育,2004,11(8):33~36.

[4]孟宜成.粗集理论在机器学习中的应用与研究[D].昆明:昆明理工大学,2008.

[5]李兵.粗糙集理论中的若干问题研究[D].湖南:中国人民解放军国防科学技术大学,2002.

[6]李雪斌.基于粗糙集理论的规则挖掘方法研究[D].江西:江西师范大学,2002.

[7]张文修,吴伟志,梁吉业,等.粗糙集理论与方法[M].北京:科学出版社,2001.

杨艳丽
《保山学院学报》 2018年第2期
《保山学院学报》2018年第2期文献

服务严谨可靠 7×14小时在线支持 支持宝特邀商家 不满意退款

本站非杂志社官网,上千家国家级期刊、省级期刊、北大核心、南大核心、专业的职称论文发表网站。
职称论文发表、杂志论文发表、期刊征稿、期刊投稿,论文发表指导正规机构。是您首选最可靠,最快速的期刊论文发表网站。
免责声明:本网站部分资源、信息来源于网络,完全免费共享,仅供学习和研究使用,版权和著作权归原作者所有
如有不愿意被转载的情况,请通知我们删除已转载的信息 粤ICP备2023046998号