更全的杂志信息网

面向大规模认知诊断的DINA模型快速计算方法研究

更新时间:2016-07-05

1 引言

随着互联网教育的迅猛发展,大量在线智能教育系统进入了公众的视线*猿题库:http://www.yuantiku.com/;全通教育:http://www.qtone.cn/;智学网:http://www.zhixue.com/ ,为学生实现自主学习提供了可能[1,2].然而,在线教育系统在提供便利的同时,由于其具有庞大的学习资源库,往往也会给平台提供自主学习服务带来诸多困难[3,4].因此,基于学生学习数据,借助技术手段准确地对学生进行学习分析,从而为学生进行个性化的学习推荐,让在线教育系统做到因材施教,已成为当前面向教育数据挖掘分析的重要研究问题[5].

北京地铁12号线正线全长为29.35 km,全部为地下线,共设21座车站,其中换乘站14座。大钟寺站—蓟门桥站区间起点位于大钟寺站,区间线路沿北三环西路路中敷设,终点位于蓟门桥区的蓟门桥站,区间长度847.298 m,线间距15.0 m~17.2 m。大钟寺站及蓟门桥站均为暗挖法施工车站,区间线路纵断采用“人”字坡,拟采用矿山法施工,区间埋深约34 m。

要想达到因材施教的教育目标,首先要清楚地鉴别每个学生的潜在学习状态[6].传统教学方法依靠教师经验判断,不仅耗费大量的时间和精力,结果也不够准确,更不适合在线教育需要面对的学生规模.为此,教育心理学家提出了认知诊断评估方法.认知诊断评估基于学生对试题的作答情况,通过对学生进行个性化的认知诊断[7]建模,从而得到学生潜在知识水平的掌握情况,进而为学生个性化学习、资源推荐提供了基础[5].具体地,它假设题目与知识点之间存在显示关联,可以用Q矩阵[8]来表示(表1展示了三道数学题目与四则运算五个知识点之间的Q矩阵).进一步,它认为学生对于试题的作答表现受到学生对知识点的掌握程度(学生潜在学习状态)的影响[9].

表1 试题知识点关联Q矩阵

知识点题目加法减法乘法除法括号11+3-51010021∗4/301110(5+2)∗1200011

在认知诊断评估中,Deterministic Inputs,Noisy “And” gate model(DINA模型)旨在对学生多维知识点掌握程度进行建模分析[12],它能够在精准建模学生学习状态的同时保证了较好的可解释性,近年来广受学者关注和研究[13].具体地,DINA结合了Q矩阵作为试题的先验知识,将学生的潜在学习状态描述成一个多维知识点掌握向量,同时引入题目的猜测和失误参数,以准确地在多维知识层面诊断学生的认知学习状态.以表1中题目为例,某学生根据DINA模型得到的认知诊断结果如图1所示,由图可知该学生掌握了加减乘除,但没有掌握括号知识点.

在低密度负荷区配电网工程中,涉及到中压线路的选型应明确低密度负荷区中压线路总负荷水平及负荷的整体分布状况,综合考虑区域发展阶段及项目经济效益和安全性,根据表中的相关数据,确定低密度负荷区的中压架空线路的选型与供电半径。

然而,受技术和环境所限,传统的DINA模型多基于小样本[14],如一次考试结果.而在线教育系统所提供的学生数据规模远超传统应用场景,此时DINA模型的诊断速度将大大降低,限制了DINA模型的应用[15].近年来,有学者提出通过增加超参和采样训练的方式改善DINA模型的计算效率,如HO-DINA[16]和FuzzyCDF[17]模型.但其建模过程均需引入超参,从而破坏了DINA模型在参数解释性上的优势.因此,如何在不增加参数的情况下且不破坏模型收敛性的情况下,优化DINA模型的计算效率,使其能够更好的适应大规模学生知识点掌握评估,仍是近年来学者们研究的重点,也是本文关注的核心问题.

=l(X)t

(1)据作者调研所知,本文首次给出了DINA模型收敛性的证明,完善了DINA模型的研究.

沈侯凑过来,看了一眼颜晓晨的手机,嘿嘿地笑,把他的手机拿给她看,一连十几条,有短信、有微信,都是问:“你和颜晓晨复合了?”颜晓晨抬头看了一圈教室,在期中考试成绩即将公布的阴影下,大家的八卦之心依旧熊熊燃烧!

(2)据作者调研所知,本文首次对DINA模型中数据采用熵解释的办法给出了合理的数据划分方法,并给出了理论证明.

(3)本文所提出的三种DINA模型优化方法,均不改变DINA模型的参数,使得其在提高DINA模型的运行效率的同时仍可保证DINA模型的可解释性,具有更好的可扩展性.

2 相关工作

本章节将从认知诊断模型、EM算法优化研究两个方面介绍相关工作.

2.1 认知诊断模型

认知诊断模型旨在通过学生的做题历史记录,诊断学生的潜在能力,可以分为单维连续模型(以IRT模型[19]为代表)和多维离散模型(以DINA模型为代表)[6].相比于类IRT模型[19],DINA模型具有更优秀的参数可解释性,近年来受到学者的关注并被广泛应用[15,20],与之相关的研究如Templi(2006)提出的补偿型知识掌握模式DINO模型[21]和De La Torre J(2011)提出的一般化G-DINA模型[22].然而,上述关于DINA的研究大多仍基于小样本测试数据,且局限于DINA模型的诊断效果,却忽视了由于收敛速度慢而导致难以大规模应用的现实问题[14,15].随着教育数据的增长,传统DINA模型不再适应现有的数据规模.

(1)根据水功能区水质达标管理要求,以水功能区为功能控制单元、流域为统筹管理单元,实施分阶段排污总量控制,重点提高不达标水功能区内污水处理能力与质量,加大超采水功能区限排力度,有序提升水功能区达标水平。

针对DINA模型计算效率的问题,有学者开始研究相关改进模型[13,16,17].其中,最为有效的改进模型有HO-DINA模型和FuzzyCDF模型 [16,17].HO-DINA[16]模型为了降低知识点的维度,假设知识点掌握程度受到一个代表综合能力的超参所控制.FuzzyCDF[17]模型则利用模糊理论将DINA模型中的知识点掌握程度由0-1离散分布改为在[0,1]区间上的连续分布,为此同样需要引入超参.这两种方法虽然降低了计算复杂度,但同时引入了两个问题:一是失去了原本参数优秀的现实可解释性,二是破坏了EM算法的适用性.

2.2 EM算法

证明 与DINA模型的证明步骤是类似的,仍然是用式(6)说明l(X)t+1l(X)t即可.注意到式(6)中只要P(Xi|αl)tP(Xi|αl)t+1不完全相等,第一个不等号就是成立的.对于I-DINA模型,虽然当XiXj时,P(Xi|αl)t=P(Xi|αl)t+1,但对于XiXjP(Xi|αl)t是会更新的,除非已极大化总似然函数,迭代停止了,否则P(Xi|αl)tP(Xi|αl)t+1不可能完全相等,所以第一个不等号成立.而第二个不等号成立是由M步所保证的,I-DINA模型和DINA模型的M步是相同的.综上,I-DINA模型也可以保证EM步骤是收敛的.

其中αik=1或0表示学生i掌握或没有掌握知识点k,学生的潜在能力矩阵α={α1,α2,…,αI}′,Q矩阵Q={qjk}J*K.故ηij反映了学生能力是否足够答对该题.在引入失误率s和猜测率g两种题目参数后,实际响应矩阵X{Xij}I*J的概率模型为:

综上所述,在初中学生解决函数“动点问题”期间,由于受到教师与学生等客观因素影响,致使其解题困难性相对较强。因此教师可结合实际情况通过利用旧知识引入新知识、自主学习以及仔细观察发现问题等方法提高学生函数动点问题解题能力,并在一定程度上为学生的发展创建良好的条件。

3 DINA模型

DINA模型通过利用Q矩阵的信息来建模学生对题目的作答变量,借此诊断学生的知识点掌握程度.一般假设各题作答相互独立,满足伯努利分布.当有I个学生,J道题目和K个知识点时,DINA模型中的潜在作答变量ηij可以表示为:

(1)

为了改进EM算法的收敛速度,不少学者提出了诸多改进的算法,均可分为基于E步或M步的加速方法.如基于E步的加速方法中,MCEM算法[25]在E步难以得到期望的显示表达式时,用Monte Carlo模拟来完成E步.在基于M步的加速方法中,ECM算法[26]和ECME算法[27]在M步没有显示表达式时,通过用有约束条件情况下完整数据或观察数据对数似然函数的极大化来代替M步中极大化步骤,实现计算的简化;此外,A-ECM算法[28]根据EM算法初始迭代速率很快与Aitken法末尾迭代速率很快的特点,混合两种方法来加快收敛速度等.由于DINA模型中M步有显示表达式,而E步的计算时间却很长,故本文将介绍三种基于E步的DINA加速方法.

(2)

表2给出了DINA模型的符号及对应描述.图2展示了DINA模型的图模型.

表2 DINA模型所涉及的符号及描述

符号描述i学生j题目k知识点X得分矩阵Xij学生i在题目j上得分情况α潜在能力矩阵αik学生i对知识点k掌握情况η潜在作答矩阵ηij学生i在题目j上潜在作答情况Q题目知识点关联矩阵qjk题目j对知识点k考查情况sj题目j的失误率gj题目j的猜测率

DINA模型的总似然函数为:

(3)

其中,L=2k由于式(3)中含有隐变量αl,无法直接进行极大似然估计,DINA模型引入EM算法,采用极大边缘似然估计的方法[12]求解:

E步:利用上一轮得到的sjgj估计计算矩阵P(X|α)=[P(Xi|αl)]I×L的值,并利用p(X|α)计算矩阵P(α|X)=[P(αl|Xi)]I×L的值,其中i=1,2,…,I,l=1,2,…,L.

M步:分别令可得:

(4)

(5)

其中表示属于第l种知识点掌握模式的学生中缺乏至少一个第j题所需知识点的人数期望,表示中回答正确第j题的人数期望,的含义与相似,不同之处在于是在学生掌握所有第j题所需知识点的情形下的期望.故可由E步中得到的估计,计算的值,并由此得到新的sjgj估计.由于E步中需多次计算大规模矩阵乘积,DINA模型的计算效率较低,且此前没有工作给出DINA模型收敛性的相关证明.

4 DINA模型的快速实现算法

鉴于DINA模型计算效率较低,本章将介绍三种加速DINA模型的方法——增量方法、最大熵方法和结合前两种方法的混合方法及其收敛性证明.三种方法的共同点是在DINA模型的E步中每次迭代只遍历部分学生,对不访问的学生保留上一次迭代得到的结果[28].整体流程如图3.

(1)输入:学生对一组题目的实际响应矩阵X和专家提供的试题知识点关联矩阵Q.

(2)划分学生数据集:按照所选择的加速方法,将学生矩阵X划分为需要在此次迭代中访问的学生矩阵XY与不需要访问的学生矩阵XN.

则当ST1min(Xi)且STmax(Xi)2时,将学生数据Xi划分至变化集XC,否则将学生数据Xi划分至懒惰集Xl,其中ST1与ST2是先验阈值.由于的信息熵,且故上述方法实际上筛选掉了当前熵比较大的学生数据,而保留熵比较小的学生数据迭代增加熵值,以此极大化模型总的熵值.

(4)判断迭代是否收敛:若不收敛,返回第(2)步.

(5)利用加速DINA模型的迭代结果,对学生知识点掌握程度进行个性化分析.

为确保模型的实用性,必须保证其可以收敛.本文先给出DINA模型的EM收敛性证明,并在之后给出改进算法的收敛性证明.据作者调研所知,本文首次给出了DINA模型收敛性的证明.

I-DINA模型与DINA模型一样具有理论上的收敛保证.证明如下.

证明 给定学生得分矩阵X和题目知识点关联矩阵Q,问题是DINA模型是否可以保证达到模型总对数似然函数l(X)的极大化从而停止迭代.

l(X)

l(X)t表示第t次迭代时的总似然函数值,则说明算法收敛只需证明l(X)t+1>l(X)t即可.

l(X)t+1

针对上述问题,本文结合DINA模型中EM算法的数据划分特性及收敛性[18],首先从两种角度提出了增量DINA模型(I-DINA)与最大熵DINA(ME-DINA)模型.其中,增量DINA模型通过将原始数据分成多个学生块增量式地处理迭代,而最大熵DINA模型则是筛选掉极大化模型熵的过程中影响较小的学生.最后,本文结合前两种方法,进一步提出了增量最大熵DINA模型(IME-DINA).相比于前文提到的改进方法,本文给出的三种方法一方面保留了DINA模型原有的所有参数,保证了可解释性这一优点;另一方面,由于本文所提出的三种优化算法均是基于EM步骤的改进,故仍然可以迭代求解,并保证其参数收敛性.总而言之,本文的主要贡献总结如下:

(6)

其中第一个不等号成立是因为只有当μl取值为时才满足琴生不等式等号成立条件;第二个不等号成立正是M步的工作.故DINA模型中的EM步骤是可以保证收敛的.

证毕.

在4.2节到4.4节将分别介绍本文给出的三种基于E步的DINA模型加速方法.

语音是人类了解世界的重要手段,其中语音定位又是实现语音重现的重要手段,在语音增强、语音识别[1]、增强现实等领域中被广泛使用。

4.1 增量DINA模型

当DINA模型的E步需要耗费大量时间时,增量式的迭代参数是一种很直观的想法,增量DINA模型(Incremental DINA,I-DINA)通过将DINA模型中的完整E步(complete E-step)改变为部分E步(partial E-step)的方法来减少计算花费的时间[29].即将数据集X划分成N个不相交的学生块{X1,X2,…,XN},在每次进行I-DINA模型的部分E步时,只遍历其中一个学生块Xj来更新似然函数,而对于其他学生块,则保留上一次迭代得到的似然函数值.算法1展示了I-DINA模型的具体步骤.

定理1 DINA模型中的EM步骤收敛.

定理2 I-DINA模型中的EM步骤收敛.

在DINA模型中,存在无法直接观察的隐变量,即学生的知识点掌握程度,故需要采用EM算法[23]来解决不完全数据的参数估计问题.但当缺失的信息量很大时,EM算法的收敛速度将会很缓慢[24],在DINA模型中这一点尤为明显.

思想建党是党的优良传统和政治优势。在党要管党、全面从严治党要求下,不断提高党建和思想政治工作科学化水平是所有党组织的重要任务。高校附属医院承载着教书育人和治病救人的双重职能,通过将精益求精、敢于创新的工匠精神注入党建思想政治理论研究工作,探索新时期党建和思想政治工作的新思路、新方法和新途径,必将提高研究实效性,进而推进高校附属医院党建和思想政治工作的发展。

设置仿真时间为60 min,随机种子为128,再次运行仿真.结果显示,仿真后期全局统计量网络时延达到0.55 s,数据库查询和HTTP页面的响应时间分别达到223.48 s,5.87 s,并且有逐渐增大趋势.这3个全局统计量开通视频点播后60 min的移动平均分别如图5~7所示.核心交换机CS6509与汇聚交换机CS3560G之间下行链路的排队时延峰值达到3.40 s,吞吐量峰值达到940.32 Mb/s,利用率峰值达到94.03%.这3个链路统计量开通视频点播后60 min的移动平均分别如图8~10所示.

证毕.

I-DINA模型相比DINA模型,划分学生块的数目对于模型计算时间的影响是明显的,最极端的情况,当只有一个学生块时,I-DINA模型实际上就是DINA模型,这一点将在实验部分进一步讨论.

4.2 最大熵DINA模型

I-DINA模型由于缺乏对学生数据的先验信息,导致每次模型的计算时间差异很大,此时一种对学生数据的筛选机制会有很大的帮助,为此本文提出了最大熵DINA模型(Maximum Entropy DINA,ME-DINA).它基于这样的经验事实:在每次迭代过程中,不是所有的数据都有相同的地位.有些数据对于迭代过程中参数的步长贡献很大,而另一些数据可能起不到太大作用,但二者遍历花费的时间是相同的,这就拖慢了迭代收敛的速度.

具体的说,ME-DINA模型通过将学生数据集X重新划分为对参数更新贡献较大的变化集XC和对贡献较小的懒惰集Xl.在每次迭代过程中,将会选择进行完整E步或者懒惰E步(lazy E-step).在完整E步之后会按照某种规则对学生数据集X进行一次筛选,划分为懒惰集Xl与变化集XC两个集合;当进行懒惰E步的时候,只访问属于变化集XC的学生数据来更新似然函数,而对于懒惰集Xl,则保留上一次迭代得到的似然函数值.算法2展示了ME-DINA模型的具体步骤.

ME-DINA模型的核心就是用来划分懒惰集与变化集的筛选条件.根据最大熵原理,模型应当选用具有最大熵时的概率分布,ME-DINA模型就是从这个角度入手,制定的筛选规则.令STmax(Xi)和STmin(Xi)分别表示学生i属于第l种知识点掌握模式概率的上下界,即:

(7)

(8)

(3)迭代求解DINA:按照第3章中介绍的步骤进行迭代求解,在更新似然函数时只访问学生矩阵XY,保留上次迭代得到的XN中学生的结果.

注意到本文对I-DINA模型的证明其实适用于所有不完整E步方法的DINA模型,即有:

定理3 ME-DINA模型中的EM步骤收敛.

证明 完全类同于I-DINA模型的证明,当XiXl时,P(Xi|αl)t=P(Xi|αl)t+1,但对于XiXCP(Xi|αl)t是变化的,故式(7)仍然成立.ME-DINA模型的EM步骤是收敛的.

证毕.

式中:L是履带吸盘的最高点和最低点的距离;h是清洁机器人重心到工作平面的距离;G是清洁机器人的重力(N);α是光伏面板与水平面的夹角;β是支撑点和几何重心的连线与工作平面法线的夹角,称为抗倾覆特征角,由清洁机器人的自身结构确定。

4.3 增量最大熵DINA模型

ME-DINA模型相比I-DINA模型,由于阈值确定后,学生数据集的划分方法也随之确定,故不会出现时间上的不稳定性,但加速效果往往不如I-DINA模型好.于是,本文结合了前两种方法的优点,即I-DINA模型的快速性与ME-DINA模型的稳定性,进一步提出了增量最大熵DINA模型(Incremental Maximum Entropy DINA,IME-DINA).即进行E步计算时划分懒惰集Xl与变化集XC,再在变化集XC中划分学生快,同样可以保证收敛.算法3展示了IME-DINA模型的具体步骤.

5 实验

由于DINA模型非凸,不同的初值可能会造成不同的局部解,讨论理论收敛速度的意义不大,本文着重通过实验,从加速能力和参数影响两方面来测试三种加速方法的性能.

5.1 数据集介绍

数据集1和数据集2来自某市部分高中生的数学考试记录,最早由文献[17]提出并使用.此外,本文额外生成了一个包括十万学生的模拟数据集(数据集3)进行实验,从而考查在面对大规模数据的情况下三种加速方法的加速能力.表3给出了数据集的简单统计.图4展示了两个数据集的Q矩阵,黑色方块表示题目和该知识点相关.实验均在intel 4核处理器环境下使用R语言运行.

表3 数据集的简单统计

数据集学生数题目数知识点数据集14,2091511数据集23,9111616数据集3100,0001616

5.2 模型效果对比实验

本实验考察三种加速方法能否在不降低DINA诊断效果的同时提高计算速度.由于DINA模型输出的学生认知诊断结果是一个不可实际测量的变量,本文将其转化为学生在试题上的作答预测来进行评估.在计算时间性能方面,本文通过对比4种模型达到收敛时所用的时间加以验证评估.

实验中,对每个数据集,抽取其中20%的学生和题目作为测试集.剩余部分作为训练集.本文采用精准度(accuracy)来评估学生答题预测实验的结果,精准度定义如下:

通过查阅关于药物手性转换的文献综述,本文对美国食品药品监督管理局(FDA)在1994—2011年期间批准的15种由外消旋体药物成功开发成为单一对映体药物的情况进行归纳总结(表1)[10]。目前,手性药物临床用量日益上升,市场份额逐年扩大。世界医药领域研发手性药物之势愈来愈烈,并已有大量新品种面世。而这其中单一对映体形式手性药物的销售额持续增长,单一对映体药物制剂的市场份额从1996年的27%增加到目前的约65%。鉴于各制药公司对手性药物专利保护等政策的影响,笔者并未获得最新的销售数据[12]。

(9)

其中succ表示预测结果和实际结果相符的记录个数,total表示测试集中所有的记录个数,则精准度表示测试集中预测结果和实际相符的记录个数所占的比例.

为了保证实验结果的可靠性,实验均采用10次5折交叉验证法.实验结果如表4和图5所示.

表4 模型精准度(accuracy)记录表

模型数据集DINAI-DINAME-DINAIME-DINA数据集10.86400.86090.86580.8670数据集20.86360.86360.85950.8619

由实验结果可知:

(1)四种DINA模型在学生试题答题预测结果上很接近,不会影响到诊断效果.同时,三种加速方法对比DINA模型,计算速度都有极大地提升.且面对十万级别的学生数据表现同样出色.

(2)对于不同的数据集,三种加速方法的加速能力也不同.其中IME-DINA模型由于结合了其它两种方法的优点,可以达到最快的计算速度.

5.3 三种加速方法的参数设置实验

本节将讨论参数对三种方法加速能力的影响.

I-DINA模型的计算速度受学生块数量的影响.学生块数量太少时每次迭代时间仍较长,太多又会导致每次迭代改变太小.本实验中采用确定每个学生块内的人数的方法进行学生块划分,实验指标为计算时间.实验结果如图6所示.从图6可知,数据集1(数据集2)大约在每个学生块内12(17)人时达到最低计算时间.

伴随着这一系列全球性的减贫计划,中国特色扶贫开发道路也不断向前推进,包括扶贫项目上的合作、扶贫理念与经验上的交流互鉴、扶贫资金上的支援、扶贫动力上的鼓舞等。

实验中I-DINA模型在时间上的波动性非常明显,同样设置下最慢记录可以达到最快记录3倍以上的时间,这可能会限制I-DINA模型的实际应用.

ME-DINA模型的计算速度则受阈值ST1和ST2的影响.如果ST1取值太低或ST2取值太高,就无法对数据做出有效地筛选,反之则会造成过度筛选.在实验中,本文令ST2=1-ST1,故只需调节ST1的值即可,图7为实验结果,其中横坐标为ST1的值.从图7可知,数据集1(数据集2)大约在ST1=0.25(0.18),ST2=0.75(0.72)时达到最低计算时间.

大观园中美丽的自然景致可以激发青年男女对生命、情感的觉醒,唤起他们内心深处对爱情的渴望。大观园是宝玉和众姐妹共同生活的乐园,是滋养爱情的百花园,只有在大观园这个相对轻松自由的环境中,才有产生爱情的可能。作者可以和他心目中“集日月山川之精秀”的女儿在园中喝酒行令,可以和她们泛舟池上,可以和她们簪花斗草,可以和她们吟诗联句,可以和她们挥毫作画,可以和她们弹琴围棋,可以和她们观戏赏乐……这一切都是借助于物质性功能建构而作精神上的“逍遥游”,从而满足了种种精神文化生态的需求。这是一个“游于艺”的理想境界。

IME-DINA模型的计算速度会同时受学生块人数和阈值影响,因此需要同时讨论这两个参数.图8为固定ST1=0.1,ST2=0.9时,模型计算时间与每个学生块内人数之间的关系图.数据集1和数据集2大约都在每个学生块8个人时计算时间最少.图9为固定每个学生块10个人时,模型计算时间与每个阈值的关系图,横坐标为ST1的值.数据集1和数据集2大约都在ST1=0.1到0.15,即ST2=0.85到0.9之间计算时间最少.相比I-DINA模型,IME-DINA模型由于结合了ME-DINA模型的筛选机制,在计算时间上的稳定性大大提高,不会出现像增量加速算法中出现的大量偏差,在90%的实验次数里,时间的波动幅度均小于平均值的10%.

5.4 实验结果讨论

从诊断准确性的对比实验可以看到,本文所提出的三种加速方法均没有降低DINA模型的诊断效果.而在计算时间性能的对比实验中,三种加速方法均在三个数据集上达到了出色的效果.说明了本文所提出的三种加速方法均可以适用于实际应用中可能会出现的数据集规模,如此大大提高了DINA模型的实际应用价值.

本文提出的三种加速方法中,IME-DINA模型由于结合了其它两种方法的优点,能够达到最快的加速效果,且IME-DINA模型的参数选择更加稳定.故而在实际应用中,推荐采用IME-DINA模型进行学生的个性化认知诊断,阈值可以设置为下阈值在0.1到0.15之间,上阈值在0.85到0.9之间,而学生块的数目需要视数据集的具体规模而定.

6 结论和展望

DINA模型在教育领域上应用价值很大,然而模型计算时间过长的问题阻碍了其实际应用.本文针对DINA模型中EM步骤里E步计算量大,耗费时间长的问题,提出了三种基于E步的加速方法.第一种是I-DINA模型,将学生数据划分为多个学生块并且循环访问;第二种是ME-DINA模型,只访问在极大化模型熵的过程中对迭代影响较大的学生数据;第三种是IME-DINA模型,这是一种基于前两种方法的混合方法.接着本文通过对比实验证明了三种加速方法均可以在不降低传统DINA模型诊断效果的情况下,提升几倍至几十倍的计算速度,同时首次给出了DINA模型及三种加速方法的理论收敛性证明.最后通过实验讨论了不同参数对三种加速方法造成的影响.

为了继续提高认知诊断模型在知识点层面上个性化评估学生学习状态的效果,未来研究工作可以从以下几个方面进行:(1)随着在线教育数据量的不断增大,未来可以考虑设计分布式的DINA算法,以进一步保证DINA模型的效率;(2)本文给出的三种方法,均不局限于DINA模型,未来的工作里,还可以尝试应用于其它基于EM算法的认知诊断模型.

二是“合作组织模式”。多途径推进政府、学校、行业、企业等主体参与贫困地区新型职业农民培育工作。特别是发挥农业主管部门、农业院校或农广校、乡镇企业等机构的积极性,利用不同主体间的资源优势形成合力。

参考文献

[1]Premchaiswadi W,Porouhan P.Process modeling and decision mining in a collaborative distance learning environment[J].Decision Analytics,2015,2(1):1-34.

[2]康叶钦.在线教育的“后MOOC时代”——SPOC解析[J].清华大学教育研究,2014,35(1):85-93.

[3]Anderson A,Huttenlocher D,Kleinberg J,et al.Engaging with massive online courses[A].Proceedings of the 23rd International Conference on World Wide Web[C].ACM,2014.687-698.

[4]Vukicevic M,Jovanovic M Z,Delibasic B,et al.Recommender System for Selection of the Right Study Program for Higher Education Students[M].RapidMiner:Data Mining Use Cases and Business Analytics Applications,2013.

[5]Baker R S,Inventado P S.Educational Data Mining and Learning Analytics[M].Learning Analytics,2014.61-75.

[6]Leighton J P,Gierl M J.Cognitive diagnostic assessment for education:Theory and applications[J].Journal of Qingdao Technical College,2007,45(4):407-411.

[7]DiBello L V,Roussos L A,Stout W.31A Review of cognitively diagnostic assessment and a summary of psychometric models[J].Handbook of Statistics,2006,26:979-1030.

[8]Barnes T.The Q-matrix method:Mining student response data for knowledge[A].Proceedings of the AAAI-2005 Workshop on Educational Data Mining[C].Pittsburgh,PA,2005.1-8.

[9]Junker B,Sijtsma K.Cognitive assessment models with few assumptions,and connections with nonparametric item response theory[J].Applied Psychological Measurement,2001,25(3):258-272.

[10]Fan X.Item response theory and classical test theory:an empirical comparison of their item/person statistics[J].Educational & Psychological Measurement,1998,58(58):357-381.

[11]An X,Yung Y F.Item Response Theory:What it is and how you can use the IRT procedure to apply it[A].Proceedings of the SAS Global Forum 2014 Conference[C].SAS Institute,2014.364-2014.

[12]De La Torre J.DINA Model and parameter estimation:A didactic[J].Journal of Educational and Behavioral Statistics,2009,34(1):115-130.

[13]张潇,沙如雪.认知诊断 DINA 模型研究进展[J].中国考试,2013(1):32-37.

[14]de la Torre J.Application of the DINA Model Framework to Enhance Assessment and Learning[M].Self-Directed Learning Oriented Assessments in the Asia-Pacific,New York:Springer,2012.92-110.

[15]Torre J D L,Minchen N.Cognitively diagnostic assessments and the cognitive diagnosis model framework[J].Psicología Educativa,2014,20(2):89-97.

[16]Torre J D L,Douglas J A.Higher-order latent trait models for cognitive diagnosis[J].Psychometrika,2004,69(3):333-353.

[17]Wu R,Liu Q,Liu Y,et al.Cognitive modelling for predicting examinee performance[A].Proceedings of the 24th International Conference on Artificial Intelligence[C].AAAI Press,2015.1017-1024.

[18]Neal R M,Hinton G E.A View of the Em Algorithm that Justifies Incremental,Sparse,and other Variants[M].Learning in Graphical Models.Springer Netherlands,1998.355-368.

[19]Mu J.Handbook of modern item response theory[J].Journal of the American Statistical Association,1997,(92):245-256.

[20]朱天宇,黄振亚,陈恩红,等.基于认知诊断的个性化试题推荐方法[J].计算机学报,2017,40(1):176-191.

[21]Templin J L,Henson R A.Measurement of psychological disorders using cognitive diagnosis models[J].Psychological Methods,2006,11(3):287-305.

[22]De La Torre J.The Generalized DINA model framework[J].Psychometrika,2011,76(2):179-199.

[23]Dempster A.Maximum likelihood from incomplete data via the EM algorithm[J].Journal of the Royal Statistical Society,1977,39(1):1-38.

[24]Wu C F J.On the convergence properties of the em algorithm[J].Annals of Statistics,1982,11(1):95-103.

[25]Booth J G,Hobert J P.Maximizing generalized linear mixed model likelihoods with an automated Monte Carlo EM algorithm[J].Journal of the Royal Statistical Society,1999,61(1):265-285.

[26]Meng X L,Rubin D B.Maximum likelihood estimation via the ECM algorithm:a general framework[J].Biometrika,1993,80(2):267-278.

[27]Liu C,Rubin D B.The ECME algorithm:a simple extension of EM and ECM with faster monotone convergence[J].Biometrika,1994,81(4):633-648.

[28]Mclachlan G J.On Aitken's Method and other approaches for accelerating convergence of the em algorithm[A].Proceedings of the AC Aitken Centenary Conference[C].Dunedin:University of Otago Press(1995),1998.201-209.

[29]Bo T,Meek C,Heckerman D.Accelerating EM for large databases[J].Machine Learning,2001,45(3):279-299.

王超,刘淇,陈恩红,黄振亚,朱天宇,苏喻,胡国平
《电子学报》 2018年第05期
《电子学报》2018年第05期文献

服务严谨可靠 7×14小时在线支持 支持宝特邀商家 不满意退款

本站非杂志社官网,上千家国家级期刊、省级期刊、北大核心、南大核心、专业的职称论文发表网站。
职称论文发表、杂志论文发表、期刊征稿、期刊投稿,论文发表指导正规机构。是您首选最可靠,最快速的期刊论文发表网站。
免责声明:本网站部分资源、信息来源于网络,完全免费共享,仅供学习和研究使用,版权和著作权归原作者所有
如有不愿意被转载的情况,请通知我们删除已转载的信息 粤ICP备2023046998号