更全的杂志信息网

事件本体表示模型与构建综述

更新时间:2016-07-05

0 引言

基于概念的知识表示较多描述静态的特征,无法反映事物动态变化[1]。所以,相关研究开始使用“事件”对知识进行表述,把事件定义为参与对象在一定时间和环境条件下进行的动态过程,并提出了事件本体模型。目前,相关研究缺少对事件本体表示模型和构建方法进行总结和比较,并且较少关注事件本体的自动构建方法。

因此,本文通过大量调查研究分别对事件本体表示模型和构建方法进行了分析与比较,在此基础上,提出了一种事件本体自动构建方案。

研究对象纳入标准为:①支气管哮喘符合《儿童支气管哮喘诊断与防治指南(2016年版)》中规定的诊断标准[3];喘息性支气管炎、毛细支气管炎、喘息性支气管肺炎符合《诸福棠实用儿科学》第八版诊断标准[4];②排除气管异物、急性喉炎、先天性发育不良和胸廓畸形等引起的喘息儿童;③排除心源性哮喘儿童;④排除血清呼吸道病原体谱检测(间接免疫荧光法)腺病毒、流感病毒A、流感病毒B、副流感病毒、肺炎支原体、肺炎衣原体及嗜肺军团菌IgM阳性儿童。

1 事件本体描述语言和构建工具

1.1 事件本体描述语言

Kaneiwa等[14]使用有序的逻辑结构和逻辑公式构建模型,并用n元谓词表示。Ilaria Corda等[15]使用逻辑结构构建模型,用于挖掘历史事件及其关系。该模型用Ω表示,定义为

根据描述程度不同,可将OWL分为3种:OWL Lite,适用于分类层次只有一个并且约束简单的场景;OWL DL,推理效率较高,但不能很好地与RDF语言兼容;OWL Full,表达能力好并且语法语义上完全向上兼容,但不可判定,在推理上存在一定的缺陷。

SROIQ是刘炜等[2]在描述逻辑基础上进行扩展,形成的一种语言。相比于传统的描述逻辑语言,SROIQ的表达能力强,有助于实现事件关系的推理。表1为SROIQ的语法和语义。

表1 SROIQ语法语义

构造算子语法语义事件类、要素概念CCI⊆ΔI非空概念集ΔI空概念集⊥Φ非-CΔICI析取CDCI∪DI合取CDCI∩DI概念包含CDCI⊆DI角色RRI⊆ΔI×ΔI存在限定∃R.C{x|∃y∈RI∧y∈CI}值限定∀R.C{x|∃y∈RI⇒y∈CI}角色的逆R-{|∈RI}角色包含RIXRIYRIX⊆RIY一般化角色包含公理R1…RnRm{|∈ΔI×ΔI,x1,…,xn∈ΔI,∈VI}

SWRL是一种语义网规则语言,以OWL DL和Rule ML为基础,能实现基于规则的推理。由于SWRL具有良好的共享性和重用性,因此李从东等[3]将其作为事件本体的描述语言。

Z语言是一种形式规格说明语言,具有形式简洁、描述准确、可判定等特点。夏培福[4]使用Z语言对事件的断言要素进行描述。

1.2 事件本体构建工具

事件本体的构建工具主要为Protégé、OntoEdit、WebODE和OILED。本文从获取方式、协同工作方式、可视化等方面对上述事件本体构建工具进行分析和比较,如表2所示。

表2 事件本体构建工具比较

工具性能ProtegeOntoEditWebODEOILED获取方式开源免费注册使用免费注册使用免费注册使用协同工作✕ ✕可视化 ✕ ✕本体库 ✕ 体系结构单机单机、C/S三层单机可扩展性 ✕本体存储文件/数据库文件/数据库JDBC文件导入格式RDF(s)等RDF(s)等CARIN等OIL等输出格式XML等DAML+OIL等RDF(s)等OIL等公理语言PALFlogicWABDAML+OIL推理引擎内置PAL、外附JessFaCTFlogic内置OntoBroker内置Prolog,外附Jess内置FaCT一致性检验

从表2可以看出,事件本体构建工具具有多样性和差异性,这是由于知识表达形式和事件本体描述语言的不同所造成。每种事件本体构建工具都有各自不同的优势,因此根据不同的需求被应用于不同的场景。这导致构建工具缺乏统一的标准,容易造成不同领域知识的互联互通受阻与异构系统的互操作困难。

微波理疗治疗是一种结合了现代化手段的外治法,其能够针对患处进行作用。在照射的过程中,可实现对体内电介质偶极子,从而使得在转动以及振动期间,彼此与周围媒介能够进行相互摩擦,产生热作用,帮助照射部位温度迅速升高,从而促使血管得到有效扩张,进而实现使得血液流通速度加快,并随之实现对局部营养的改善,帮助新陈代谢速度加快,更好的提升组织再生能力。

因此,未来的事件本体构建工具应从界面的友好程度、使用的难易程度、开放性、跨平台适用性、多人协作性、输入输出格式、多语种支持程度、事件本体的生命周期、事件本体的评估、事件本体的合并与集成、推理的程度等方面进行细化和完善,开发出一种功能更全备并且统一化的事件本体构建工具。

2 事件本体模型

事件本体是一种事件的知识表示方法[5]。在不同的研究领域中有不同的表示模型,总体上分为3种。

2.1 基于概念层级

基于概念层级的事件本体表示模型利用事件划分不同类别,但是并没有把动作要素作为核心,本质是传统本体。

Lagoze C等[6]提出一种ABC本体模型,该模型描述了事件中重要的概念,如情节、动作、Agent等。Lee等[7]建立的事件本体模型用于提取中文新闻文摘,该模型描述了事件概念和客观概念。Lin等[8]通过提取事件的构成要素来构建本体,并应用于文档信息检索。潘佩佩[9]提出一种基于语义句摸匹配的算法,自动提取节庆事件信息,并在图论的基础上实现了语义路径检索。Teymourian等[10]针对通用领域,提出顶层事件本体模型,该模型描述了时间、地点、方式等通用概念。Van Hage等[11]为描述事件实例设计了SEM模型。上述模型都没有描述事件间关系和事件要素间关系。于是,Scherp等[12]提出了一种名为F的事件表示模型,但该模型仅仅描述了事件关系中的因果关系,缺乏对其他关系的研究。Silver等[13]提出的事件本体模型(DeMO)仅仅描述了事件间的分类关系。

2.2 基于逻辑层级

事件本体模型的描述语言有OWL、SROIQ、SWRL和Z语言。

Ω=(ν,D,Φ,≤,begin,end,location,δ)

(1)

式中:ν为词汇符号集;D为所有的实体域;Φ为所有断言和推理的公式集;≤为所有实体域的序关系;begin,end,location为实体域上的函数;δ为一种解释结构。

Liu等[16-17]使用扩展的描述逻辑和逻辑程序构建模型,用于描述确定性动作和不确定性动作。

上述模型都可以描述事件间的关系,但是并没有考虑动作要素,所以缺乏对事件的动态性描述。

2.3 基于事件六元组

事件六元组是刘宗田等[18]提出的一种事件表示方式,定义为

一般来说,坡度对滑坡、崩塌的发育亦具有重要的控制作用。研究区中部平原区坡度一般小于10°,东北部坡度最高,以大于60°为主(图2)。

e={A,O,T,V,P,L}

(2)

式中:A为动作要素;O为对象要素;T为时间要素;V为环境要素;P为断言要素;L为语言表现。

事件六元组以动作要素为核心,能够对事件进行动态性描述。在此基础上,提出了基于事件六元组的事件本体三元组模型。该模型定义为

事件本体构建方法按照人工参与程度分为两种:手动构建方法和半自动构建方法。基于事件六元组的表示模型都是采用半自动的构建方法。基于概念层级和基于逻辑层级的表示模型多数采用半自动构建方法,部分规模不大的本体采用手动构建的方法。根据构建过程中采用的技术不同,事件本体的半自动构建方法分为统计主导和语言学主导。

(3)

式中:ECS为事件类的集合;R为事件类间关系的集合;Rules为推理规则。

刘炜等[19]引入顶层事件类并进一步提出一种四元组模型,定义为

EO={UECs,ECs,R,Rules}

事件本体模型中事件类是以动作要素为核心。因此,对于事件类的抽取可以看作是对于核心动词的提取。句子中核心动词是支配其他成分的中心成分,并且所有受支配成分都以某种依存关系从属于支配者。因此,可以使用依存句法分析揭示句法结构并抽取核心动词。本文提出一种基于句法语义特征的事件类抽取方法。该方法通过将2个实体各自的依存句法关系进行组合,获取依存句法关系组合特征,利用依存句法分析和词性标注选择最近句法依赖动词特征。

(4)

式中:UECs为顶层事件分类的集合。

从表4可以看出,大多数事件本体的构建方法都是针对特定领域。由于事件的分类标准没有统一的规定和准则,所以不同领域中事件本体的层次结构存在一定的差异。骨架法、六步法、七步法的优点是具有演进和优化评价,有助于事件本体的复用和价值提升。循环五步法在共享和评价方面有所欠缺,没有形成有效的评价体系,复用性不强。这几种方法的成熟度由高至低依次为六步法、七步法、TOVE法、骨架法、循环五步法。手动构建的方法灵活性低、成本高、效率低、主观性较强、扩展性较差。所以,自动或半自动的构建方法成为目前的研究重点。目前,事件本体构建方法都是手动和半自动的,还没有完全成熟可用的自动构建方法。

王宇[21]引入事件类属性并进一步提出了一种五元组模型,定义为

根据各个因素之间的重要性关系进行设计判断,经分析之后,采用统计归纳的方式,判断矩阵元素值,构造出判断矩阵。

EO={ECS,DPS,R,W,Rules}

(5)

式中:DPS为事件类共有属性和特有属性的集合;R为描述事件类间在时间上或逻辑上的关系集合;W为ECS中任意2个事件类间相关性因子取值的集合;Rules则是自定义规则,用于补充公理。

2.4 事件本体表示模型比较

从表3可以看出,所有的事件本体表示模型都对事件要素进行了描述。基于概念层级的事件本体模型将事件表示为实体概念的一个子集,缺少对事件间关系的描述。基于逻辑层级的事件本体模型将事件表示为逻辑结构,能够对事件间关系进行描述。这两种事件本体模型都缺乏对事件的动态性、语言表现和事件要素间关系的说明。只有基于事件六元组的事件本体模型对事件的动态过程、语言表现和事件要素间关系进行详细描述。目前,针对事件本体的研究还不够完善,很多事件本体模型并非真正意义上的事件本体。事件要素的提取是一个难点,仍需进一步研究。

表3 事件本体模型比较

类型事件要素动态性事件间关系事件要素间关系语言表现基于概念层级有无无无无基于逻辑层级有无有无无基于六元组有有有有有

上述几种不同类型的事件本体模型的特点如表3所示。

3 事件本体的构建方法

EO={ECS,R,Rules}

3.1 手动构建方法

事件本体手动构建的方法主要有骨架法[22]、TOVE法[23]、循环五步法[24]、六步法[25]和七步法[26]

骨架法从事件本体的预测、分析、表示、评价和确定这几步来构建事件本体,具体流程如图1所示。

图1 骨架法流程

TOVE法可以清晰地展示出本体的优劣,但缺少循环迭代的过程。具体过程如图2所示。

④ 朱星.金瓶梅的故事梗概和主要人物评介[J].河北大学学报(哲学社会科学版),1980(03):89-98.

图2 TOVE法流程

循环五步法可以多次开发,准确性较高,但是构建难度较大、时间长、成本高,常用于小规模构建,对于大规模构建鲁棒性低,其流程如图3所示。

图3 循环五步法流程

六步法是在骨架法和七步法的基础上提出,针对自然灾害领域,缺乏通用性。具体流程如图4所示。

图4 六步法流程

七步法侧重于知识表示的具体过程,缺少本体构建实际过程中前期知识采集、分析以及后期评价等步骤。具体过程如图5所示。

图5 七步法流程

上述5种事件本体的构建方法的特点如表4所示。

表4 事件本体手动构建方法比较

名称可扩展性本体评价主要应用领域骨架法有有企业TOVE法无有企业循环五步法有无语义网络六步法无有自然灾害七步法无有医学

该模型能够弥补传统本体模型存在的概念离散、缺乏动态性表述、推理性弱等不足,常被应用到工厂废气排放、化学品泄漏等环境污染突发事件[20]中。

3.2 半自动构建方法

3.2.1 统计主导的方法

统计主导的构建方法主要采用聚类、词频统计、词共现分析等技术。其主要思想是词汇单元间的共享信息能够为识别它们之间的关系提供指示信息,因此可以用于事件本体构建过程中的事件抽取及事件间关系挖掘。

王宇[27]首先结合PageRank和Reverse Page Rank算法,提出一种综合考虑入度和出度的事件重要度算法,把重要度较高的动作属性作为事件类;然后使用事件类的相关性因子表示2个事件间的关联程度。统计分析结果发现,事件类间的关系与相关性因子的取值有关。最后,根据相关性因子的取值划分阈值,确定事件类间的关系。

商品市场一体化的测度将着重从价格市场一体化来进行测度。我们以相对价格的方差视作市场一体化程度的动态指标。通过选取北部湾经济区2008年—2011年4个主要城市的6种主要商品的价格数据来描述出市场的一体化进程。在处理相对价格方面,本文将采用相对价格的一阶差分形式来进行计算,即:

Hou等[28]提出一种基于图的事件本体构建方法。图中的结点表示事件类,边表示事件类间的关系。该方法采用基于随机漫步的权重分配算法来计算每个事件类与目标领域的关联程度。

统计主导的方法使用的自然语言处理技术较为简单,在非分类关系的抽取上不够理想。但是适应性和灵活性强,可以应用于不同领域,尤其是现有深度自然语言分析技术效果有限的领域(如化工领域、煤矿领域等)。

3.2.2 语言学主导的方法

自然语言处理的深层分析技术被广泛地应用在语言学主导的构建方法中,例如词性标注、句法分析、依存分析、语义角色标注等[29]。语义词典、语义模板、词汇-句法模板等语言学相关资源,也被广泛地应用在构建的各个过程中。语言学主导方法的基本思想是事件以及事件间的关系隐式地存在于输入文本中,因此需要通过句法分析等自然语言处理深层分析技术来挖掘文本中各个片段之间的潜在关联。

带班育人是班主任最基本的实践活动,这些活动是增长班主任才干的广阔舞台。有专业理想的班主任要争取尝试不同地区、不同学段和不同类型的班级,“遍历”各种情境。通过带班实践,师生朝夕相处,既可以培养班主任献身教育事业、热爱学生的高尚品德,也可以培养班主任的工作能力。

以语言学为主导的构建方法,基本思路是首先使用自然语言处理工具先对输入文本进行预处理, 并得到每个句子的PCFGs句法分析结果以及依存句法分析结果;然后,以动词为核心进行事件或事件类的抽取;最后,通过预先定义或者分析规则抽取事件类间的关系。

语言学主导的方法由于对文本进行了深层次的分析,所以在非分类关系的抽取上效果更好。但是由于该类方法对自然语言处理技术依赖度高,所以对那些缺乏训练数据或相应自然语言处理模型训练不充分的领域,难以达到预期效果。

4 事件本体自动构建方案

4.1 事件类抽取方法

2)增加河道基流。保障河流自净水量,通过对干支流水库的合理调蓄和调度运用,保证河流基本生态流量,提高水体承纳污染物的能力,改善水体水质状况。

首先,使用哈工大语言云LTP进行依存句法分析和词性标注;然后,通过依存句法分析结果和词性标注结果来提取一个句子中2个实体的最近句法依赖动词特征。最近句法依赖动词有2种类型,一是直接语义关联,二是间接语义关联。提取步骤为:①分别提取与2个实体存在并列关系或定中关系的依存关联节点;②提取与第2个实体的依存关联节点发生依存关系的最近动词;③提取与第1个实体的依存关联节点发生主谓或前置宾语关系的最近动词;④判断②、③中的动词是否为同一个或为并列关系,确定实体对的最近句法依赖动词。最后,使用k-means聚类的方法,对相似的动词进行合并抽象形成事件类。

4.2 事件类关系抽取方法

事件类间的关系有层次关系、组成关系、因果关系、跟随关系和并发关系。本文针对这5种关系提出一种基于长短期记忆神经网络和卷积神经网络深度机器学习的事件类关系抽取技术。

整体网络结构如图6所示。

图6 事件类关系抽取网络结构

第1层为输入层,用于对文本进行依存分析、分词等预处理, 得到所需的词序列及词汇表示特征; 第2层为向量表示层,使用word2vec训练出的向量模型表示词汇;第3层为循环神经网络,将处理好的语料输入LSTM单元进行训练;第4层为卷积神经网络,把LSTM单元的记忆输出按正向和反向的输出结果通过卷积神经网络得到2个不同输入方向的表示;之后对所得的表示进行向量级联;第5层为池化层,使用最大池操作得到这条输入语料的最终向量表示;第6层为输出层,使用集成softmax函数计算出语料的预测类别。

5 结束语

本文通过总结和对比现有的事件本体表示模型和构建方法,阐述了事件本体的研究现状,并提出了一种事件本体自动构建方案,为以后事件本体自动构建方法的研究提供理论依据和方法思路。

现阶段事件本体的研究存在一些困难和挑战。在事件抽取上,面向开放域的抽取方法研究还处于起步阶段,仅在特定数据集上取得了比较理想的结果,普遍存在算法准确性和召回率低、限制条件多、扩展性不好的问题。

目前,绝大多数的事件本体都采用的是人工构建的方法,通过咨询专家来实现对相关领域的事件进行分类。因此,在未来的事件本体构建研究中,靠人工制定更新规则和手动构建的方式将会逐步降低比重,自动化程度将不断提高。如何提高自动化构建的有效性和准确性,是现阶段事件本体研究中需要解决的另一个重大问题。

第三是多层互动评价。首先,组织学生现场观看各小组处理旅游者投诉过程,学生通过现场观看各组处理投诉的方法及程序后,完成对各小组现场处理方法的评价,并进行自评、互评,将评价结果上传APP平台;其次,邀请各行业专家以第二教师身份在APP平台上了解各组学生处理投诉的全过程,并实现在线点评,同学们在听取行业专家及教师的意见和讲解,对问题的处理方法及技巧进行改进后,将修改结果再次上传平台。教师同时还请出得分最高的同学分享本次课学习体会。最后,教师依据典型性错误进行共性讲解,提出优化方法。

参考文献:

[1] 刘菲京.事件本体映射技术研究[D].上海:上海大学,2015.

[2] 刘炜,丁宁,张雨嘉,等.一种基于描述逻辑和要素投影的事件本体形式化方法[J].南京大学学报:自然科学版,2015,51(4):796-809.

[3] 李从东,谢天,李珺,等.基于SWRL的突发事件知识表达与链式演化推理[J].情报杂志,2012,31(5):55-61.

[4] 夏培福.事件本体断言要素的形式化研究[D].上海:上海大学,2015.

[5] Liu Wei,Tan Yue,Ding Ning,et al.An ontology pattern for emergency event modeling[C]//14th Intl Conf on Pervasive Intelligence and Computing.New Zealand:IEEE Transactions on Computers,2016.

[6] Lagoze C,Hunter J.The ABC ontology and model[J].Journal of Digital Information,2001,79(9):160-176.

[7] Lee C S,Chen Y J,Jian Z W.Ontology-based fuzzy event extraction agent for Chinese e-news summarization[J].Expert Systems with Applications,2003,25(4):431-447.

[8] Lin H F,Liang J M.Event-based ontology design for retrieving digital archives on human religious self-help consulting[C]//2005 IEEE International Conference on e-Technology,e-Commerce and e-Services.Hong Kong:Institute of Electrical and Electronics Engineers Computer Society,2005:522-527.

[9] 潘佩佩.民族节庆事件本体的语义路径研究[D].广西:广西师范大学,2016.

[10] Teymourian K,Paschke A.Towards semantic event processing[C]//Proceedings of the Third ACM International Conference on Distributed Event-Based Systems.NY:ACM,2009:29-33.

[11] Van Hage W R,Malaisé V,de Vries G K D,et al.Abstracting and reasoning over ship trajectories and web data with the Simple Event Model (SEM)[J].Multimedia Tools and Applications,2012,57(1):175-192.

[12] Scherp A,Franz T,Saathoff C,et al.A model of events based on the foundational ontology Dolce+DnS Ultralight[C]//Proc of the 5th International Conference on Knowledge Capture.NY:ACM,2009:137-144.

[13] Silver G A,Miller J A,Hybinette M,et al.DeMO:An Ontology for discrete-event modeling and simulation[J].Simulation,2011,87(9):747-773.

[14] Kaneiwa K,Iwazume M,Fukuda K.An upper ontology for event classifications and relations[J].AI,Advances in Artificial Intelligence,2007,30(6):394-403.

[15] Corda L,Bennett B,Dimitrova V.A logical model of an event ontology for exploring connections in historical domains[C]//Proceedings of the 10th International Semantic Web Conference (ISWC).Bonn:ACM,2011:303-310.

[16] Liu Wei,Xu Wenjie,Fu Jianfeng,et al.An extended description logic for event ontology [C]//Proceedings of the 5th International Conference on Grid and Pervasive Computing (LNCS).Berlin:ACM,2010:471-451.

[17] 刘炜,徐文杰,唐英英,等.基于扩展描述逻辑和逻辑程序的事件动作形式化表示与推理[J].计算机科学,2014,41(1):116-126.

[18] 刘宗田,黄美丽,周文,等.面向事件的本体研究[J].计算机科学,2009,36(11):189-192.

[19] 刘炜,刘菲京,王东,等.一种基于事件本体的文本事件要素提取方法[J].中文信息学报,2016,30(4):167-175.

[20] 刘炜,丁宁,杨竣辉,等.针对环境污染突发事件领域的事件本体模式[J].计算机科学与探索,2016,10(4):466-481.

[21] 王宇.煤矿安全事件本体构建及其查询扩展的研究与应用[D].北京:北京工业大学,2015.

[22] 易钢.应用Protégé构建中医药学本体方法研究[J].电脑知识与技术,2012,8(1):223-225.

[23] 段宇锋,黄思思.本体构建方法研究[J].情报杂志,2015,34(11):139-144.

[24] 解峥,王盼卿,彭成.本体的自动构建方法[J].电子设计工程,2015,23(15):39-41.

[25] 马雷雷,李宏伟,连世伟,等.一种自然灾害事件领域本体建模方法[J].地理与地理信息科学,2016,32(1):13-18.

[26] 岳丽欣,刘文云.国内外领域本体构建方法的比较研究[J].情报理论与实践,2016,39(8):119-125.

[27] 王宇.煤矿安全事件本体构建及其查询扩展的研究与应用[D].北京:北京工业大学,2015.

[28] Hou Xin,Ong S K,Nee A Y C,et al.Graonto:a graph-based approach for automatic construction of domain ontology[J].Expert Systems with Applications,2011,38(9):11958-11975.

[29] Fang Quan,Xu Changshen,Sang Jitao,et al.Folksonomy-based visual ontology construction and its applications[J].IEEE Transactions on Multimedia,2016,18(4):702-713.

刘思含,刘旭红,刘秀磊
《北京信息科技大学学报(自然科学版)》2018年第2期文献

服务严谨可靠 7×14小时在线支持 支持宝特邀商家 不满意退款

本站非杂志社官网,上千家国家级期刊、省级期刊、北大核心、南大核心、专业的职称论文发表网站。
职称论文发表、杂志论文发表、期刊征稿、期刊投稿,论文发表指导正规机构。是您首选最可靠,最快速的期刊论文发表网站。
免责声明:本网站部分资源、信息来源于网络,完全免费共享,仅供学习和研究使用,版权和著作权归原作者所有
如有不愿意被转载的情况,请通知我们删除已转载的信息 粤ICP备2023046998号