快捷分类

专业领域智能问答系统设计与实现

更新时间：2009-03-28

0 引言

随着海量互联网信息的爆炸式增长，如何从中获取高可信和高可用的知识变得迫在眉睫，且潜藏着巨大商机[1]。据英国莫里(MORI)调查公司的民意调查结果显示，只有18%的用户表示总能在网上搜索到需要的信息，49%的用户说他们对搜索引擎很失望，28%表示还可以，其余5%为不知道[2]。由此可见，当下基于关键字信息检索的方法改进完善空间还很大[3]。主要问题在于：检索返回的结果多且繁杂与用户意图相差甚远，用户需手动筛网页列表中有用的信息；关键字匹配技术只关注语言的语法形式忽视语义知识。用相对简单的词语或句子搜索无法准确刻画用户的真实需求，导致搜索结果差强人意。将自然语言处理、语义分析、人工智能等技术综合在一起的智能问答系统弥补了关键字信息检索方法的不足[4]。

1 系统分析

1.1 智能问答系统的研究现状

自1961年，首个回答美国职业棒球大联盟中有关比赛问题的智能问答系统由Green设计与实现[5]。经过了近六十年，智能问答系统得到了突飞猛进的发展。最先人工智能专家ELIZA[6]和ALICE[7]设计研发的基于模式匹配的问答系统。匹配用户问题与人工定义问题模板来获取问题答案，或者基于领域专家知识制定启发式规则推理获得相应的结果。代表系统还有MACSYMA[8]。但是由于这类系统的模式库和规则的构建非常困难，需要领域专家综合领域知识且受到知识理解的限制，对于新的领域知识往往缺乏相匹配的知识性能很差。随后产生的基于FAQ的问答系统[9]则侧重于将问题及相应的答案对存放在系统的知识库中通过提问相似度设置阈值找寻答案。由于这种方法实现较简单，目前较多商业化服务公司采用这种方法，比如百度知道[10]等。但系统的缺点是知识库的构建需要大量的人员参与，且比较耗时、系统灵活性低，问题的覆盖面低，无法引入推理、计算来解决一些复杂的问题。1994年，首个面向互联网的自然语言问答系统诞生。而基于无结构化文本的问答技术主要包括社区问答和基于问答式搜索的问答系统。与FAQ相似，系统通过在互联网上检索到与用户问题最为相似的问题，然后将相应的答案返回，比如微软的Encarta3[11]和麻省理工学院研发的Start1[12]等。这类系统的缺点是没有专业知识库的支撑，只能对有限类型的问题进行回答，在专业度较高的领域不适用，而且也不能够做推理。另一种，基于结构化数据的问答系统是将用户的自然语言转换成系统可识别的结构化查询语言(如SPARQL、SQL等)对知识库进行查询。其对事实类问题的回答较为准确，能够进行知识的推理和计算，Google Now服务上有58%的回答使用了Google的结构化知识数据，该知识库中有5亿个实体以及不同实体间35亿条的关系[13]。该系统的本质是挖掘问题的语义，将口语转变成系统可以理解的形式。随着智能手机的广泛使用，以苹果公司在iPhone手机中使用的Siri手机语音助手为代表的一系列语音助手也正在被大家广泛使用。

由上可知，当今主流问答机器人大都是基于面向开放领域的智能问答系统实现的。例如：以互联网语料和用户的聊天日志数据为基础的微软小冰[14]，以及用户搜索日志为基础的百度语音助手[15]等。然而，面向开放领域的问答系统对专业(金融、医学等)的问题无法返回较好的结果。且现有的人工服务存在回答不规范、响应速度慢、通用性较差、需要大量的人力和物力成本等问题，因此特别需要一套面向专业领域，只需要对语料进行简单标注就能得到良好效果的智能问答系统。所以本文主要对专业领域提出了一种基于本体和查询服务的智能问答系统设计方法。

1.2 领域智能问答系统框架

本文针对专业领域智能问答系统的需求，结合上述问题研究现状的分析，提出了智能问答系统的框架。本文有三个模块的主要贡献，如下所示：

1) 知识梳理模块：为使系统更好地理解用户所提问题与所对应的领域知识。本文将具有偏结构化、关联性强特征的领域知识存储在关系型数据库中，用本体把数据的概念、属性和联系抽取出来，这样本体的内容只是知识库中实体的领域含义和相关联系，而不包括整个知识库实例，为本体的建立和知识库的维护提供了很大的便捷。

2) 问题理解模块：为使系统更好地对用户的意图进行解析、纠正。本文将查询问题的查询结构抽象成相应的查询服务，然后用服务本体结合领域本体来描述查询服务。首先将问句进行语义解析，再基于语义的服务匹配算法将问题匹配到本体相应的描述服务上，最后将服务参数实例化以便调用服务实现查询。

2013年，“联盟”成立之前，在领导班子支持下，医院信息化系统被进一步转型，有了进一步的拆分和整合。“并非零散打碎后再重组，核心思想是一体化拆分，将各系统平台拆出。”孙岩国表示，这些动作基于医院班子医疗和质控管理的新思路，“拆完LIS拆PACS，再到电子病历，各自提升后，整体融合入新的、大的系统中运行。”他补充，这也正是相关流程改造后，医院从数年前日门诊量两三千人次，至而今八千人次仍然运行流畅的重要原因。

3) 服务检索和反馈模块：将问题匹配的查询服务列表提供给用户供其选择，然后将用户想要的结果回馈给用户并保存查询上下文。主要解决三部分问题：(1) 由于领域知识具有专用名词中英文混杂、新词多和缺乏对应的词汇知识库或者语言库的特征，使用通用词典进行分词标注无法满足要求，由此本文根据领域知识库来创建领域词典；(2) 针对一词多义和中英文混合词性标注容易引入噪声等问题，使用基于条件随机场(CRF)实体识别算法对已经标注好的领域问题进行训练，以便在问句语义解析时准确的识别领域概念和其语义；(3) 针对自然语言描述问题存在的不符合语法规范、模糊性、二义性强，缩写多等特征，以及外界因素或者自身原因产生提问时掉字等情况。在系统中加入了基于声韵母的语音识别后文本纠错模块，用以修正用户提问时产生的问题描述错误。

2 系统总体设计

2.1 系统总体结构

针对面向专业领域智能问答系统的需求，构建系统的架构如图1所示。

记得，上大学的时候，因为喜欢乔丹，自己也曾那么喜欢过NBA。为了看总决赛，常翘课跑到商场甚至跑到小卖部蹭看电视。有一次，是在小饭馆里，为了讨得老板的欢心，我们几个人还煞有介事地要了一碗面。最后，比赛看完了，也把饭馆的几壶开水喝完了。还有一年，乒乓球世锦赛决赛，刚上班的我住集体宿舍，为了看比赛，竟然跑到一个刚结婚的同事家看到了半宿。两口子困得东倒西歪的，我却看得兴高采烈。比赛是午夜结束的，同事送我出来的时候，怏怏不乐。我全然顾不上这些，连连拍着同事的肩膀说，真好，真好，中国队赢了。

图1 系统总体结构图

(1) 将S转换成声韵母串VList，并设置词语的最低匹配度的阈值threshold，设置匹配度最高的匹配度mDegree=0，对应匹配的声韵母串长度matchLen=0。

刚毅顽强而又命如蝼蚁般卑微的掘矿人，生死往往只在一念之间。漫漫四千年的矿山开采，该有多少条精壮汉子的性命长眠于斯啊！

太湖新城地下空间工程位于太湖新城核心启动区地下，项目总建筑面积30万m2，占地面积6.8万m2，地下共3层，结合地铁4号线支线溪霞路站沿中轴大道南北向布置。地下1层为商业及公共配套设施，设置大量下沉式广场，进行地面地下交通转换。地下2层和3层为公共停车空间，共20万m2，可容纳停车2 800辆。该项目计划于2013年12月开工建设。

由于上下文关联会影响用户查询结果，因此在得到查询问句的语义二元组串以后，需要判断查询上下文是否存在关联性。如果存在则将上次查询得到的二元组串加入到本次查询的语义二元组串中，根据二元组串中元素的语义特征构造查询请求服务，并将请求服务与本体描述的查询服务相互匹配，将能够满足实例化条件的匹配度最高的查询服务作为匹配的查询服务。同时需要将查询的结果通过owl-s提供的实例化API查询的Web服务，然后将结果加入到查询上下文的数据表中以待下次查询使用。若无查询结果，则返回给用户“无结果”，以完成整个查询流程。如图2所示。

图2 系统总体流程图

2.2 基于本体的服务描述规则

服务是智能问答系统重要的一个环节，系统根据用户提问搜寻相匹配的查询服务，将查询参数实例化后调用服务，将最后的查询结果返回给用户。由于服务关系着查询的质量，针对服务的特征和实例化需要，本文定义了相应的服务描述规则和一些基本概念。如下所示：

hasOutput：概念属性，描述服务的输出。

Service：存放有关服务描述的相关顶层概念，下层存放与服务描述相关的概念知识。

ServiceInstance：存放系统所提供的查询服务实例描述的顶层概念，下层存放具体的查询服务描述。

2.2不良反应发生情况比较:观察组产妇不良反应发生率仅为9.38%,显著低于对照组的21.88%(p<0.05),详见下表:

OtherCondition：存放服务描述其他条件的顶层概念，可以在服务匹配时更容易定位到匹配的服务，比如用户问句的意图是查询或者是对比等。

OwlUrl：用于定位通过OwlsEdit编辑的可调用Web服务实例的位置，用于实例化匹配的服务。

hasInput：概念属性，描述服务的输入。

hasOwlInputSeq：概念属性，用于将用户查询生成的服务输入参数实例与对应真实的Web服务参数匹配，也即服务的参数与参数实例的映射关系。

Domain：描述领域的顶层概念，下层存放与领域相关的概念。如描述时间的概念Time和描述地点的概念Region等。

由此可见，该模板训练后得到词性标注的准确率为：P=0.933 164。

我国是世界上人口最多的国家，为了养活占世界22%的14亿人口，早在20世纪80年代，我国就已经开始了转基因技术的研究。到目前为止，我国总共有七种转基因农作物获得农业转基因生物安全证书，其中转基因棉花和木瓜已经农业部批准获得了商业化种植的许可。此外，转基因大豆和转基因油菜等五类农作物和其涉及的17种农产品被国家农业部要求进行强制性标识。[1]这说明，我国对于转基因食品持非常谨慎的态度。

comment：概念注释，用于描述ServiceInstance下查询服务的功能。

服务的结构如图3所示。

图3 系统服务结构图

2.3 命名实体识别策略

2.3.1 基于声韵母的语音识别后文本纠错方法

语音识别的准确率直接关系到领域相关命名实体识别以及服务匹配和实例化的准确度，基于声韵母的语音识别后文本纠错方法主要解决：未登录词处理、交际型歧义字段、组合型歧义字段、混合型歧义字段等问题。

本文根据领域知识库构建相应的领域词典，领域词典的中单个元素是领域相关词和该词在领域中的概念的二元组，由于可能会存在一词多义的情况，所以概念存在有多个的情况。汉字是以音节为识别单元，而音节是由声母与韵母组成。基于这些特点本文提出基于声韵母的语音识别后文本纠错方法。通过将语音输入法转换后的查询文本句转成声韵母串，然后根据领域词典做声韵母的相似度比较进行矫正和分词。该算法的主要步骤如下：

(2) 当服务请求的参数所对应概念是待匹配服务参数中概念的超类时，这时满足查询需求互相匹配。

2.4.2 服务调用与上下文管理策略

系统的总体流程为：用户自然语言查询后，由通用的语音输入法将语音转换成文本句，其次基于声韵母的语音识别后文本纠错方法矫正文本句，得到正确的领域相关词语等。基于词典纠错的过程在纠错同时也对文本分词，针对一词多义的情况需要根据同义词典进行同义词转换。然后基于条件随机场模型对查询问句作实体标注，得到对应的<领域词，词语含义>二元组串。

(2) 如果VList中元素全部匹配，则匹配结束，返回TokenList。

(3) 如果VList中元素还有未匹配，对于领域词典中每个词语w，根据w.ih获取其声韵母串长度len。

Sperber和Wilson在《关联性：交际与认知》一文提出了关联理论。他们指出语言交际是一个认知--推理的互明过程。之后，Gutt在其博士论文《翻译与关联：认知与语境》一文中将关联理论应用于翻译。赵彦春(1999)把翻译定义为是一个对原语(语内或语际)进行阐释的明示--推理过程。更确切地说（赵彦春，2001）翻译不是静态的代码转换，而是以关联为准绳，尽量使译文向原文趋同的动态行为。也就是说翻译必须要以最佳关联为准则，使读者花费最小的努力获得最大的语境效果；译文必须使原文作者的意图与译文读者的期待相吻合。

(4) 分别计算VList中未匹配串长度为len-1、len、len+1的声韵母串与w.ih的匹配度记为m1、m2、m3，其中最高的匹配度记为m,对应的长度记为mLen。

(5) 如果m≥threshold，且m>mDegree，则mDegree=m，t.k=m.k，t.v=m.v，matchLen=mLen。

(6) 遍历领域词典后，如果mDegree==0,则将VList中待匹配串后移1位；如果mDegree>0，则将VList中待匹配串后移matchLen位，并将t加入TokenList。

(7) 将t置为空，mDegree置为0，matchLen置为0。

(8) 转到步骤(2)。

对于步骤(4)中的声韵母串匹配度的计算，假设待匹配声韵母串长度为d，与之匹配的领域词典中词语的声韵母串长度为n，两者的非连续匹配串长度为m，则两者的匹配度为式(1)所示:

MatchDegree=m^2/(d×n)

(1)

2.3.2 基于条件随机场的实体标注策略

“我们是为艺术而脱！我们是为艺术而脱！”叶晓晓在回去的车上不停地念叨着这句话，她需要这句话给她力量，让她迅速地膨胀起来。

本文采用条件随机场对分词后出现一词多义的情况进行准确的词性标注。训练和测试样本为人民日报1998年的中文标注语料库，语料格式如图4所示。

图4 人民日报语料图

语料的每条记录都是由编号和一段句子组成，而且语料已经对编号和句子中词语做了词性标注，由于训练时不需要记录的编号，本文对语料进行了预处理，得到的可供训练的样本如图5所示。

图5 人民日报训练语料图

选取的特征窗口长度为7，包含7个单词特征与6个二元组合特征，特征模板如图6所示。

图6 人民日报训练语料图

该模板中，#代表注释，U00中U表示选用的是Unigram模板，00代表记录的编号，%x[s,o]代表生成一个CRFs中的点(state)函数:f(s, o)。其中t时刻的标签(output)与上下文分别用s和o表示，以“中国/ns共产党/n成功/a地/u召开/v了/u第十五/m次/q全国/n代表大会/n”为例，假设当前行在“召开”，此时的特征上下文如表1所示。

表1 用户查询记录表

特征模板意义代表特征U00：%x[-3，0]-3行，0列共产党U01：%x[-2，0]-2行，0列成功U02：%x[-1，0]-1行，0列地U03：%x[0，0]0行，0列召开U04：%x[1，0]1行，0列了U05：%x[2，0]2行，0列第十五U06：%x[3，0]3行，0列次U07：%x[-3，0]/%x[-2，0]-3行0列与-2行0列的组合共产党/成功U08：%x[-2，0]/%x[-1，0]-2行0列与-1行0列的组合成功/地U09：%x[-1，0]/%x[0，0]-1行0列与0行0列的组合地/召开U10：%x[0，0]/%x[1，0]0行0列与1行0列的组合召开/了

hasOtherCondition:：概念属性，用来描述服务的其他描述条件，与OtherCondition匹配。

此外，由于产业是“具有同种属性的企业经济活动的集合”，当产业风险发生时，同一产业内的企业都会受到影响，这容易引发大规模的风险损失，且存在着风险随产业链传导下去的可能性。因此，加强和健全产业风险评价体系的建设对提高我国商业银行风险管理工作有效性有着非常重要的意义。

2.4 服务匹配及查询上下文管理策略

2.4.1 基于领域概念层级的服务匹配算法

服务匹配的目的是将用户提问映射到对应的查询服务上，需要将<领域相关词,语义概念>的二元组串映射到一个基本服务中。本文建立基于概念层级的匹配方法，将输入和输出的服务参数与对应领域概念进行匹配并划分为如下五种：

(1) 当服务请求的概念与待匹配服务中概念是一个概念的时候，该匹配吻合。

输入：用户查询文本句S，领域词典WList={w1,w2,w3…,wn}，对于每个w∈WList，都有w=<k,ih,v>，k表示单个领域词，ih表示该词语的声韵母表示，v代表词语的领域含义。

门诊登记的合并PE的ED患者508例，最终完成治疗并纳入本研究的共381例。平均年龄(32.8±1.3)岁，平均已婚时间(6.6±1.1)年，ED和PE平均患病时间分别为(2.85±0.7)年和(1.89±0.9)年。

(3) 当服务请求中相同类型的参数有多个(包括一个)实例，而待匹配服务中该参数也是相同概念的数据集时，两者相互匹配。例：“查看湖南省2015年的GDP。”，服务请求的输入参数有GDP是一个indicator，同时待匹配服务输入参数中有indicatorSet，则两者是匹配的。

(4) 当服务请求的参数所对应的概念是待匹配服务参数中概念的子类时，由于二者参数不匹配，当实例化时参数类型会出现错误，则匹配失败。

(5) 当服务请求的参数所对应的概念与待匹配服务参数中概念的子类无关时，同样实例化时参数类型会出错，也会造成匹配失败。

甲状腺结节是当前临床研究过程中常见的的一种疾病，恶化的几率比较低，多数患者表现为良性。在现阶段的诊断过程中，超声方式的检查作用突出，超声检查相关指标对于患者自身而言有一定的影响，在良恶性分析阶段，必须提前明确评估声像的类型。超声检查相关指标对于甲状腺结节评估有重叠性的作用，结合特异性以及敏感性等可知，在临床报道中，要求确定结节纵横比例，一般情况下将≥1作为检测的具体标准。以敏感性为例，一般在30%左右。根据实际报道以及特异性诊断要求等，需要明确价值指标，提前进行敏感性分析。对于恶性肿瘤病变诊断的过程中，中央血管的诊断是关键，

输出：文本句对应的语义串TokenList={t1,t2,t3,…,tn}，对于每一个t∈TokenList,都有t=<k,v>，其中k是单个领域词，v为在领域词典中词语的领域含义。

服务匹配成功后需要对Web服务参数进行实例化并调用已完成整个问答过程，本文的Web服务是以wsdl描述的，然后经OwlsEdit工具编辑Web服务生成的wsdl文件得到了服务描述的owl文件。查询匹配到相应的服务描述本体后，通过服务的“hasOwlUri”属性可以定位到该文件描述的具体的服务，然后根据服务的“hasOwlInputSeq”属性来做服务描述本体中服务输入与该Uri对应服务输入的映射。一个简单的映射如图7所示。

图7 服务映射关系图

图的左边是服务本体描述的一个服务，右侧是使用OwlsEdit工具通过wsdl文件生成的该服务的描述。可以看出，右侧服务的语义特征模糊，左侧服务的“Uri”映射到右侧服务节点，其“hasInput”和“hasOwlInputSeq”属性的值是一一对应的，可以从上图中得到。输入的“date”概念与“para2”映射，输入的“region”概念与“para1”映射，输入的“indicator”概念与“para3”映射，而右侧服务是带有参数类型的信息，这样就可以将服务输入参数的实例映射到服务对应的参数上，实现了服务的自动化调用。

在实践中，到访的张主任及李主任都对本次在居然之家进行的社会实践活动进行了肯定，鼓励同学们更加积极主动。

3 系统实现

本文设计与实现一个包含多种图表类型，支持数据联动，智能化的国民经济大数据可视化系统。为科研人员及政府决策人员查询各类经济数据、对比地区间发展差异、发现经济规律、制定切合实际的促进经济发展的经济政策提供简洁有效的帮助。本文系统将单一繁琐的经济大数据相互联系起来，用户可从各个方面对经济大数据进行解读，全面而深入地了解国民经济发展现状，分析导致经济发展现状的原因，进而预测经济发展趋势做出合理的经济决策，有效实时地调控经济制定恰当的政策向导。

本系统以国家统计局除港澳台外的31个省级行政区、2005年到2014年间包括工业、财政、金融等各行业共922 869条记录作为问答系统的知识库数据。构建服务描述本体时选取Protégé作为编辑本体的工具，建立领域概念与服务参数相应的联系，使用OWL本体描述语言对国民经济大数据领域下服务建模，图8是使用OntoGraf展示了部分服务描述本体。

图8 利用OntoGraf服务描述本体

用户可以通过在文本框中输入与语音输入查询问题，当语音输入实例一：“查看重庆的中稻和一季晚稻播种面积和农作物总播种面积是多少？”后，问答系统文本句纠错和实体标注结果如下所示：

由上可知，对“中稻和一季晚稻播种面积”识别错误，变为“通道，黑一金晚稻播种面积”。经过基于声韵母的语音识别纠错后得到了准确的查询语句，再通过同义词典将“查看”变成“查询”，“重庆”变成“重庆市”，最后识别出相应的实体。最后查询的结果如图9所示。

图9 实例1系统查询结果图

当用户语音输入实例二：“查询2014年GDP前3的地区有哪些？”后，问答系统文本句纠错和实体标注结果如下所示：

由上可知，问句中“GDP”需要同义词转换为“地区生产总值”以完成实体的识别和标注。最后查询结果如图10所示。

图10 实例2系统查询结果图

考虑到上下文相关查询的情况，在上一句的基础上，语音输入实例三：“对比这些地区的GDP与第一产业增加值之间的关系。”问答系统文本句纠错和实体标注结果如下所示：

该查询语音输入法识别准确，由于“地区”是RegionConcept，与上次查询的结果中三个地区存在指代关系，则将其地区加入到查询实体中查询结果如图11所示。

图11 实例3系统查询结果图

4 结语

本文针对现有的问答系统相关技术的不足与面向专业领域问答系统的需求，提出了面向专业领域智能问答系统的实现框架。并应用于“国民经济大数据查询系统”中，该系统验证了本文所提出智能问答系统框架的实用性，并且该框架具有较高维护性。由于本系统将查询服务以Web服务的方式调用，使其耦合性大大降低，具有很好的扩展能力。

辅助空间是人性化的最好体现，例如物品存放柜，在很多商场中，有明确标明禁止携带外来物品入场，此时顾客可将已经购买的物品存在前台或相应的存储柜，在离开时凭存取码取回。此外，餐厅、收银台等都是包含在辅助空间的范围内。人性化设计是基于消费者行为习惯的基础上完成的，在细节处体现商场对顾客的周到服务，增强其安全感。

目前，已有问答系统只能对简单的提问进行回答，针对语义的理解也处在浅层。因此，问答系统的研究还有很多需要深入挖掘的问题。未来面向专业领域智能问答系统的框架可以从考虑语义因素建立语料库，结合语义的纠错可以很大程度上提高文本纠错的效果。同时，由于本文提出的服务匹配模型只能实现单个查询问句对单个查询服务的映射，对于复杂的查询问句可能会存在一个查询问句映射到一个组合服务的情况，虽然可以通过owl-s组合多个Web服务到一个统一的接口，但是这种操作是手工实现的，对查询服务较多的情况不大适应，工作量也较多。未来可着重于根据查询的输入和输出条件实现多个服务自动组合和调用的研究。

参考文献

[1] 全球互联网状况统计[DB/OL].[2017-8-20]http://www.clickz.com/stats/.

[2] 顾雅枫.基于用户兴趣模型的信息检索研究[D].兰州大学,2009.

[3] Baeza-Yates R,Ribeiro-Neto B.Modern Information Retrieval[M].New York:ACM Press,2011.

[4] Burger J,Cardie C,Chaudhri V,et al.Issues,Tasks and Program Structures to Roadmap Research in Question & Answering (Q & A) [EB/OL].2000.http://www-nlpir.nist.gov/projects/duc/roadmapping.html.

[5] Green B,Wolf A,Chomsky C,et al.BASEBALL:an automatic question answerer[M].Readings in natural language processing,Morgan Kaufmann Publishers Inc.,1986:545-549.

[6] Weizenbaum J.ELIZA,a computer program for the study of natural language communication between man and machine[J].Communications of the Acm,1966,9(1):36-45.

[7] WallaceRS.AIMLoverview[EB/OL].http://www.pandorabots.com/pandora/pics/wallaceaimltu-torial.html.

[8] Rand R H.Computer algebra in applied mathematics[M].Pitman Advanced Pub.Program,1984.

[9] 秦兵,刘挺,王洋,等.基于常问问题集的中文问答系统研究[J].哈尔滨工业大学学报,2003,35(10):1179-1182.

[10] 百度知道[DB/OL].[2017-8-20] https://zhidao.baidu.com/.

[11] Dong X,Gabrilovich E,Heitz G,et al.Knowledge vault:a web-scale approach to probabilistic knowledge fusion[C]// ACM SIGKDD International Conference on Knowledge Discovery and Data Mining.ACM,2014:601-610.

[12] Suchanek F M,Kasneci G,Weikum G.Yago—A Core of Sematic Konwledge[C]// 16th international World Wide Web Conference,2007.

[13] Hermjakob U,Echihabi A,Marcu D.Natural Language Based Reformulation Resource and Web Exploitation for Question Answering[C]// Proceedings of TREC-2002,2002.

[14] 微软小冰[DB/OL].[2017-8-20]http://www.msxiaoice.com/.

[15] 百度语音助手[DB/OL].[2017-8-20]http://yuyin.baidu.com/.

作者

陶永芹

出处

《计算机应用与软件》 2018年第05期

上一篇：基于微服务架构的分布式测距系统的研究与设计

下一篇：一种基于Spark的分布式时态索引方法

《计算机应用与软件》2018年第05期文献

会话密钥协商协议研究进展作者：胡志言，杜学绘，曹利峰

投稿须知 2009/03/28

九宫八数问题的四种深度优先编程方法作者：马旭

一种基于LRFU缓存替换策略的HDFS客户端本地缓存设计与实现作者：谢磊，吴建华，廖卓凡，罗可

不确定情况下集装箱多式联运多目标规划作者：甄远迪，杨斌

一种格上基于身份的高效验证方案作者：刘芳，赵一鸣

基于Elman反馈神经网络的导线串扰问题预测作者：王锦锦，聂鑫，王伟，石跃武，相辉，杨静，朱志臻

面向知乎的个性化推荐模型研究作者：王振海，李晓昀

基于多数据库的模糊元关联规则挖掘方法作者：刘小燕，王健

基于备份的RAID6在线重构框架作者：徐伟

基于OLAP和聚类分析的关联规则挖掘方法作者：熊中敏，朱春卫，郭振辉，陈明

多源通用数据标准管理平台的设计和应用作者：李雪凝，刘丰源，王凌，李明航

机电产品概念设计系统模型与几何模型转换方法研究作者：褚长勇，梁合宜

海量异构科技文献信息资源的非结构化存储研究作者：李鹏程，刘应波，王锋，文若瑾

自适应蝙蝠算法优化PF的风力机桨距系统故障诊断方法作者：曹洁，杜永红，王进花

基于误差和能量值的瞬态非平稳信号分析方法作者：陈金香，王义，孙彦广，张云贵

基于微服务架构的分布式测距系统的研究与设计作者：向彬彬，马明星，童茂林，彭瑾，苏文秀，高秀敏

专业领域智能问答系统设计与实现作者：陶永芹

一种基于Spark的分布式时态索引方法作者：郑晓东，王梅，陈德华，张碧莹

桥梁健康监测及养护平台设计与实现作者：武智霞，韩鹏，郑树泉，黄慧颖

“大智移云”技术综述及“智慧农机”应用实例作者：马建斌，滕桂法，张玉新，张璠

基于均衡-GARCH模型的SHIBOR短期利率仿真研究作者：黄日朋，王学金

基于优化分治表的远程数据审计方法研究作者：毛颉，王红玉，陈云

基于时间效应与隐语义模型的高校图书馆的个性化推荐研究作者：李薛剑，刘梦雅，海健强，吴雪扬，余雪莉

无人直升机着舰控制仿真系统设计与实现作者：明浩，祖家奎

随钻测井仪器测试软件设计与实现作者：李传伟，祝环芬，杨亮，陈国兴，孙博文，符涛

面向数据库云化的企业级高性能一体机性能评价模型作者：庄岭，赵新建，李维，王召，籍天明

基于预测模型的HDFS集群负载均衡优化与研究作者：于磊春，陈健美，刘响，胡杨

基于重叠社区发现的信任网络聚类模型作者：刘梦霞，卢志刚

基于TSV-SSM的元数据管理平台的设计和应用作者：刘丰源，王凌

杂志信息网