快捷分类

基于文本挖掘技术的建成环境使用后评价研究

更新时间：2009-03-28

1 文本挖掘的背景与工具

建成环境使用后评价是指对建筑物及其环境在建成并使用一段时间后进行的一套系统的评价程序和方法。它关注的是建筑及其环境的实际使用情况和使用者的意见和需求[1]。传统评价方法受采集和处理成本等限制，样本数量通常较为有限，并且问卷中研究者的导向，使评价信息的开放性较低。而网络平台有大量用户评价信息，若对其进行收集分析，在一定程度上可以弥补传统方法结果的缺憾。数据挖掘技术能够较便捷的抓取大量数据，并挖掘其中的规律，其中对文字信息的挖掘分析称为文本挖掘[2]。采用文本挖掘技术可以方便的从网络平台上获取使用者的评价信息进行分析[3]。

费尔德曼先生介绍文本挖掘是“试图运用数据挖掘、机器学习、自然语言处理、信息检索和知识管理等方面的技术来解决大规模信息问题的研究领域。”[4]它首先开始于自然科学领域，在发展过程中逐渐延伸至人文社科领域。如在情报分析、图书馆文献检索中的应用；文学作品和历史学研究中对社会网络关系、时间空间演变信息的挖掘；经济学中对各地区经济属性和关系的数据进行的研究；法学研究中文本挖掘对案件分析、犯罪网络识别的辅助；关于社会调查、网络舆情、立场评价的情感分析应用等[5]。

整个上午，我们都关在屋里。中间去个茅厕，也是有个东洋兵紧跟着，站在茅厕外面。中饭时候儿，早上那个兵又来送饭。我刚要开口，他低头小声说：“你莫为难我。我帮不了你。”把东西搁桌上就着急走了。

文本挖掘针对的是较大规模的信息样本，离不开计算机的支持。许多研究机构开发了相关的软件，如IBM提供的“Intelligent Miner for Text”，SAS提供的“Text Miner”等商业工具；新西兰怀卡托大学开发的“Weka”，谢菲尔德大学自然语言处理研究小组开发的“GATE”等开源软件。本文选用的是新西兰奥克兰大学Robert Gentleman和Ross Ihaka等学者开发的“R”系统[ 6、7]。

对于文字信息的挖掘，主要有采集数据、清理数据及分析数据三个步骤[8]。针对建成环境使用后评价，源数据是使用者对目标建成环境的评价文字，按照研究者设定的提取规则软件批量抓取评价信息；之后软件将评价句和段落按照结构切分，转化为更易于分析的词语组合，称为分词，再剔除研究意义较小的干扰词语便于接下来的分析；数据分析是对评价文本的深入挖掘，相应的技术有词频分析、关联分析、聚类分析与分类分析等[9]。本文重点讨论词频分析对于建成环境使用后评价的支持。

2 文本挖掘技术的应用

2.1 数据采集

网络评价信息的数据采集渠道主要有三类：第一类是具有评价板块的网站，如大众点评网，这类网站的评价信息与目标环境相对应，且有一定的格式；第二类是社交平台，如微博、微信等，这类评价信息没有明确格式，通常与大量无关信息结合在一起；第三类是一般的网页，包括新闻稿件、论坛帖文等，这类评价由于分布广泛散碎，最难收集[10]。本文以国家大剧院、上海大剧院和广州大剧院作为目标建成环境，应用文本挖掘技术采集和分析使用者对三座剧院的评价意见[11]。三个剧院的使用者评价意见主要是从第一类信息渠道获取，其中自2008年2月2日至2016年12月10日收集到国家大剧院评价信息4 4 0 9条，自2 0 0 8年1月2日至2 0 1 6年1 2月10日收集到上海大剧院2703条，自2008年9月18日至2016年12月10日收集到广州大剧院评价信息600条。国家大剧院的关注度最高，因此搜集到的信息也最多，而广州大剧院建成时间较短，相应评价信息较少。大规模数据挖掘常会遇到数据杂乱、错误的问题，但由于基础数据量较大，因此可以弱化不精确带来的瑕疵，而将重点放在数据的关系上[12]。

表1 分词词语词频统计表

剧院国家大剧院上海大剧院广州大剧院总分词词语数目（词频≥2） 7190 5758 1943总词频数 93320 59875 12100

图1 国家大剧院词云图（词频＞50）

图2 上海大剧院词云图（词频＞30）

图3 广州大剧院词云图（词频＞8）

2.2 数据清理

对数据进行清理的关键是分词，将每一句话分割为有意义的词语，如某位使用者的评价为“造型新颖独特”，分词之后成为“造型”“新颖”“独特”三个词语，每个词语成为待处理的单一对象，便于软件统计分析词语之间的关系[13]。评价中除了评价的客观目标词（如“外观”）和主观意见词（如“壮观”）之外，还有大量的连接词、虚词等，剔除这部分词语对于理解使用者的评价意见并没有影响。分词后的词语多为两个字以上，但也存在部分单字词，其含义较难明确，如“都”“去”，这类词出现频繁，对研究产生较大的干扰，因此在本次研究中将其剔除[14]。另外，研究着眼于使用者对于剧院建筑方面的评价，而演出的剧目名称和内容、票价的高低、观众素养等暂时并不列入研究范围。

2.3 词频统计

虽然使用者在剧院的体验各不相同，评价意见的表达也呈多样化，但仍可以发现很多相似之处，某方面被提及的次数越多，越能说明此方面是使用者普遍比较重视的。词频分析正是为了研究这一内容[15]。具体方法是针对清洗后的数据建立词语-词条矩阵。矩阵以横坐标为每一条评价词条，纵坐标为分词后词语，列出每个词语在每个词条中出现的次数，合计得到各分词词语的总词频数[16]。

统计词频为2以及2以上的分词词语情况（表1），并通过词云图来展示各词语词频高低情况。为获得较好的可视效果需设定词频下限，三座剧院的基础数据量差异较大，因此选取不同的词频下限绘制词云图，使每张词云图包含大约300个词语，如图1～3。由三座剧院的词云图可直观展示词语的词频高低情况，越靠近词云图中心位置且字体越大的词语词频越高。由图可见三座剧院的高频词语有很大的相似度，正反应了大部分提供评价的使用者所关注的重点很相似。

2.4 关键词提取

关键词是体现评价特点的词语，而高频词语中大部分为常用词，因此需要为词语赋予权重以突出关键词[17]。采用TF-IDF加权法，即词语的词频率（TF）乘以逆向文档频率（IDF），TF是词语词频数与词语总数的比值，IDF是衡量词语重要程度的度量，词语的IDF值由语料库中总文档数目与包含该词语的文档数目的比值的对数得到[18]。其含义是某词语的重要性跟包含这个词语的文档数目成反比，文档数越少，说明该词语具有较为特殊的含义。其中语料库是大量文档的集合，根据需要自定义制定。

子项目的频次情况和5大类评价因素排序情况有很大程度的一致性。由此可以发现，使用者最为关注剧院演出时视听效果；其次是在剧院内活动时的生理感受；在满足生理需求的基础上对艺术也有一定的要求，尤其是室内的装饰布置，而建筑造型反而较为靠后；停车和剧院位置也是主要的关注因素；此外优质的服务和热烈的气氛可以给观众带来较好的观演体验。

2.5 关键词分析

从具体关注点上讨论，管理因素类别中无论是文本挖掘分析下的关键词（表3）还是问卷调查中的高频次子项（图9），使用者都将关注点集中在“服务”一项上；功能因素类别下高频次子项（图9）是“视听效果”和“停车”两方面，在表3中主要是对声环境、具体功能区以及交通的评价；环境和审美因素类别下的高频次子项与表3中关键词有极大的相似性，均包括对建筑造型、装饰装修、室内环境感受的评价，区别在于剧场位置在网评中有提及但并没有较高的频次，且网评信息中有大量室外环境的评价，而问卷调查中此方面并没有成为使用者关注的重点；设施设备因素类别下高频次子项是“舞台设计”和“观众席座椅”两项，在表4中也有提及，另外在网评信息中灯光效果的评价有很多，而在问卷调查中较少被提及；社会因素类别中，问卷调查中的高频次子项“观演气氛”并未在网评中频繁出现，上海大剧院在城市当中的地位方面的描述在网络评价信息中较多次出现。使用者在网络上所做的评价内容更为丰富，并且更加贴近使用者的主观体验感受，思维不受过多理智的局限，不仅包含传统评价方法中使用者提供的关注点还能够发现其他忽视的关注重点，因此文本挖掘分析网络评价信息是对传统建成环境使用后评价方法的一个很好补充。

在课程进行到三分之一左右时开始发放文献阅读任务，此时学生既具有一定的知识基础，又有充分的时间完成任务。

上海大剧院三个时期主要变化是设施设备因素所占的比例有所下降，而环境和审美因素的比重则有提高，主要是前期评价者大多目的是观看演出，对室内各功能感受较多，而中后期有更多参观建筑造型和外部环境的使用者给予评价，因此提高了环境和审美方面的比重。从具体目标词来看，突出变化是环境和审美因素类别中后期增加了关于建筑外观以及内外环境的关键词，如“外观”“造型”“环境”等。

国家大剧院C因素类明显最受关注，主要是其与众不同的外观和水下空间给使用者较大的视觉冲击，因此描述造型的关键词较多；其次是B类功能因素，主要是对各功能区、交通便利程度以及声环境的评价。而对于视觉效果，由于用词丰富导致离散程度过高难以获得较高的TF-IDF值，因此未能入选；第三是D类设施设备因素，评价主要集中在座位、舞台和灯光三个方面上；A、E类因素则并不是使用者评价讨论的重点。

参与评价的使用者被请求对5大类评价因素进行关注程度排序，从最重要到最次要按顺序记为5分、4分、3分、2分和1分，统计最终得分结果如图8所示。根据各类因素得分可知剧院的功能因素是参与调查的使用者最为关注的重点，环境和审美因素也很受关注，设施设备因素和管理因素相对较次要，而社会因素则排在最后。为了研究形成评价因素排序的原因，请使用者选出8项比较关注的评价子项，以提及的频次为衡量标准，全部22个子项共被提及826次，平均每项的提及频次为37.5次，其中实际频次超过平均水平的有10项（图9）。功能因素类有两个子项入选，且视听因素是最受使用者关注的方面；环境和审美因素类有多达4项入选，其中室内艺术效果和物理环境舒适度受使用者关注度较高；设施设备因素有两项入选，且频次均较高，分别是舞台设计效果和观众厅座椅；排名靠后的管理因素和社会因素各有一项入选，分别是服务水平和观演气氛，相对其他入选子项频次略低。

表2 目标词语排序表

国家大剧院上海大剧院广州大剧院目标词 TF-IDF 词频数目标词 TF-IDF 词频数目标词 TF-IDF词频1 国家大剧院 3.052 1716 大剧院 2.367 1160 大剧院 1.220 202 2 大剧院 1.739 1057 上海大剧院 1.121 550 广州大剧院 0.930 154 3 里面 1.154 1447 小剧场 1.098 565 歌剧院 0.516 110 4 建筑 0.878 1057 剧场 0.831 562 建筑 0.485 162 5 剧院 0.839 721 剧院 0.580 411 剧院 0.455 107 6 音乐厅 0.716 506 舞台 0.527 405 里面 0.395 135 7 剧场 0.542 294 里面 0.525 530 设计 0.370 130 8 设计 0.488 585 广场 0.479 374 音效 0.316 50 9 地铁 0.375 298 建筑 0.454 450 舞台 0.303 78 10 外观 0.323 294 音响 0.383 258 环境 0.285 107 11 歌剧院 0.315 247 中剧场 0.381 184 座位 0.229 54 12 环境 0.283 387 座位 0.380 267 音响 0.224 52 13 座位 0.277 246 环境 0.362 402 外观 0.209 52 14 内部 0.277 351 位子 0.265 162 剧场 0.203 42 15 小剧场 0.259 565 地标 0.260 142 地铁 0.203 40 16 舞台 0.240 405 位置 0.251 254 外形 0.165 42 17 入口 0.234 182 音效 0.248 116 夜景 0.164 29 18 夜景 0.206 149 灯光 0.240 192 灯光 0.151 41 19 设施 0.198 212 外观 0.211 151 歌剧厅 0.139 23 20 大厅 0.190 159 设施 0.188 158 位置 0.131 45 21 灯光 0.183 185 标志性 0.186 91 地标 0.130 24 22 装修 0.182 154 装修 0.167 109 装修 0.110 25 23 位置 0.179 227 交通 0.163 159 内部 0.107 37 24 造型 0.178 165 门口 0.146 129 造型 0.097 24 25 音响 0.171 143 大厅 0.145 101 洗手间 0.090 17 26 歌剧厅 0.168 102 设计 0.142 125 声学 0.083 18 27 水池 0.163 122 地铁 0.132 84 门口 0.083 23 28 服务 0.160 248 市中心 0.093 64 实验剧场 0.082 12 29 音效 0.156 91 电梯 0.091 64 服务 0.071 34 30 水面 0.153 166 入口 0.090 59 设施 0.065 19 31 停车场 0.136 111 吊灯 0.080 45 停车场 0.060 13 32 风格 0.136 165 内部 0.078 80 交通 0.058 20 33 交通 0.133 166 整体 0.077 85 观众席 0.058 11 34 通道 0.116 126 场地 0.074 52 布景 0.054 11 35 长廊 0.113 87 氛围 0.073 55 大厅 0.051 13... ... ... ...

表3 目标词语分类表

A管理因素 B功能因素 C环境和审美因素 D设施设备因素 E社会因素 F综合类国家大剧院服务音乐厅、地铁、小剧场、入口、大厅、音响、剧厅、音效国家大剧院、剧院剧院、剧场、歌剧上海大剧院小剧场、广场、音响、中剧场、音效、交通、门口、大厅、地铁、入口里面、建筑、设计、外观、环境、内部、夜景、装修、造型座位、舞台、设施、灯光、位置、水池、水面大剧院、上海大剧院剧场、剧院广州大剧院服务音效、音响、地铁、歌剧厅、洗手间、声学、门口、实验剧场里面、建筑、环境、外观、装修、设计舞台、座位、位子、位置、灯光、设施、电梯地标、标志性、市中心建筑、里面、设计、环境、外观、外形、夜景、装修、内部、造型舞台、座位、灯光、位置、设施地标大剧院、广州大剧院歌剧院、剧院、剧

图4 评价因素词频统计表

图5 国家大剧院评价因素比例图

图6 上海大剧院评价因素比例图

图7 广州大剧院评价因素比例图

广州大剧院的情况与国家大剧院相似，因拥有独特的外形和室内设计，C类因素成为使用者最关注的方面，B、D类因素的词频数基本持平，A、E类因素同样关注度最低。在具体的评价子项中增加了对卫生间的评价。

由以上分析可知最易引起使用者注意的是建筑的外部造型，但成为城市的标志并不能单纯以外观来认定，如上海大剧院，虽不如另两座剧院造型独特，但以较好的地理位置、大气的造型设计、考究的室内设计以及合理的功能布局依旧被许多使用者评价为标志性建筑。对于观演建筑视听效果是其极为重要的因素，使用者对剧院的声学效果有大量的评价佐证了这一点。而视觉方面由于用词较为丰富，如“看得清”“看见”“观看”等，数据离散，无法形成高TF-IDF值的关键词，因此未能入选。此外，还有交通也是大部分使用者所关心的问题。而细节方面，座位是否舒适和排布方式，舞台大小和灯光效果都直接影响视觉效果和观剧体验好坏。

1.3 统计学分析数据采用SPSS 22.0统计学软件对数据进行分析，计量资料呈正态分布，数据用均数±标准差表示，组间比较采用独立样本t检验，同组治疗前后比较用配对样本t检验。相关性采用Pearson相关分析法，P<0.05为差异有统计学意义。

2.6 阶段性分析

收集的评价信息时间跨度长达9年，这段时期中目标环境会有所改变，相应的评价也有变化的可能，因此将评价信息按照时间划分为三个阶段进行对比，2008年至2010年为前期，2011年至2013年为中期，2013年至2016年为后期。三座剧院后期评价信息远多于前期和中期，这是由于通过网络平台分享信息的人逐年递增，另外剧院从投入使用到如今所做出的宣传和完善也日见成效。将每阶段的评价进行同样步骤的清理和分词，计算词语的TF-IDF值并排序，提取前30个客观目标评价词作为关键词。将关键词按照表2分为6类，着重研究前5类评价因素，对比同一剧院不同阶段使用者评价目标的变化。

如图5、6、7分别是国家大剧院、上海大剧院和广州大剧院的评价因素比例图，色柱代表该类评价因素关键词的词频之和占全部关键词词频总和的比例。国家大剧院分阶段时期和全阶段时期的评价情况相似，变化主要在于环境和审美因素在中期和后期比重较高，而前期的使用者多提及功能和设施设备因素。从具体目标词来看，在中后期环境和审美因素类别中“环境”“夜景”两个关键词被使用者提及的频率增多。

每一年，CSA联盟会迎来全国多地的农场主参观、取经，他们学到技术之后用到自家农场的有机蔬果种植中去。“如今，我们做起了有机农场，也看到了农场对家庭、对孩子们的影响，这令我感到欣慰。”石嫣与联盟的成员们正依照“田园综合体”的标准打造各自的农场，在保障蔬果种植生态化、运输顺畅化的同时，加强“服务”环节，开展与种植相关的系列活动，让更多的百姓返璞归真，体验田间乐趣。

三座剧院有相当多重复词语，说明使用者对这三座剧院有相似的关注点。从包含的目标词语数目来看，B类和C类评价因素是评价者较多关注的方面。统计前五类评价因素包含的关键词的词频，如图4所示，词频趋势与词语数目有一致性。

广州大剧院前期评价状况和中后期有较明显的差别，由于广州大剧院2010年正式竣工，前期评价仅有18条，样本数较低。对比中期和后期，环境和审美因素比重略下降而其他因素比重略上升，这是由于建成之后演出增多，吸引了更多的使用者享受内部环境的演出，相应的使用者得以做出更为全面的评价。从具体目标词来看，功能因素类中使用者对剧院局部功能空间的评价增多，如出入口空间，歌剧厅和音乐厅等；环境与审美因素类中关键词增多，如增加了对建筑色彩、夜景和外部环境方面的评价；而设施设备因素类的关键词始终集中在在座椅、舞台和灯光三个方面。

3 网络评价信息与传统评价信息的对照

国内有不少关于剧院设计的研究成果，其中以陈向荣博士所做的研究最为深入，主要采用传统建成环境使用后评价方法对新建剧院进行评价分析。参考陈博士所做的研究，将剧院的评价因素划分为5大类22子项（表4）[20、21]。选用传统评价方法之一的问卷调查对三座剧院进行使用者关注度评价抽样调查，评价主体为普通观众，国家大剧院、上海大剧院和广州大剧院各获得有效问卷36份、29份和38份。

上海大剧院B、C和D类因素词频依次减少，但差距不大，这三方面较均匀的出现在评价者的讨论之中，A和E类因素与国家大剧院同样较少受到关注。与其他两座剧院的差异在于评价建筑外形以及室外环境的内容相对较少，而增加了对各种设施以及剧院在城市中地位的评价。

由于极限计算题目类型比较多，求解方法也因题目的不同而变化多端，这就要求我们对极限计算的各种方法进行归纳和总结，并能够熟练的根据不同(或相同)类型的题目运用不同的方法计算极限。下面以实例的方式介绍极限计算的方法。

使用者对大剧院关注的方面体现在评论中的客观目标词语上，如“外观”“座位”，因此研究的重点在拥有较高TF-IDF值的客观目标词语上。但TF-IDF值并没有明确划分高低的标准界限，而是通过数值对比来展现词语在文档中的重要性，因此按照TF-IDF值高低将词语排序，从中筛选出所需的客观目标词。目前仅能依靠人工进行甄别筛选，由于词语较多，因此从TF-IDF总排序前300的词语中进行筛选。三座剧院各筛选出30余个目标词，见表2，统一选取前30个作为研究的关键词进行分析。

对比传统问卷的分析结果和文本挖掘技术分析成果，从关注类别上看，两种方法中功能因素、环境和审美因素和设施设备因素是使用者主要的关注方向，而管理因素和社会因素则相对较少。但是，问卷调查中使用者对三座剧院的关注均是以功能因素优先，其次是环境和审美因素，再次是设施设备因素，然而在文本挖掘分析中使用者对国家大剧院和广州大剧院的关注点首先是在环境和审美因素类别上，且与功能因素类差距很大，仅上海大剧院的使用者关注功能因素类略多于环境和审美因素类。分析其原因有二：第一使用者易受问卷内容的影响，做出认为“理智”的判断而不是真实的自身感受，网络评价则多偏向于使用者记忆较深刻的审美方面，如建筑造型、内外环境等，尤其是国家大剧院和广州大剧院建筑造型较为新颖，更加深了使用者的印象；第二是在网络评价信息中有不少使用者仅参观了剧院外部空间，因此仅评价了外观、外部环境等，相反问卷调查由于样本数量少，且调查的主体大多是有进入剧院体验经历的使用者，因此评价不局限于某一类别中。

表4 新建剧院使用后评价因素集

pagenumber_ebook=102,pagenumber_book=100

类目 A管理因素 B功能因素 C环境和审美因素 D设施设备因素 E社会因素A1安全管理 B1视听效果 C1剧院外观造型 D1舞台设计效果 E1观演气氛A2开放时间 B2观众厅形状大小 C2室外环境 D2观众厅座椅 E2剧院宣传展示A3服务水平 B3配套空间 C3室内艺术效果 D3灯光照明 E3社会影响力A4卫生状况 B4楼梯电梯 C4物理环境舒适度子项D4建筑材料B5卫生间 C5剧院位置B6交通及停车

图8 五类评价因素重要性排序

图9 高频次子项

为研究使用者的评价方向，将表2词语分为6大类（表3）[19]。管理因素主要是剧院的服务方面的评价；功能因素包括各功能区、剧院视听效果和交通便利与否的评价；环境和审美因素包括建筑造型、内外环境和装饰装修方面的评价；设施设备因素包括灯光、舞台、观众席座椅和其他一些配套设施的评价；社会因素主要是关于剧院在城市中的地位的评价；综合类是较为笼统的评价目标词语，在分析中研究意义较小。

农村宅基地入市交易的“义乌智慧”（鲍建平） ............................................................................................1-16

总结

通过以上分析研究可以证实使用者对于三座剧院的关注重点主要在剧院的功能、环境舒适度、审美和视听设备方面，大量的评价信息分析为以往的经验性设计提供了数据支持，并且可以具体到每一个关键点，得知具体哪些细节给使用者留下深刻印象，如声环境、出入口、建筑的材质色彩、座椅和灯光等。而对于剧场的管理，服务方面的评价虽然相比较其他因素少，但依旧被使用者较多提及，此外建成环境的使用是长期的，需要对剧场进行良好的维护，而使用者的评价重点正是管理维护的重点，如保持内外空间的整洁有序，灯和座椅等设备的完好，做好剧院位置的指引，停车的疏导，以及剧院的宣传等，如此有利于提高使用者对重点关注方面的满意和认同。在本研究的基础上可以进一步利用关联分析、聚类分析等方法研究使用者对于评价目标的褒贬态度[22]，以发现剧院设计和管理的精彩之处和不足之处，为之后的借鉴和弥补提供依据。

问卷内容由四大部分组成，涉及居民个体的基本情况、居民对城市内涝灾害知识的了解情况、居民获取城市内涝灾害信息的渠道和防涝减涝意识和技能、居民在城市内涝灾害发生后的行为取向以及对政府工作的态度等多方面。见表1。

图、表来源

图1～3：软件生成；

表4：作者改绘自参考文献[6]；

其余图、表均由作者绘制。

当前，玉米在陆良县的种植区域虽然分布较广，但因农业生产条件仍有待提高，玉米生产机械化水平仍要低于其他地区。具体来说，主要存在以下几个问题：

参考文献

[1]吴硕贤. 建筑学的重要研究方向——使用后评价[J]. 南方建筑，2009(1)：4-7.

[2]谢邦昌，朱建平，李毅. 文本挖掘技术及其应用[M]. 厦门：厦门大学出版社，2016.

[3]曹奇敏. 网络信息文本挖掘若干问题研究[D]. 北京：北京理工大学, 2015.

[4] Feldman Ronen, Sanger James. 文本挖掘（英文版）[M].北京: 人民邮电出版社, 2009.

[5]刘明岩. 面向语义关系发现的文本挖掘研究[D]. 南京：南京理工大学, 2010.

[6]张雯雯，许鑫. 文本挖掘工具述评[J]. 图书情报工作,2012，56(8)：26-31.

[7]罗玫，赵嵩正，蒋建洪. 模糊综合评价模型的R语言实现[J].航空计算技术，2011，41(4)：56-58.

[8]梅馨，邢桂芬. 文本挖掘技术综述[J]. 江苏大学学报自然科学版，2003，24(5)：72-76.

[9]陈晓云. 文本挖掘若干关键技术研究[D]. 上海：复旦大学,2005.

[10]许高建. 基于Web的文本挖掘技术研究[J]. 计算机技术与发展，2007，17(6)：187-190.

[11]西蒙·蒙策尔特，克里斯蒂安·鲁巴, 彼得·迈博纳，等.基于R语言的自动数据收集:网络抓取和文本挖掘实用指南[M].吴今朝，译. 北京：机械工业出版社，2016.

[12] Tan A H, Ridge K, Labs D, et al. Text Mining: The state of the art and the challenges[J]. Proceedings of the Pakdd Workshop on Knowledge Discovery from Advanced Databases, 1999: 65-70.

[13]吴杭冬. 基于网络点评数据的剧院使用后评价研究[D].杭州：浙江大学, 2016.

[14]王媛，许鑫，冯学钢，等. 基于文本挖掘的古镇旅游形象感知研究——以朱家角为例[J]. 旅游科学，2013，27(5)：86-95.

[15]谌志群，张国煊. 文本挖掘研究进展[J]. 模式识别与人工智能，2005，18(1)：65-74.

[16]李梅. 文本挖掘中若干关键技术研究[D]. 杨凌：西北农林科技大学，2016.

[17]伍星，何中市，黄永文. 产品评论挖掘研究综述[J]. 计算机工程与应用，2008，44(36)：37-41.

[18]康东. 中文文本挖掘基本理论与应用[D]. 苏州：苏州大学, 2014.

[19] 朱小雷. 建成环境主观评价方法研究[D]. 广州：华南理工大学，2003.

[20]陈向荣. 我国新建综合性剧场使用后评价及设计模式研究[D]. 广州：华南理工大学，2013

[21]陈向荣，吴硕贤. 基于主观评价法的现代剧场满意度评价——以广州大剧院和湖南大剧院为例[J]. 华南理工大学学报(自然科学版), 2013，41(10)：135-144.

[22]王素格. 基于Web的评论文本情感分类问题研究[D]. 上海：上海大学, 2008.

作者

马越

出处

《南方建筑》 2018年第02期

上一篇：以职业教育推动传统建筑工艺传承的探讨

下一篇：以历史作为一种设计逻辑——拉斐尔·莫内欧在阿托查火车站改扩建设计中的类型学方法解析

《南方建筑》2018年第02期文献

以智慧和汗水书写美好人生——何镜堂建筑人生展作者：张弯

迈向精细化的绿色建筑设计与运行优化作者：林波荣

重庆地区绿色建筑室内环境实测分析* 作者：丁勇，罗迪，洪玲笑

基于太阳辐射利用的寒地建筑组团形态优化设计研究* 作者：袁一美，韩昀松，梁静，孙澄

我国既有公共建筑综合性能提升改造路线图研究* 作者：李晓萍，王俊，魏兴，杨彩霞，尹波

基于风洞可视化的环境性能建筑生形方法研究* 作者：林钰琼，姚佳伟，郑静云，袁烽

绿色住区参数化优化设计平台的开发进展与展望作者：吴杰，张宇峰，吴扬，林宇

严寒地区建筑外墙外保温构造保温层经济厚度研究* 作者：金虹，邵腾，陈德龙，金雨蒙

使用MOEA的城市设计物理环境多目标寻优方法作者：袁磊，冯锦滔，许雪松

夏热冬暖地区装配式民用建筑混凝土预制外墙板热工性能分析作者：赵立华，段骁健，郑林涛，孟庆林

夏热冬冷地区近零能耗建筑技术途径探索* 作者：宋德萱，韩抒言

基于天然采光性能的建筑中庭形体设计导则研究* 作者：吕帅，林波荣

建筑热缓冲空间的设计理念和类型研究*——以国际太阳能十项全能竞赛作品为例作者：石峰，金伟

中西建筑文化融合下的苏州杨家桥天主堂作者：张康，虞彬

小城镇历史街区的“自然生长”改造模式——以黄屯老街为例作者：马青锋，张鑫，郑先友

解码历史照片——陈家祠水塘复原研究作者：林畅斌，郑力鹏

吴哥古迹保护修复的实践与理念发展脉络作者：肖磊

以职业教育推动传统建筑工艺传承的探讨作者：袁玉康，郑力鹏

基于文本挖掘技术的建成环境使用后评价研究作者：马越

以历史作为一种设计逻辑——拉斐尔·莫内欧在阿托查火车站改扩建设计中的类型学方法解析作者：汪丽君，刘振垚

杂志信息网