更全的杂志信息网

基于自建语料库的语体与写作水平相关性研究

更新时间:2009-03-28

近年来,基于语料库的英语写作研究多关注词汇研究。相对而言,有关语体的语料库研究有所欠缺。雷秀云、杨惠中借鉴了Biber的多维度多特征模型对学术语体进行研究[1],文秋芳参照该模型对中美大学生的书面语的部分语体特征进行了对比[2]。潘璠运用多维度分析法,通过与本族语议论文对比,对中国英语学习者书面语语体特征做了全面系统的描述与对比[3]。然而,上述研究都是利用大型语料库,将不同英语水平的二语习得者与本族语学习者书面语特征进行客观描述或对比。直接、系统证明语体各维度特征与广大二语学习者写作水平是否相关、存在何种程度相关的实证研究则为数不多。因此,文章基于Biber所倡导的多特征/多纬度模型,自建小型语料库,对非英语专业学生的作文进行语体的多维度多特征分析,并将这些维度与特征与其作文成绩进行相关分析。

将社团活动和双创竞赛相结合,以竞赛推动学生实践:将创新创业融入学生社团的日常活动中,挖掘对自主创业有兴趣或具有创业意向的学生,帮助他们成立并发展双创社团和协会,指导学生组织各种双创活动。同时,积极号召学生参加“互联网+”“创青春”“挑战杯”等双创大赛,借助比赛一方面检验高校开展创业教育的学习效果,另一方面进一步提升大学生的创新意识,激发学生创新创业的积极性。学校领导在瞄准国家和省级竞赛体系的同时,应根据学校自身的特点,根据学科和专业特点,对竞赛机制进行创新,推进双创大赛和专业技能竞赛“双赛并进”机制,通过培训带动比赛和推动双创教育改革,实现“人人须参与、系系有项目、队队出成果”的结果。

1 多维度多特征语体分析模式

多维度语体分析模式(Multi-dimensional analysis,以下简称“MD”)由Biber在1988年进行了完善与发展。MD方法有几个突出的特点:它是一种基于语料库的语域变异分析方法,通过分析语言特征的“共现”来确定语域变异的维度,对不同语篇类型进行多维度的比较分析,以求全面地揭示语体之间的差异[4],完美解决了上世纪 70 年代许多语言学家的疑问:仅仅通过对比个别的或具体类别的语言特征来分析文体差异难以充分揭示语域间的功能差异[5]

通过对23类、481篇当代英式英语口笔语语料中67种语言特征进行语言特征频率的因子分析,Biber确定了功能相同的英语文体的五大主要维度:交互性vs.信息性(involved vs. informational production)、叙事vs.非叙事 (narrative vs. non-narrative discourse)、所知清楚vs.所指依赖场景(elaborated vs. situation-dependent reference)、显性劝说性(overt expression of persuation)、客观抽象vs.个人化 (abstract vs. non-abstract style)[6]。Biber在研究过程中,对具体语言特征的提取、几个维度的判断与命名及联系情境特征的功能解释都是采用定性方法;而语言特征是否存在显著差异,共现的因子分析和维度分值计算都是采用定量方法。因此, Biber的多维度、多特征方法不仅避免了以往单一或少数几个语言特征可能引起的语体分析的偏颇,也实现了定性与定量,宏观与微观的有效结合,避免了单一方法、单一角度所带来的局限[7]

2 研究设计

2.1 研究问题

本研究拟解决以下问题:

书城被赋予的意义不止于购书和阅读,它也用自己独特的方式,汇聚着来往的人们。夜幕笼垂,一场宁波方言吟诵展演活动正在这里举行。每一本书都拥有自己的使命,有人在这里发现世界,有人在这里描绘世界。

其中,当0≤t

3.1.1 交互性vs.信息性(involved vs. Informational production)

交互性/信息性维度代表的是人际交流功能与信息传达功能的对比,由因子负荷为正值、负值的两组共现语言特征构成。得分越低,意味着该语域存在较多名词、形容词与长词,信息含量越多,如学术文体;反之,得分越高,意味着该语域多动词与代词,情感色彩越浓、交互性越强,如日常会话。

2.2 研究语料库

本研究自建了一个总文本数为155篇、库容为21 866字符的小型语料库(以下简称“CT”)。语料来自福建某大学2016级三个工科专业同话题非限时议论文。本研究的写作任务为非限时议论文写作,目的在于排除因语言产出环境与时间限制而造成的口语化倾向。自建语料库时,为了保证语料库自动标注工具的顺利进行,分别使用北外研发的文本处理工具PowerGREP中的替换功能与“风林”研发的“文本处理器”对文本进行分词(即在每一个“形符”后面加空格的过程)与文本清理(如全角标点、跳格、多余空行等)。

1)非英语专业学生议论文在语体的五大维度,即交互性、叙事性、指代明确性、说服性、以及抽象性方面表现如何?

2.3 研究工具

3.1.4 显性劝说性(overtexpression of persuation)

3 结果与讨论

3.1 非英语专业语体特征多维度分析

MAT软件最终汇报由非英语专业学生议论文组成的自建语料库属于互动性较强的劝说型语域,相关数据如表1所示。

 

表1 自建小型语料库各维度分数分布

  

维度一维度二维度三维度四维度五CT6.61-3.228.09-1.792.43

2)非英语专业学生议论文语体的五大维度,即交互性、叙事性、指代明确性、说服性、以及抽象性,与其写作成绩是否存在相关性?若存在,呈现何种相关?

从以上三种方法的检测结果来看,本测区生产的1∶2000 DOM精度已经满足CH/Z3003-2010《低空数字航空摄影测量内业规范》要求。

由图1可知,工科学生书面语互动性维度数值区间跨度不大,内部差异相对其他维度不明显。然而其维度值高达6.61,呈现较强交互性,在维度一上的位置与有准备演说(prepared speech )维度值最为接近,这个发现与潘璠结论一致。她通过将中国四种学习者书面语体与美国大学生议论文语料库(LOCNESS)进行对比,发现学习者维度一的维度值与浪漫小说与有准备演说最为接近。

3) CTV与常规油船外输软管连接。启动CTV软管收放滚筒,由艉部服务吊机协助,将外输软管放到辅助拖船上,拖船将软管拖到常规油船中部,油船吊机将软管吊至油船集管区,与接油管连接好。

  

图1 各语域在互动性维度区间分布

显性劝说性维度测量作者个人观点以及其对事件可能性的评估,分值越高代表着文本中出现的情态动词越多,如工作信件等。

叙事性/非叙事性维度区分动态的叙事性语篇和静态的说明性语篇,分值越高代表着文本中出现的过去时,第三人称代词越多,叙事性越强,如小说。

如图2所示,当k=0,NS=0时,进行第一次扫描。若由于接收端RX不在波束所覆盖区域内等原因导致发射端的监测传感器未能监测到接收端,则扫描环节失败。将进行下一次扫描,即NS+1。若成功扫描到接收端,则进行两端间的连接、读写数据并开始充电。当设备RX达到其充满电的额定电压值时,此时充电完成判断成功,即充电成功。但此期间接收端发生相对移动或其他情况,两端可能会产生通信失败或误判充电完成等结果。因此,在这4个环节中任意一个环节的失败将进行一次新的充电过程,即k+1。当k>3或NS>NSmax,则充电失败。

  

图2 各语域在叙事性维度区间分布

观察图2可见,工科学生书面语的叙事性最低,与广播电台节目语域(broadcast)维度值最为接近。其数值区间在维度二上在所有语体中跨度最大,反映出中国大学生不擅长使用适当的叙事手段证明观点,且其内部变异大。潘璠认为这是由于中国大学生过多使用的第三人称代词,完成体,公众动词少。

3.1.3 所知清楚vs.所指依赖场景(elaborated vs. situation-dependent reference)

所知清楚/所指依赖场景维度区分的是依赖语境与不依赖语境的语篇。得分越低,意味着该语篇越依赖语境。副词使用频繁是其主要特征,如新闻播报;反之,得分越高,意味着该语域越不依赖语境,多使用名词化结构,如学术写作。

图3所示,工科学生书面语指代明确性维度均值最高,接近官方文件维度值,偏向学术语体,不依赖语境。最小值与最大值差异在该维度上是所有语体中跨度最大的,说明学生个体内部差异大。

语料库清洁完成之后,借助Andrea Nini研发的多维度标注与分析工具“Multidimensional Analysis Tagger 1.3”(以下简称“MAT”)对语料库进行词性标注与多维度分析。该工具复制了Biber的67个语言特征与六大维度,内嵌 “斯坦福词性赋码器”进行词汇赋码。MAT可以实现自动标注、统计每个语言特征的每千字标准词频、计算其在各个文本中的频数标准分(zscore),进而计算各个文本在各维度的分数,并可以实现将维度结果置于Biber研究中的语域进行对比,并报告所研究的语料库与哪种语域最为接近。因篇幅有限,该软件具体操作指南请参看http://www.bfsu-corpus.org/channels/tools。

3.1.2 叙事性vs.非叙事性 (narrative vs. non-narrative discourse)

本研究不足之处在于,病例数较少,对多重耐药菌感染率影响较大;由于本研究为回顾性研究,研究对象的可比性和均一性不足,较多数据来源于病历资料,可靠性存在较多的误差,因此研究结论有待于大样本前瞻性多中心研究进一步验证。

  

图3 各语域在指代明确性维度区间分布

  

图4 各语域在说服性维度区间分布

图4所示,工科学生书面语在维度四的数值区间比前三个维度跨度都要大,说明在说服性维度上,工科学生内部差异巨大。其说服性维度均值最接近个人信件(personal letter)维度值,说明工科学生议论文写作时使用了大量的预测和情态动词[8],使得作者态度过于武断,妨碍人际功能的实现,影响议论文的说理效果[9]

3.1.5 客观抽象vs.个人化 (abstract vs. non-abstract style)

维度五区分语篇的抽象性/非抽象性特征。分值越高代表着文本中出现的被动语态、连词越多,信息呈现是以科学、抽象、正式的方式,如科技文体等。

图5所示,工科学生在维度五上所表现的分散程度是所有维度中跨度最大的一个,说明学习者内部差异巨大,两极化现象非常严重。抽象性低、维度均值接近新闻报道的维度值。

  

图5 各语域在抽象性维度区间分布

3.2 非英语专业学生议论文语体维度与其写作水平相关性

实验所得作文采用外研社开发的智能评阅系统iWrite 2.0中的批量修改功能实现统一批阅。iWrite由北京外国语大学中国外语教育研究中心的梁茂成教授与刘磊博士研发,采用全面的作文评阅构念,从语言、内容、篇章结构以及技术规范四个维度对学生作文进行评估,并提供有效的诊断性反馈与信度较高的分数。

 

表2 非英语专业学生议论文语体各纬度值与写作水平相关性

  

纬度一纬度二纬度三纬度四纬度五写作分数Pearson 相关性-0.277**-0.0910.088-0.1030.156显著性(双侧)0.0000.2620.2760.2020.052N155155155155155

**.在 .01 水平(双侧)上显著相关

皮尔逊r相关分析结果显示,在所有五个语体纬度中,只有纬度一,即信息性与互动性纬度达到统计意义上的显著相关性(p=0.000<0.05),与非英语专业学生写作水平呈低水平负相关(r=-0.277),也就是说信息性与互动性纬度值越高,学生写作水平越低。该结果与信息性纬度定义一致:得分越高,意味着文体情感色彩越浓、交互性越强。纬度二(p=0.262>0.05)、纬度三(p=0.276>0.05)、纬度四(p=0.202>0.05)以及纬度五(p=0.052>0.05)均未达到统计意义上的显著性,因此

与非英语专业学生写作水平不具有相关性。语体的语篇构建意义决定了语体在写作教学中的重要地位。语体意识的错位会导致英语写作中的语言笑话, 语意的偏差[10],最终会影响学生的写作水平。毛荣贵、蔡基刚都强调在写作教学中强化学生的语体意识。这些论点无疑与上述相关分析结果相矛盾。究其原因,可能是iWrite 2.0评阅标准是基于语言、内容、篇章结构以及技术规范四个维度对学生作文进行评估,没有将语体纬度概念系统地引入到评价结构中去。

4 结论

研究发现,非英语专业学生议论文组成的自建语料库整体属于互动性较强的劝说型语域,呈现较强交互性、劝说性,低叙事性、抽象性的口语化特征,且学生个体差异巨大。其中,信息性与互动性纬度值与非英语专业学生写作水平呈低水平负相关,然而其他四个语体纬度未发现与学生写作水平呈现任何相关。然而本研究的语料规模较小,具有一定局限性,因此有必要开展更大范围、更深层次的研究,使研究更具代表性与推广性。此外,由于时间、精力有限,作者未能对该自建小型语料库文本进行人工评阅,探讨是否由于评阅标准的文体而导致的不相关性。希望有更多研究者可以跳脱出各类语体本身的描写,而更多关注语体与写作水平、写作能力的实验研究。

本研究在对综合管廊监控管理系统进行设计的过程中,对于提高市政人员的工作效率有重要的意义,希望通过本文对系统的设计,能够为我国管廊监控管理系统设计和应用的相关人员提供参考。

参考文献

[1] 雷秀云,杨惠中.基于语料库的研究方法及MD/MF模型与学术英语语体研究[J].当代语言学,2001 (2):143-151+158.

[2] 文秋芳. 学习者英语语体特征变化的研究[J]. 外国语,2009,32(4):2-10.

[3] 潘璠.中国非英语专业本科生和研究生书面语体的多特征多维度调查[J].外语教学与研究,2012(2):220-232+320.

[4] 武姜生.大学生英语学术写作中引述句的主语特征[J]. 中国外语,2010 (2):27-32.

[5] ERVIN-TRIPP S. On socilinguistic rules: alternation and co-occurrence [A]. Directions in Sociolinguistics: The Ethnography of Communication [C]. NewYork: Holt. 1972.

[6] Biber, Douglas. Variation Across Speech and Writing [M]. Cambridge: Cambridge University Press. 1988.

[7] 刘艳春,胡凤国.辩论与演讲语体多维度、多特征对比研究[J].语言教学与研究,2016(6):103-112.

[8] 马刚,吕晓娟.基于中国学习者英语语料库的情态动词研究[J].外语电化教学,2007(3):17-21.

[9] 梁茂成.中国大学生英语笔语中的情态序列研究[J].外语教学与研究,2008(1):51-58+81.

[10] 赵亚莉,焦云彬. 英语写作教学中语体意识的导入[J]. 陕西师范大学学报(哲学社会科学版) ,2006(12):412-414.

 
李晨
《黑龙江工程学院学报》2018年第02期文献

服务严谨可靠 7×14小时在线支持 支持宝特邀商家 不满意退款

本站非杂志社官网,上千家国家级期刊、省级期刊、北大核心、南大核心、专业的职称论文发表网站。
职称论文发表、杂志论文发表、期刊征稿、期刊投稿,论文发表指导正规机构。是您首选最可靠,最快速的期刊论文发表网站。
免责声明:本网站部分资源、信息来源于网络,完全免费共享,仅供学习和研究使用,版权和著作权归原作者所有
如有不愿意被转载的情况,请通知我们删除已转载的信息 粤ICP备2023046998号