2

2

少年派的奇幻漂流之方法论系列讲座--龚涛博士专题讲座顺利举行

发布者:系统管理员   发布时间:2017-09-30


 

2017年9月29日下午,美国耶鲁大学Haskins实验室研究员龚涛博士应邀做客外语学院,为师生们带来了题为“数据科学方法在语言研究中的应用”的学术讲座。

image001.jpg



    讲座中龚涛博士以他最新的两项研究为例,生动展示了数据科学与语言研究相结合的路径。

   讲座之初,龚博士首先介绍了数据科学的三个重要方面——数据、计算科学和人。数据和计算科学很大程度上依赖于各种模型和运算方式、工具。但研究中“人”的因素也非常显著,从问题的设计、运算方式的选择、数据获取与处理,到数据分析及可视化过程,包括把结果进行交叉学科的交流,都需要人的主动参与和适当抉择。

image003.jpg

以此为基础,龚博士首先介绍了一项语言和阅读相关能力对在线句子阅读调节作用的研究。他认为,前人的研究和理论提及了阅读过程中涉及的因素,如:词义识别(word recognition)、译码(decoding)及涉及字形、语音和语义等词汇表征质量假设(Lexical quality hypothesis)及语言效率理论(Verbal efficiency theory),但尚未有实证研究解释这些因素之间的联系,及这些因素如何交互影响阅读过程。因此,龚博士的研究团队以个体词汇能力指标和词汇特征建立在线阅读过程的混合效应模型,并将预测的数值与眼动实验的结果进行对比。经过非常严密的显著性检验,证实了个体阅读能力与词汇特征之间存在显著相关性。

    第二项实验检验社交媒体(如Facebook)语言的特性对使用者生活满意程度的预测作用。龚博士指出,相比传统的专业采访或自我报告式调查,社交媒体所提供的语料具有数据量大、语料环境真实等优点。该实验使用情绪效价指标、语言获得和词汇技术软件LIWC和潜在狄利克雷分布(LDA modeling)提取Facebook 更新状态中反应生活满意度方面的信息,并使用弹性网络回归(elastic net regression)训练分析模型。测试集预测结果与自我报告的生活满意度评分的相关度高于以往各项研究的成果。

image005.jpg

讲座中,在座的师生们就大数据处理、语言研究中实际的数据分析问题进行交流与提问,龚博士一一回应。龚涛博士的讲座为外院师生的语言研究引入了更加多元的方法与路径,大家都深受启发。

 

外国语言学及应用语言学研究所

外国语言文化与国际交流学院青年平台

浙江大学大数据+语言规律与认知创新平台

2017.9.29


联系我们

电话:0571-88206044

邮编:310058

地址:杭州市余杭塘路866

官方微信学生会微信