学术动态

学术动态

科技伦理系列讲座第11期顺利举行

发布者:刘芳   发布时间:2025-04-16

2025年4月11日下午,浙江大学外国语学院科技伦理系列讲座第十一期在蒙民伟楼139报告厅如期举行。本次讲座主题为“TalkBank Resources for Studying Spoken Languages”,由美国卡内基梅隆大学(Carnegie Mellon University)著名心理语言学家Brian MacWhinney教授主讲,外国语学院院长董燕萍教授主持。讲座围绕TalkBank在口语研究中的价值与前沿应用展开了深入探讨,现场气氛热烈,反响积极。

讲座伊始,MacWhinney教授从TalkBank的发展历程切入,介绍了这一全球领先的口语语料库的基本架构与核心理念。他指出,TalkBank旨在构建一个内容丰富、持续开放的语言数据平台,目前已累积约四千万词的口语语料,涵盖日常对话、学术访谈、教育互动等多种语境,为语言研究提供了坚实的数据支持。“数据共享”是TalkBank始终秉持的核心理念,旨在打破研究壁垒,推动全球语言学界的开放协作与资源互通。

MacWhinney教授强调,TalkBank最显著的特点之一,是其统一而规范的转录格式,这种跨子库的一致性标注体系,显著提升了数据调用的便利性和对比研究效率。研究者可依据语言种类、说话者特征等条件灵活筛选语料,避免格式转换所带来的困扰,从而显著简化分析流程。此外,TalkBank在音频与文本对齐技术上的持续优化,也使语言现象的呈现更加直观,为精确识别与定量分析提供了重要支撑。讲座中,MacWhinney教授特别介绍了DementiaBank子库,该库聚焦于阿尔茨海默症的早期识别研究,凭借其丰富的数据资源,已成为该领域极具影响力的语料平台。

在讲座的后半部分,MacWhinney教授详细介绍了TalkBank提供的多项辅助功能与教学工具,包括预录操作视频、在线字幕浏览以及“协作批注”等。其中,“协作批注”功能允许用户在语料中添加语用标签,如“请求帮助”“开玩笑”等,不仅拓展了语料分析的深度,也为语言教学设计提供了新的思路。同时,多个研究者对同一语料的协作批注,也能从多视角提供丰富的理论解释与分析维度。

讲座还介绍了TalkBank下多个子库的特色与应用。例如,ClassBank专注于课堂互动研究,可结合相应编码系统分析教学语言与课堂行为之间的关系;AphasiaBank收录了超过500小时的失语症患者语料,成为神经语言障碍研究的重要资源库;FluencyBank关注语言流利度的发展与恢复机制等。同时,TalkBank也积极推动新兴语音识别工具的发展与应用,如batchalign2项目,在提升转写效率和准确度方面表现尤为突出。

讲座最后,MacWhinney教授表达了对TalkBank未来发展的信心。他指出,尽管在口语语言研究等领域仍面临样本扩展和标注一致性等挑战,但通过与全球研究团队的合作与持续技术创新,TalkBank有望不断优化数据管理和服务体系,进一步推动语言研究向更加开放、共享与多元的方向发展。

整场讲座内容丰富、案例生动、互动充分,激发了与会师生对口语语料建设与多模态语言研究的深入思考。大家纷纷表示受益匪浅,对TalkBank平台的研究潜力与实践价值有了更全面、深入的认识。

图/文: 李称鑫

主办单位:科技伦理委员会




联系我们

电话:0571-88206044

邮编:310058

地址:杭州市余杭塘路866

官方微信学生会微信