剑桥大学出版社及评估中心黄妍博士讲座顺利举行

发布者：刘芳发布时间：2024-10-29

2024年10月25日晚上，剑桥大学出版社及评估中心（CUP&A）应用人工智能部门负责人黄妍博士应邀在东五青荷吧为外国语学院师生们带来了一场题为“Advancements in AI for Language Assessment” 的精彩讲座。此次讲座由外国语学院副院长闵尚超教授主持。

黄妍博士是浙江大学竺可桢学院和外国语学院的优秀本科及硕士校友，剑桥大学自然语言处理（NLP）专业博士，在语言测试与评估领域颇有成就。目前就职于剑桥大学出版社及评估中心（CUP&A），担任应用人工智能部门的负责人，承担一系列包括Cambridge English Qualification、Linguaskill、Upskill等剑桥英语产品的人工智能技术的研发工作。她深耕机器学习（ML）和自然语言处理领域14年之久，先后在自然语言处理、语料库语言学和应用语言学领域顶级期刊和会议上发表高水平论文10余篇。

讲座伊始，黄博士介绍了其部门研发的人工智能技术的具体领域，包括自动评分、置信模型、异常反应监测和自动语音识别等，以及已应用到这些技术的剑桥外语测试与学习产品。此外，她还分享了与其部门有合作关系的剑桥大学计算机系和工程系的最新研究成果。她指出，这些研究具有概念性、实验室化等特点，技术成熟度虽然还未能直接用于产品开发，但是做好知识上的交流，探讨哪些方向更值得研究也是非常重要的。这些学术成果的分享，为在座的老师和学生们今后的研究提供了思路。

随后，黄博士为我们解析了一系列人工智能相关术语，从AI和ML，到现在热度很高的大语言模型（LLMs）和生成式AI（Generative AI），以专业的角度阐明了各概念的内涵，也指出这些概念之间的联系，比如：大语言模型（LLMs）是生成AI的一个特定应用领域，专注于处理和生成人类语言和文字，能够执行广泛的自然语言处理任务等。紧接着，通过时间线的梳理，从1950年代基于规则的系统（rule-based systems）到现在的大语言模型，黄博士为与会师生讲解了NLP各技术流派的发展历程以及它们的特点和局限性，并强调要根据问题选择合适的技术，而非某技术的热门程度。此外，黄博士还从命题（item generation）、题目校准（item calibration）和评分（scoring）三方面，讲述了AI在语言测试与评估领域的具体应用。她指出，在人工智能技术应用中，尤其是自动评分层面，需考量不同模型的特性，结合测试的具体风险、规模及目的，进行模型的选择和应用。

讲座的最后，黄博士以语言评估中AI的应用研究展望结束本次讲座的分享。她提出，未来研究可以探索如互动类型的口语测试任务及评估框架的开发、新型语言构念、综合任务在评估及学习中的应用等方面的话题，并强调在AI赋能的外语测试及评估中，效度验证研究的重要性。

在互动问答环节，与会师生们结合自己的研究方向，向黄博士提出了许多有深度和价值的问题，现场展开了热烈的讨论与交流。黄博士针对问题进行了耐心解答，同时也分享了自己的经历和心得，她细致专业的讲解以及随和幽默的性格赢得了师生们的热烈掌声和高度评价。

文/图洪诗晨/王燕心

浙江大学外国语言学及应用语言学研究所

浙江大学语言能力发展与评估研究中心


官方微信	学生会微信

导航

剑桥大学出版社及评估中心黄妍博士讲座顺利举行