“生成式人工智能”(generative AI)ChatGPT在去年年底的开放使用,仿如在教育界投入震撼弹,不管是学生、老师或校方管理层,大家都在讨论这天使和魔鬼并存的ChatGPT。
个人最近的一个经验,应该也是许多教授的共同切身体验:在审批某学生的年终作业报告时,发现这作业存在一些格格不入的结构和写法;我找出学生过去的报告,显然这份作业书写水平与风格近乎完美,和他早期缴交的报告相差很大,而Turnitin查重软件报告显示网络资料“相似性指数”(similarity index)只有1%,属于健康水平,意味著无剽窃问题存在。
在人工智能时代的教育界,老师们如何界定抄袭的定义?学生应该如何使用生成式AI工具来提升学习?如何应对学生使用AI工具抄袭的问题?学习和评估模式应作什么改变和改善?AI检测工具的前路何在?此文蜻蜓点水地略述其中争议。
抄袭的定义
在AI世代,我们应该如何定义“抄袭”?ChatGPT未面世前,许多学生已广泛使用诸如Grammarly、Quillbot等改写文字、提供单词或句子的工具,但这些工具不“生成”新文本,而是基于学生自己写好的文本;只要学生适当重写和总结(paraphrasing & summarizing)或引用(quoting)资料来源的内容,以及注明所引用观点的出处(也就是引述citation),就不是抄袭。如学生使用ChatGPT生成作业,有做到以上几点,然后再声明那一部分是由AI生成的,就不算抄袭。但由于许多大学还未完善制定相关政策,这种声明也由教授各自决定要不要实行。
但即便课堂里多了此要求,老师们也无法有效侦测谁使用AI工具。简言之,这条规只适用于原本具备高道德、良好学术伦理的学生,对那些想偷懒的学生是没辙的。
AI内容检测工具
天使和魔鬼并存的ChatGPT,可以成为免费补习老师,但它不是所有科目都在行,也会仙家乱给答案。对老师而言,在学校还未制定完善政策之前,学生的滥用AI抄袭行为是难以被发现的。目前市面上有许多用以检测AI生成文本的检测工具,例如:Compilatio、GPT Zero、Turnitin、Zero GPT都是常见的,但学术界普遍认为它们的功效极低。
德国柏林应用科学大学(HTW Berlin - University of Applied Sciences)研究人员曾评估包括Turnitin、GPT Zero等14种AI检测工具的功效,发现这些声称能辨识ChatGPT生成文本的AI检测工具效率极低;有些内容只要稍加修饰,就能骗过AI检测工具;迄今包括来自美国马里兰大学(University of Maryland)和南非的南非大学(University of South Africa)等研究团队的研究报告,都得出类似结果,即AI内容检测器尚未准备好抓包抄袭行为。
路在何方?
约17年前,当笔者任职的大学开始使用Turnitin来检测学生作业时,就面对了许多技术上的难题;其中主要因素是Turnitin只能标出相似度高的文字,抄袭与否就全由教授决定,不同系或学校对这些尺度也宽严不一。但经过一些时日的磨练和经验,加上Turnitin系统逐渐加强改善,教授们后来都能掌握个中要诀,以提升检测功效。
当前的生成式AI工具和AI检测软件,也处于这种过渡期;学生如何使用AI促进学习、老师对AI检测工具的了解和应用、校方制定的相关课堂政策,这些都还处于磨合期间。
在与AI并进化的过渡期,教授、老师们也该多动动脑筋,设计那些无法使用生成式AI来完成的作业和考题。这是当务之急。在识别AI生成文本方面,AI检测工具和技术都还不够完善,但我们也无法禁止学生使用AI;老师和校方能够做的,是强调“遵守道德标准”准则和实践的同时,也以身作则地在课堂展示如何有效的、凭籍学术伦理,来善用AI工具,协助提升他们的学习。
(本文为2023年华教节特辑系列文章,今年特辑主题为“日常生活中的政治参与”以及“人工智能时代的教育与革新”,由林连玉基金组稿。)