(相关资料图)

《科学报告》8月24日发表的一篇论文指出,回答包括计算机科学、政治学、工程学和心理学在内的多学科评估性问题时,ChatGPT可能达到甚至超出了大学生的平均成绩。这项研究还发现,近3/4的受访学生说可能会用ChatGPT帮助写作业,但许多教育者认为使用ChatGPT是一种抄袭。

为调查ChatGPT在写大学作业时与学生相比表现如何,阿拉伯联合酋长国纽约大学阿布扎比分校的Talal Rahwan和Yasir Zaki请该校教授32门不同课程的教职员各提供3份学生提交的作业,内容是他们布置的10个评估性问题。随后他们让ChatGPT对这10个问题产生3组相应的回答,之后由3名不知道答案来源的打分者一起评估学生作业和GPT的回答。

ChatGPT产生的答案在32门课的9门课里得到了与学生相近甚至更高的分数。只有在数学和经济学课程中,学生的表现始终高于ChatGPT。与学生相比,ChatGPT在“公共政策导论”课程中的分数优势最明显——平均分为9.56,而学生为4.39。

作者还调查了人们对于ChatGPT被用于协助大学生完成作业的看法。他们在巴西、印度、日本、美国和英国调查了1601人,其中每个国家至少涉及200名学生和100名教育者。74%的学生说他们会在作业中用到ChatGPT。相反,在所有国家中,教育者都低估了打算使用ChatGPT的学生比例,70%的教育者报告说他们会将这种做法视为抄袭。

最后,作者报告说,两个识别AI生成文本的工具——GPTZero和AI text classifier——在这项研究里分别有32%和49%的时候将ChatGPT产生的答案错误地分类为人类作品。

研究人员指出,这些发现共同提供了新的见解,可为在教育场所应用AI工具的政策提供信息。

相关论文信息:https://doi.org/10.1038/s41598-023-38964-3 

推荐内容