首页 > 生活 > > 正文
2024-08-07 15:29:28

人工智能生成的答案 提交内容逃避了英国知名大学的检测

导读 在英国雷丁大学答案 系统的测试中,人工智能 (AI) 生成的试卷几乎完全未被发现,这些假答案往往比真正的学生获得的分数更高。雷丁大学的 ...

在英国雷丁大学答案 系统的测试中,人工智能 (AI) 生成的试卷几乎完全未被发现,这些假答案往往比真正的学生获得的分数更高。雷丁大学的 Peter fe 和同事于 6 月 26 日在开放获取期刊PLOS ONE上发表了这些发现。

近年来,ChatGPT 等人工智能工具变得越来越先进和普及,人们开始担心学生会利用这些工具作弊,将人工智能生成的作业当作自己的作业提交。在新冠疫情期间,许多大学和学校从有监督的现场答案 过渡到无监督的家庭作业答案 ,这一事实加剧了这种担忧,现在许多大学和学校仍在继续这种模式。到目前为止,检测人工智能生成的书面文本的工具并没有取得很好的效果。

为了更好地理解这些问题,fe 和同事们生成了 100% 由人工智能聊天机器人 GPT-4 编写的答案,并代表 33 名假学生提交给雷丁大学心理与临床语言科学学院的答案 系统。考​​试评分员对这项研究并不知情。

研究人员发现,94% 的 AI 提交的答案未被发现。平均而言,虚假答案获得的分数高于真实学生的答案。在 83.4% 的情况下,AI 提交的分数高于随机选择的一组相同数量的真实学生提交的答案。

这些结果表明,学生不仅可以逃避使用人工智能作弊的惩罚,而且他们还可以取得比不作弊的同龄人更好的成绩。研究人员还考虑了这样一种可能性:在这项研究中,许多真正的学生可能逃避了人工智能生成的论文的惩罚。

研究人员指出,从学术诚信的角度来看,这些发现令人极为担忧。他们指出,恢复监督下的面对面答案 可能有助于解决这个问题,但随着人工智能工具不断发展并渗透到专业工作场所,大学可能会专注于研究如何接受人工智能的“新常态”,以加强教育。

作者补充道:“对现实生活中的大学答案 系统进行的严格盲测表明,人工智能生成的答案 提交几乎无法被发现,并且比真实学生获得的分数更高。&luo;答案 图灵测试&ruo;的结果促使全球教育部门接受新常态,这正是我们在雷丁大学所做的。我们为员工和学生制定的新政策和建议承认了使用人工智能的工具带来的风险和机遇。”