中国舆情网手机客户端工作人员查询
中国舆情网官网二维码

舆情网官网

中国舆情网手机二维码

舆情网手机

您的当前位置:主页 > 动态资讯 > 正文
中国舆情网-一带一路BANNER

人工智能能否胜任学术评审的重要角色

来源:中国舆情网 时间:2026-06-12
导读:“AI考官”真的能精准鉴别学术作品的思想深度吗?最近,一项规模空前的研究,直接让最先进的AI模型参与本科论文的学术评分,挑战人类考官的领域专业性。 英国剑桥大学牵头,集合多所高校的研究者,对来自英国三所大学的761份本科论文进行了大规模测试。测试

“AI考官”真的能精准鉴别学术作品的思想深度吗?最近,一项规模空前的研究,直接让最先进的AI模型参与本科论文的学术评分,挑战人类考官的领域专业性。

英国剑桥大学牵头,集合多所高校的研究者,对来自英国三所大学的761份本科论文进行了大规模测试。测试对象包括Anthropic的Claude、OpenAI的ChatGPT等一线AI模型。所获数据让人深思:AI打分与专家划分的学位等级只有大约50%能对得上号。更令人担忧的是,AI在发现真正优秀或较弱的论文时经常出现判断偏差,暴露出它过于重视文具表达、难以捕捉学术实质的短板。

报告为高校敲响警钟。它指出,AI确实可以作为评卷助手介入流程,但如果让机器独自决断成绩,不仅可能淹没学生的个性和创意,还可能动摇高等教育的公信力。

AI评分偏向“中庸”

这项由剑桥大学心理学家德博拉·塔尔米博士主导、与曼彻斯特城市大学和诺丁汉大学合作的OpRaise研究,实际采集了2022—2025年三校提交的761篇本科论文,文体包括课程报告、开卷考、线下监考等,涵盖50个课程模块和87类作业类型。

参与测试的三大主流AI模型分别是Claude Opus4.6、GPT-5.4和Gemini 3 Flash。研究团队尝试通过对评分标准、评分策略等详细指令进行调整,并为AI提供了详细评分准则和分布预期、评分解释要求等多重校准。尽管进行了如此多的“加持”,AI打分准确率仍在35%到65%之间浮动。

实验显示,无论在哪所学校,AI都普遍展现出明显的“中间分倾向”,它们更愿意给出区间在50—60分的安全分数,与人类大致相符。一篇专家眼中的75分高分佳作,落到AI手中却常常被下调几分;反之,原本只是及格50分的论文,AI却屡屡高抬一手,呈现出“高低分被抹平”的现象。

AI看重格式多过“内核”

资深考官在评卷时,关注的不只是文字表象,而是考查学生如何进行论证、能否展现独立思考和深度见解。但AI评分的本质是基于大数据的模式匹配。本轮测评中,所有AI模型对论文的长度、词汇量和句法复杂性都异常敏感,表现好看就能拉高分。至于论点是否有深度,证据是否充分乃至是否具备批判性思维,AI却往往忽略。换句话说,AI更是看“皮相”,很难识别学术真正的分量与创新。

这一套路导致评分高度同质化。团队用同一篇论文多次测评,AI给的分数几乎不变,乍看像是“公正客观”,其实只是反映其机械地套用语言规律,而非理解论文精髓。

更大的隐患在于:机判一旦成为主流,学生在写作时展现特色和奇思妙想就很容易被忽略。最终导致的局面是,AI在关键决策时反而“最不准”。

反馈点评也存在类似问题。AI写的评语不仅字数远超老师,精炼后再让老师和学生分辨,绝大多数人也很难一眼看出差别。但一旦曝出哪段内容出自AI,大家对机生点评的认同感大幅下降。这说明,师生之间用心交流和学术共识,是AI无法替代的纽带。

人工裁判地位不可撼动

在教师阅卷工作不断加重的背景下,不少大学都在讨论利用AI来减轻压力。塔尔米博士承认,当前高校正面临减负增效和满足学生多元需求的多头压力,某些机构已开始让AI承担部分评测任务。有些繁琐的打分工作,交给AI确实能够让老师腾出手来专注于实际教学。但在《AI大学评估中的应用:评估自动评分的机遇与风险》一文里,研究组反复强调,最后的裁决权只能握在人类手中。AI充其量做“复核小帮手”,用来辅助检测出错、提升一致性,或者提示老师重点关注“分歧明显”的机评分作业。

学术评价的意义,不是简单地打分,更关乎教育尊重、学术规范和师生信任网络的建立。

曼彻斯特城市大学报告合著者雅埃尔·本恩博士补充指出,不少学生表示,一旦知道作业是由AI阅卷打分,会感到被欺骗;而老师认为,过度依赖AI不仅会削弱专业判断力,也损害了高等教育中人与人之间的联系。教学评价体系本质上是一份师生共同维护的“社会约定”,它只有靠人文关怀才能延续。

团队并不否认AI在教学辅助中的作用,但明确划清界限:AI不能代替人工评卷。真正的学术把关,归根结底必须由具备经验、能力和责任感的人类来守护,这道防线是算法无法逾越的。

编辑:夏蕊娜
中国舆情网
中国舆情网
中央机构 | 人大机构 | 国家主席 | 国务院 | 政协机构 | 民主党派 | 群众团体 | 驻外机构
Copyright © 2010-2018 中国舆情网 版权所有 | 中国舆情网简介
网络文化经营许可证 广播电视节目制作经营许可证 电信增值业务经营许可证
编辑:tougao@yuqingz.com 运营:operate@yuqingz.com
本网站所刊载信息,不代表中国舆情网观点。转载本网站原创信息请注明出处。
网站地图 | XML地图 | 手机版 | 电脑版
Top