2025年高考作文题引发的全民热议尚未散去,一场属于人工智能的“思想实验”已悄然揭晓答案。老舍笔下“开不了口”的鼓书艺人、艾青“嘶哑歌唱”的鸟、穆旦“带血的拥抱”——三则抗战时期的文本材料,要求考生探讨个体在苦难中的表达方式。
这几年,每到高考,AI便如临大敌——毕竟总有人拿着高考作文题目要求AI即兴创作。所以今年当然也不例外。6月7日上午,2025年高考语文考试结束,广东考生的全国Ⅰ卷作文题目也新鲜出炉,如果让AI来写,这次又会写成什么样呢?
日前,由上海人工智能实验室推出的司南评测体系OpenCompass选取了零一万物、智谱AI、阿里云通义等6个开源模型及GPT-4o进行高考“语数外”全卷能力测试。据悉,此次评测采用全国新课标I卷,并让具有高考评卷经验的教师人工阅卷评分。
上海人工智能实验室今天公布了多名“AI考生”参加今年中国高考的成绩,阿里Qwen2-72B、GPT-4o和“书生·浦语”2.0文曲星(InternLM2-20B-WQX)成为三甲,得分率均超过70%。大部分“AI考生”在语文、英语科目上表现良好,但数学成绩不如人意。
2025高考方才落下大幕,其间,AI大模型也迎来了一场“被动大考”。在这场比拼中,讯飞星火表现亮眼:据三方权威媒体评测显示,讯飞星火X1在语文作文的综合得分,位列主流大模型榜首;在英语作文盲评中,获得第一;数学测评中,讯飞星火成为仅有的两个整卷得分突破140分的大模型之一。
·大部分大模型“考生”语文、英语科目表现良好,但在数学方面还有待加强。阅卷老师点评,在语文科目上,对于语言中的一些“潜台词”,大模型尚无法完全理解。在数学科目上,大模型的主观题回答相对凌乱,且过程具有迷惑性。6月19日,首个大模型高考全卷评测结果公布。
2024年,国内外众多AI大模型参加全国高考,文科表现优异而理科集体“挂科”的成绩,让外界试出了人工智能的短板。当新一届高考迫在眉睫,人们关注的焦点自然是,一年来不断升级迭代的“AI考生们”准备好了吗?它们能否一雪前耻?