AI测试今年全国统一高考数学试卷为何难得满分?

四季读书网 1 0
AI测试今年全国统一高考数学试卷为何难得满分?

       最近,不少网友分别用国内知名AI大模型,参加2026年全国统一高考数学题“考试”,豆包、DeepSeek两款模型最高分分别为144、141分,“战场”态势:
       deepseek首先出场,刚做到第一道证明题就直接算到宕机,在做第十九题即压轴题时,它试图用暴力计算的方式解题,疯狂思考了18分钟再度宕机,网友重启才继续作答,这道题虽然拿到了12分,但总用时超过半个小时,比豆包整整慢了14分钟。
       轮到千问答题,没想到千问居然联网搜到了高考题标准答案,直接开启开卷考试。处理后第八题答题时明明已经把正确答案算出来了,填写答案时却硬生生出错,第十四题亦是如此,明明已经推导出正确答案,却犯了“经验主义”,硬是把正确答案改错。
       智谱开始登场,没想到智谱在分析第十一题时居然把题目中的圆看成椭圆,直接选到了错误选项,直到网友给一次检查机会它才发现。
       豆包AI全场表现最佳,尤其最后一道压轴题,它很快找到题目的关键突破口,直接绕开复杂的计算过程,当其他模型还在疯狂计算时,豆包已经提前交卷,拿下第一。

AI测试今年全国统一高考数学试卷为何难得满分?-第1张图片-四季读书网
     由此可见,AI参加高考答题测试,与人类相比仍存在无法弥补的差距:

       一是抽象理解能力。AI只有模式匹配,却没有抽象理解力。人类能读懂题目背后的数学含义,能举一反三,看懂一道题就能推理到全新变式。而AI没有抽象理解能力,它只能基于海量训练数据,匹配相似题,生成对应的解题步骤。遇到完全创新、从未在训练数据里出现的全新题型,AI很容易崩盘。
       二是逻辑思维能力。人类做题会主动检查,发现结果不符合常识就回头验算、修正思路。AI的“验算”是程序预设功能,只会按固定流程重复计算,不是自主怀疑,缺乏主观判断。所有AI都只是统计拟合工具,不具备人类真正的逻辑理解、创造、自主反思能力。
      三是图形与视觉识别能力。高考近20%题目配图,如函数图像、立体几何截面图。AI只能把图片转数字符号才能识别,没有人类直观空间想象力,无法一眼看懂虚实线。只要题目依赖看图提取条件,失分风险非常高。
      简之,目前AI与人类思维相比仍存在无法逾越的鸿沟,尽管AI前景喜人,但不可盲从!

抱歉,评论功能暂时关闭!