AI测试今年全国统一高考数学试卷为何难得满分?

四季读书网 2026-06-30 15:12:22 1 0

       最近，不少网友分别用国内知名AI大模型，参加2026年全国统一高考数学题“考试”，豆包、DeepSeek两款模型最高分分别为144、141分，“战场”态势:
       deepseek首先出场，刚做到第一道证明题就直接算到宕机，在做第十九题即压轴题时，它试图用暴力计算的方式解题，疯狂思考了18分钟再度宕机，网友重启才继续作答，这道题虽然拿到了12分，但总用时超过半个小时，比豆包整整慢了14分钟。
轮到千问答题，没想到千问居然联网搜到了高考题标准答案，直接开启开卷考试。处理后第八题答题时明明已经把正确答案算出来了，填写答案时却硬生生出错，第十四题亦是如此，明明已经推导出正确答案，却犯了“经验主义”，硬是把正确答案改错。
       智谱开始登场，没想到智谱在分析第十一题时居然把题目中的圆看成椭圆，直接选到了错误选项，直到网友给一次检查机会它才发现。
豆包AI全场表现最佳，尤其最后一道压轴题，它很快找到题目的关键突破口，直接绕开复杂的计算过程，当其他模型还在疯狂计算时，豆包已经提前交卷，拿下第一。

由此可见，AI参加高考答题测试，与人类相比仍存在无法弥补的差距:

一是抽象理解能力。AI只有模式匹配，却没有抽象理解力。人类能读懂题目背后的数学含义，能举一反三，看懂一道题就能推理到全新变式。而AI没有抽象理解能力，它只能基于海量训练数据，匹配相似题，生成对应的解题步骤。遇到完全创新、从未在训练数据里出现的全新题型，AI很容易崩盘。
二是逻辑思维能力。人类做题会主动检查，发现结果不符合常识就回头验算、修正思路。AI的“验算”是程序预设功能，只会按固定流程重复计算，不是自主怀疑，缺乏主观判断。所有AI都只是统计拟合工具，不具备人类真正的逻辑理解、创造、自主反思能力。
三是图形与视觉识别能力。高考近20%题目配图，如函数图像、立体几何截面图。AI只能把图片转数字符号才能识别，没有人类直观空间想象力，无法一眼看懂虚实线。只要题目依赖看图提取条件，失分风险非常高。
简之，目前AI与人类思维相比仍存在无法逾越的鸿沟，尽管AI前景喜人，但不可盲从！

本文地址： https://sjds.net/772985.html

文章来源：四季读书网