我们拿SAT真题测试AI,结果有点意外……

四季读书网 1 0
我们拿SAT真题测试AI,结果有点意外……
我们拿SAT真题测试AI,结果有点意外……-第1张图片-四季读书网

在报班前的摸底模考中,我们有遇到这样的情况:有同学做完题,发现系统给出的官方答案和自己用AI查到的不一样,于是:

我们拿SAT真题测试AI,结果有点意外……-第2张图片-四季读书网

急冲冲地来找咨询老师:老师,你们的系统答案是不是录错了?AI说这道题应该选C啊!” 

之前就有一位美高学生,模考后拿AI批改整套试卷,AI给出总分1500,孩子认定自己基础很好不用系统补习;但我们标准化模考系统严格对照官方判分标准,最终得分仅 1400。

我们拿SAT真题测试AI,结果有点意外……-第3张图片-四季读书网

家长半信半疑,没当回事,直到后续真实SAT实考出分刚好卡在1420左右,和我们模考结果高度吻合,AI给出的高分完全是虚高误导。认清AI判分、解题的漏洞后,家长果断报课系统集训,最终孩子正式考试拿下1560高分

我们拿SAT真题测试AI,结果有点意外……-第4张图片-四季读书网

面对考点严谨、陷阱密布的SAT考题,AI也很容易 “一本正经地答错”。

因此,PDA特邀我们SAT名师团中的Astraea和Hellin老师为大家共同撰写推文,用这篇文章我们就用真实真题现场“打假”,带大家看清AI的短板,同时也和各位家长说说备考中该如何理性使用AI工具

现场翻车!真题硬核拆
我们拿SAT真题测试AI,结果有点意外……-第5张图片-四季读书网

SAT模考是帮孩子找准定位的关键一步。

最近我们收到一些家长和学员的反馈:孩子完成模考后,习惯借助ChatGPT等AI工具核对答案,可比对结果却让人一头雾水。

AI给出的答案,和我们模考系统的官方标准答案有出入

不少家长心急地前来咨询,怀疑是我们的题库答案录入出错,甚至担忧答案失误会误判孩子的真实水平,进而影响后续整体学习效果。

在这里先跟大家明确结论:绝大多数情况下,出错的并不是专业模考题库,而是看似万能的AI

今天,我们就拿出2024年3月SAT亚太卷真题拆解:

案例一(逻辑判断题)
The Canadian Longitudinal Study on Aging (CLSA-ÉLCV) is a longitudinal study surveying approximately 1,000 individuals in Canada to glean extended trends in aging. To carry out the necessary sampling of the population over many years, CLSA-ÉLCV needs extensive financial support, but this method provides valuable insights into causal relationships. However, when questions of causation are irrelevant, as with a fitness study seeking only to reveal the percentage of regular exercisers in a city who do weight training, longitudinal methods are unnecessary, and so_____.

Which choice most logically completes the text?

A) the success of the fitness study likely requires significantly less financial outlay than that needed for CLSA-ÉLCV.

B) the expense of CLSA-ÉLCV is likely greater than the cost of longitudinal studies of fitness.

C) longitudinal methods are suitable for studies of aging but ought to be avoided for those of fitness.

D) conclusions drawn from CLSA-ÉLCV are likely to be more authoritative than those from the fitness study.

AI给出的答案:C

  • AI的答题思路

文章前半段肯定了纵向研究方法longitudinal methods)在衰老研究中的价值;后半段则明确指出,在健身研究中这种方法是不必要的unnecessary)。

因此,将两部分对比合并,最合乎逻辑的结论就是:纵向方法适合衰老研究,但在健身研究中应当被避免(ought to be avoided)。选C,逻辑完美!

正确答案:A

  • PDA老师的正确思路

这道题完美暴露了AI对英语词汇逻辑边界的模糊,以及它习惯性脑补的弱点。SAT推断题本质是要求100%的文本对应

我们来看文章真正的因果逻辑链条

  • 纵向研究缺点是需要巨大的资金支持(extensive financial support

  • 健身研究不需要研究因果从而不需要(unnecessary)使用纵向方法

  • 结论(and so...:既然健身研究不需要使用那种昂贵且耗时的纵向方法,那么它的花费自然就低。所以,健身研究所需的资金支出(financial outlay),很可能明显少于衰老研究所需的资金。A选项完美闭环

C选项错误的原因在于over-generalization,文章中想表达的是当研究不涉及到“因果关系”的时候,不需要使用longitudinal method,fitness是作为例子出现的,C选项却直接归纳为“fitness的研究不应当使用纵向研究”,这违背了文章想表达的意思。

🌰举个例子:如果研究的是“工资收入水平对做fitness的人选择什么类型运动的影响”,那仍然与fitness有关、且涉及因果,那纵向研究也是可以使用的。

老师的小课堂:
我们拿SAT真题测试AI,结果有点意外……-第6张图片-四季读书网

有一种SAT推断题选项的设计逻辑,是依托于段落中呈现出来的A to B to C to D之间的关系的。如果当A发生变化,B/C/D自然也会随之变化,这里考察的就是这个逻辑。所以当段落出现比较多的terms的时候,需要有意识地筛选出这些terms之间的关系。

AI无法分清不必要禁止/避免的逻辑边界,直接落入了SAT经典的正反过渡推论(over-inference陷阱

案例二(语法题)
The relationship between genomes and epigenomes reveals how cells with identical DNA develop different _____ whereas the genome in each cell contains a complete DNA sequence, the epigenome consists of chemical compounds that determine which traits in the sequence will be expressed. 

Which choice completes the text so that it conforms to the conventions of Standard English? 

A) functions: 

B) functions, 

C) functions and, 

D) functions 

AI给出的答案:B
  • AI的答题思路:

空格后面紧跟着 whereas(然而/尽管),这是一个连词。既然已经有连词来连接前后两部分了,那么在连词前面加一个逗号(, whereas)隔开,增加停顿使句子最顺畅秒选B

正确答案:A

  • PDA老师的正确思路

这道题再次证明:盲目相信AI英语语感,在SAT语法面前就是送分题。 SAT语法不考读起来顺不顺考的是句法结构(Syntax)的硬性规则

我们把这句话进行结构拆解

前半句: The relationship... reveals how cells... develop different functions。这是一个完整的独立主句(主语是relationship,谓语是reveals,后面跟着一个完整的宾语从句)

后半句: whereas the genome... contains... sequence, the epigenome consists of...。这也是一个完整的独立主句(由whereas引导的让步状语从句,和后面的主句合并,共同构成了一个完整的复合句)

在标准的英文语法中,两个完整的独立主句,绝对不能只用一个逗号(选B)直接黏连在一起(这在SAT中被称为run-on 错误或comma splice 错误)

为什么选A(冒号 :

SAT语法中,冒号(:)的核心功能之一是:左边必须是一个完整的独立主句,右边用来对左句的内容进行解释说明或进一步阐述

本题中,前半句提到了细胞是如何发展出不同的功能(functions,而后半句恰好在详细解释 genome  epigenome 是如何各司其职、协同工作来展现不同功能的

冒号左边是完整主句,右边进行了解释,完美符合冒号的语法硬规则。

为什么AI会错得如此自信?
我们拿SAT真题测试AI,结果有点意外……-第7张图片-四季读书网

家长和同学们要明白,AI的底层逻辑是概率语言模型

它在回答问题时,不是真的像人类专家一样去进行严密的逻辑推导,而是根据庞大的语料库,拼凑出一段看起来最像正确答案的漂亮话

  • 它擅长:遣词造句、翻译、总结大意

  • 它弱项:SAT最爱考的字字抠字眼严密逻辑反直觉的语法硬规则、以及选项间的细微干扰排查

所以,拿着AI的答案去质疑官方题库,往往是缘木求鱼

AI可以辅助学习,但不能替代判断

面对AI这个新工具,我们不盲目排斥,但也绝不盲信。作为专业的SAT教学团队,PDA给同学们以下几点建议

🔎模考时:务必诚实作答,不借助任何外部工

报班前的摸底模考,是一次珍贵的全真体检。它的唯一目的,是测出你当下的真实水平

  • 如果你在模考时查了AI或翻了书,最终获得了一个虚高的分数,就会为你匹配高难度的班型

  • 进入高阶班后,由于缺乏基础或系统方法的铺垫,你听课会非常吃力,最终反而耽误了出分黄金期

  • 诚实面对错题,才能匹配最适合你的班型,有针对性地查漏补缺

而PDA的班型原本就是老师们通过反复教研推导出的最高效授课形式比大部分机构的授课时长都要短平均1/3-1/2,不靠多卖课时,靠的是传授备考“硬通货”带来的口碑。

我们拿SAT真题测试AI,结果有点意外……-第8张图片-四季读书网

🔎平时练习时:AI可用于梳理思路,但绝不可全

在日常刷题中,AI可以作为一个24小时在线的思路梳理器,但当你发现

  • AI给出的答案和老师讲的不一样

  • AI的解析和你自己的逻辑直觉冲突

  • 你觉得AI强行解释

请立刻停止相信AI

正确的做法是:截图留存题目带着疑问去找你的助教老师或直接在辅导群里@老师提问

只有真人名师,才能一针见血地指出你和AI共同掉进的陷阱,帮你真正吃透每一道真题,避开SAT的思维盲区

学习没有捷径,权威的体系和靠谱的老师,才是你通往SAT 1550+的高速公路

扫码添加小助手

发送关键字【SAT】

即可获得即刻咨询

我们拿SAT真题测试AI,结果有点意外……-第9张图片-四季读书网
我们拿SAT真题测试AI,结果有点意外……-第10张图片-四季读书网

—END—

我们拿SAT真题测试AI,结果有点意外……-第11张图片-四季读书网
我们拿SAT真题测试AI,结果有点意外……-第12张图片-四季读书网

还在靠刷题学AMC10/12?会用AI系统的孩子,已经开始“精准提分”了

我们拿SAT真题测试AI,结果有点意外……-第13张图片-四季读书网

“我把孩子送进美高顶私,没想到反而害了他?”

我们拿SAT真题测试AI,结果有点意外……-第14张图片-四季读书网

炸了!加州大学750位教授联名要求恢复标化,不看标化时代或将终结...

* PalmDrive Academy所有原创文章须授权才能在各大平台转载,严禁未经授权的转载、搬运,一经发现违者必究。也烦请广大家长和同学帮助我们监督和维权,凡告知有效信息即可获得礼包一份,感谢大家支持!

我们拿SAT真题测试AI,结果有点意外……-第15张图片-四季读书网

抱歉,评论功能暂时关闭!