我一直强调精读真题的重要性。单词、语感、作文素材都可以从历年真题里积累。我说如果你有高考要求的4500词汇量,做自考英语二的题就足够了,有的人还不信。我将24套真题电子化之后进行了统计,用数据说话。请看下图:

从上图统计结果可以看出,历年考题中所有用过的词,加一块都没超过4500词(这里面包含了人名地名等专有名词)。我之前说4500基础词足够了,不是瞎说吧?
我们再来看使用频率最高的20个词:

这里面有任何一个词你不认识吗?根据统计规律,这些简单词出现频率和所占篇幅是最大的。前100个高频词覆盖了总词次的 42.3%!这些高频词承担了主要的表意功能。
我们再来看,每年考题的总词汇使用量,每张试卷用2000个左右的单词。

这2000个单词包含了人名地名和一些加了中文解释的超纲词。通过统计,我们发现历年考题的难度都比较稳定,用词符合统计规律。
掌握历年真题中最高频的1000词,考试中你就能认得卷面上将近百分之八十的单词!有这个基础,做题是足够了。不比在不认识的词上浪费太多精力。
基于统计分析的 80%覆盖率阈值 ,意味着:
- 掌握核心词汇可以理解80%的文本内容
- 能够把握文章大意和主要信息
- 可以应对大部分阅读理解题目
统计结果符合齐夫定律
词频分布规律发现Zipf 定律符合性:
前 500 个高频词基本符合 Zipf 定律,双对数坐标下呈现近似直线分布
低频词(排名 500 以后)偏离理论分布,这符合自然语言的普遍规律。
高频词覆盖效应显著:
前 100 个高频词覆盖了总词次的 42.3%,
体现 "少量高频词承担主要表意功能" 的语言特性
前 500 个高频词覆盖了总词次的 68.7%,
说明掌握核心词汇对理解试卷至关重要
前 1000 个高频词覆盖了总词次的 79.5%,
接近 80% 的理解阈值
如果想要达到良好的理解,至少需要1608个单词。但是这1608个单词也是有水分的,比如地名、人名、不影响做题的专有名词及超纲词等。

🎯 具体学习建议
1. 入门级别(100个高频词)
- 覆盖率:49%
- 包含:the, to, and, of, in, you, is, it, for, that 等最基础词汇
- 这是绝对的基础,必须100%掌握
2. 基础理解(806个单词)
- 覆盖率:80%
- 能够:
- 理解文章主旨
- 把握段落大意
- 回答大部分阅读理解题
- 适合:时间有限,只求通过的学习者
我猜大部分能看到这篇文章的朋友都能达到1000的单词量吧。如果达不到的话,考试就只能靠蒙了。
3. 良好理解(1608个单词)
- 覆盖率:90%
- 能够:
- 流畅阅读全文
- 理解细节信息
- 应对各种题型
- 适合:希望取得好成绩的学习者
想要拿到70分,我想这一千五左右的高频词一定要掌握的。
4. 精通掌握(2481个单词)
- 覆盖率:95%
- 几乎可以理解全部内容
- 适合:追求高分,希望深入理解的学习者
💡 重要发现
高频词效应显著 :前100个词就覆盖了49%的内容,说明英语中高频词的使用非常集中
2. 长尾效应明显 :
1674个词(38.3%)只出现1次
这些低频词对理解影响有限
出现2次以上的词有2700个
出现3次以上的词有1970个
📝 实用建议
对于自考英语(二):
1. 最低目标 :掌握 806个核心词汇
- 可以应对大部分考试内容
- 通过考试的可能性很高
2. 推荐目标 :掌握 1608个词汇
- 能够舒适地阅读理解
- 获得较好成绩
3. 学习策略 :
- 优先掌握高频词(前806个)
- 低频词通过上下文猜测
- 不需要背诵全部4373个单词
我对这1608个高频词进行了整理(删掉人名、国家地区名等专有名词)把单词恢复了原型。最后剩下1400余个单词。
从统计上来说,认识这1400多个单词(及其其他形式),就可以认识卷面上八九成的单词。能不能理解句子还要看其他因素。也就是说,认识这1400多个词,不一定能看懂句子,但是不认识这些单词就不可能看懂句子。
还有时间。这一千多个词,一定要背会。需要这份单词表的,点赞收藏转发后欢迎加我微信索要。

如有问题❤️欢迎反馈