词汇吧 关注:527贴子:3,931
  • 3回复贴,共1

COCA Frequency 60000词频表 美国当代英语语料库

只看楼主收藏回复

最近有朋友问我应该如何提高词汇量。一言以蔽之,学习和背诵 COCA 语料库词频表是快速大量积累英语词汇的终极法门。

据 testyourvocab.com 统计,成年英语母语人士的词汇量达到20000至30000词的水平且保持稳定增长。
其中10岁的母语者词汇量就达到了 10000 左右,而17岁的高中生已有20000的词汇量。
然而,非英语母语人士的词汇量平均只有 4000 多词。
大部分人都觉得自己的英语学了很多年依旧不够好。其实这跟词汇量不够有直接的关系。
COCA 是什么
COCA 是美国当代英语语料库 (Corpus of Contemporary American English) 的简称。
用三个字概括 COCA 语料库 :大、全、新。
COCA 是美国最新、最大的免费当代英语语料库。COCA 现已囊括了高达5.6亿个词汇,且以每年两千万的数量持续扩充。因此,COCA 具有很高的实时性(或许不易觉察,但每一种语言用词都是持续变化的,up-to-date 很重要)。
COCA 词频表
基于 COCA 庞大的五亿单词语料库,美国杨百翰大学利用算法提取出了在美语中使用频率最高的前 5000 和 20000 高频词。
值得一提的是,这 20000 个高频词的覆盖率非常高, 不管你是准备参加 GMT 还是 GRE, 四六级就更不用说了,无论是哪一种权威英语考试,或者仅以语言表达为目的,你都可以使用这份 COCA 词表。
以前背单词的时候,总觉得单词书里面的单词只要合上书下一次就不知道和它们到哪里再相见了。
而 COCA 语料库的数据,是来源于近年间的电影、各类电视节目、演讲、小说、学术文章、杂志报刊等。
背这份语料库里面的单词时,你可以肯定每一个你见到的单词,都是来自真实的语言环境,以后随时有机会在同样的语境下使用到它们。
现在单词我们已经有了,剩下就是如何使用好每一个词汇的问题。
这份高频词汇表已经为每个单词注释了 Collocation 搭配用词,这也就解决了英语单词最实际的使用问题。
不得不感叹人家想得真周到啊!如果只是孤立的背单词,每一个新词就如同一座孤岛,就算不被遗忘,也只能只身在记忆的银河中飘荡,但如果有了 collocation, 就相当于把和这个单词关系度最高的词汇使用场景串联在了一起。
另外,COCA 词频表的词条是按照语料库中单词的出现频率排序的。
比如,在 COCA 20000 词频表中,序号标注为 1 的是 “the", 也就代表 ”the" 是出现频率最高的单词。单词 “ relationship" 排名第 487 位。单词 ”ignore"排名第1382位,单词 “ colossal" 排名第13106位。


1楼2020-09-30 18:48回复
    点击以下链接,免费获取网盘资源:http://www.acadsocclub.com/thread-16550-1-1.html


    3楼2021-07-22 18:58
    收起回复