首页
本馆概况
本馆简介
馆舍位置
馆藏分布
馆舍风貌
开馆时间
资源导航
馆藏资源
电子资源
数字特藏
开放资源
专题活动
培训讲座
展览展示
读书沙龙
主题活动
下载专区
读者服务
特色服务
常见问题
电话咨询
好书荐购
意见与建议
馆藏资源
本社教材
外社教材
外文教材
中外文报刊
中外文图书
电子资源
已采购
试用
数字特藏
开放资源
外文数字资源
中文数字资源
公开课
当前位置    图书馆首页 > 资源导航 > 电子资源 > 已采购
English Corpora平台(含COCA&BNC)

  数据库简介

  English Corpora英语语料库每月的使用人数超过17万人,为目前使用最广泛的语料库之一,平台整合了多个常用的语料库资源。本次打包采购,平台上所有语料库均有使用权限,包括最常用的COCA和BNC。

  美国当代英语语料库COCA(The Corpus of Contemporary American English): 包含19万篇文本中约4.5亿个单词,收录年度1990-2012,分为话语、小说、杂志、报纸、学术5大类。

  英语国家语料库BNC(British National Corpus):包含1亿个单词,收录年度1980-1993。BNC语料库最初由牛津大学出版社于1980-1990年建立。English Corpora平台收录BNC完整的语料信息,采用的版本为CLAWS 7 tagset。

  访问网址

  https://www.english-corpora.org

  访问方式

  注册个人账号后IP地址登录,无并发用户限制。

  登录指南

  打开网站,选择要使用的数据库,需要注册个人账号,机构选择“Other”。

  提交后再返回登录,如果之前注册过个人账号,直接输入账号登录。登录后提示机构认证,选择“academic license”,在下页选择“Join by IP address”如下图:

  然后返回主页,重新选择想要访问的语料库,右上角账号头标显示绿色和“LOGGED IN”,表明机构权限已认证,显示如下图:

  机构认证

  第一次绑定IP后,如以后登录时提示选择机构,可按照如下操作绑定机构名称,之后再访问语料库时就不会提醒了。

  授权语料库列表

  以下语料库资源均可以在平台检索并查看词条详细信息:

 

Corpus (online access)

Download

# words

Dialect

Time period

Genre(s)

iWeb: The Intelligent Web-based Corpus

√

14 billion

6 countries

2017

Web

News on the Web (NOW)

√

12.1 billion+

20 countries

2010-yesterday

Web: News

Global Web-Based English (GloWBE)

√

1.9 billion

20 countries

2012-13

Web (incl blogs)

Wikipedia Corpus

√

1.9 billion

(Various)

2014

Wikipedia

Corpus of Contemporary American English (COCA)

√

1.0 billion

American

1990-2019

Balanced

Coronavirus Corpus

√

894 million+

20 countries

Jan 2020-yesterday

Web: News

Corpus of Historical American English (COHA)

√

400 million

American

1810-2009

Balanced

The TV Corpus

√

325 million

6 countries

1950-2018

TV shows

The Movie Corpus

√

200 million

6 countries

1930-2018

Movies

Corpus of American Soap Operas

√

100 million

American

2001-2012

TV shows

 

Hansard Corpus

 

1.6 billion

British

1803-2005

Parliament

Early English Books Online

 

755 million

British

1470s-1690s

(Various)

Corpus of US Supreme Court Opinions

 

130 million

American

1790s-present

Legal opinions

TIME Magazine Corpus

 

100 million

American

1923-2006

Magazine

British National Corpus (BNC) *

 

100 million

British

1980s-1993

Balanced

Strathy Corpus (Canada)

 

50 million

Canadian

1970s-2000s

Balanced

CORE Corpus

 

50 million

6 countries

2014

Web

From Google Books n-grams

American English

 

155 billion

American

1500s-2000s

(Various)

British English

 

34 billion

British

1500s-2000

(Various)

 

点击下载:
©版权所有  人民教育出版社      京ICP备05019902号      新出网证(京)字016      京公网安备11010802038276号