查词猫

哪个语料库可以免费试用

什么是语料库?

答:该语料库是由国家语言文字工作委员会主持,面向语言文字信息处理、语言文字规范和标准的制定、语言文字的学术研究、语文教育以及语言文字的社会应用,总体规模达1 亿字,语料时间跨度为1919-2002年,收录了人文与社会科学、自然科学及综合三个大类约40个小类的语料。

本语料库包括哪些内容?

答:本语料库包括2008至2013六年的34,039个广播、电视节目的转写文本,总字符数为241,316,530个,总汉字数为200,071,896字次。 所有文本都进行了分词和词性标注,共计135,767,884词次。

现代汉语语料库在线提供免费检索的语料是多少?

答:现代汉语语料库在线提供免费检索的语料约2000万字,为分词和词性标注语料。 http://www. 网站现在还增加了一亿字的古代汉语生语料,研究古代汉语的也可以去查询和下载。 同时,还提供了分词、词性标注软件、词频统计、字频统计软件,基于国家语委语料库的字频词频统计结果和发布的词表等,以供学习研究语言文字的老师同学使用。 http://www. 《人民日报》标注语料库中一半的语料 (1998年上半年)共1300万字已经通过《人民日报》新闻信息中心公开提供许可使用权。 其中一个月的语料 (1998年1月)近200万字在互联网上公布,供自由下载。 http://www.

什么是语料库统一检索平台?

答:杨百翰大学的Mark Davies教授开发的语料库统一检索平台,整合了美国当代英语语料库、美国历史英语语料库、美国时代杂志语料库、BNC、西班牙语料库、葡萄牙语料库等6个语料库的资源。 该网站每月有60,000人的使用量,也许是目前最广泛使用的网络语料库。

免责声明
查词猫是一个由大数据和网友共同维护的在线词典工具,其大数据部分是基于自然语言处理和文本理解技术生成。如果您发现信息不准确、不完整、涉嫌侵权或违规,请通过 ai@know.email 联系我们,我们会根据相关法律规定及时处理。
未经许可,禁止商业网站等复制、抓取查词猫内容;合理使用者,请注明来源于www.chacimao.com
基本信息
中文名
哪个语料库可以免费试用
摘要
什么是语料库?答:该语料库是由国家语言文字工作委员会主持,面向语言文字信息处理、语言文字规范和标准的制定、语言文字的学术
词条统计
所属栏目
更新时间
2024-06-25 15:49
内容字数
777