国内可用免费语料库(凡没有标注不可用的链接均可用)

(一) 国家语委
1.国家语委现代汉语语料库http://www.cncorpus.org/

现代汉语通用平衡语料库现在重新开放网络查询了。重开后的在线检索速度更快,功能更强,同时提供检索结果下载。现代汉语语料库在线提供免费检索的语料约2000万字,为分词和词性标注语料。

2.古代汉语语料库http://www.cncorpus.org/login.aspx

网站现在还增加了一亿字的古代汉语生语料,研究古代汉语的也可以去查询和下载。同时,还提供了分词、词性标注软件、词频统计、字频统计软件,基于国家语委语料库的字频词频统计结果和发布的词表等,以供学习研究语言文字的老师同学使用。

(二) 北京大学计算语言学研究所

《人民日报》标注语料库http://www.icl.pku.edu.cn/icl_res/

《人民日报》标注语料库中一半的语料(1998年上半年)共1300万字已经通过《人民日报》新闻信息中心公开提供许可使用权。其中一个月的语料(1998年1月)近200万字在互联网上公布,供自由下载。

(三) 北京语言大学

汉语国际教育技术研发中心:HSK动态作文语料库http://202.112.195.192:8060/hsk/login.asp

语言研究所:北京口语语料查询系统(B J K Y)

语料库资源————(一)相关推荐

  1. 语料库资源————(三)

    语料库资源在线: http://www.cncorpus.org/Resources.aspx   语料库文档资料    国家语委现代汉语语料库介绍  ※下载次数:5481     国家语委现代汉语语 ...

  2. 对外汉语语料库有哪些_[转载]史上最全最新的语料库资源大全【对外汉语教学研究工具】...

    果断收藏!分享给好友!史上最全最新的语料库资源大全.本文持续更新,欢迎订阅期刊<对外汉语北京>以便获得最新通知! [期刊] International Journal of Corpus ...

  3. 《自然语言处理》的相关资源

    特别推荐系列: 1.HMM学习最佳范例全文文档,百度网盘链接: http://pan.baidu.com/s/1pJoMA2B 密码: f7az 2.无约束最优化全文文档 -by @朱鉴 ,百度网盘链 ...

  4. 深度学习数据集标注工具、图像语料数据库等资源

    NLP+VS︱深度学习数据集标注工具.图像语料数据库.实验室搜索ing... 2017年02月07日 12:12:01 阅读数:27032 ~~因为不太会使用opencv.matlab工具,所以在找一 ...

  5. 摘要:语料库语言学自问世以来一直备受关注,其发展十分迅速。语料库语言学除了学科自身发展之外,还成为语言研究和语言教学研究的新工具。而语料库在语言测试方面的研究则以Alderson发表的《语料库在语言

    语言学研究 本栏目责任编辑:谢媛媛 Overseas English 海外英语 2018年6月 语料库在语言测试开发和设计中的应用 苏恒 (西南政法大学,重庆 401120) 摘要:语料库语言学自问世 ...

  6. 做项目一定用得到的NLP资源【分类版】

    文章大纲 语料库 词库及词法工具 预训练语言模型 抽取 知识图谱 文本生成 文本摘要 智能问答 文本纠错 语音处理 文档处理 表格处理 文本匹配 文本数据增强 常用正则表达式 文本检索 阅读理解 情感 ...

  7. 【转】国内可用免费语料库

    中国自然语言开源组织:http://www.nlpcn.org/ (一) 国家语委 1国家语委现代汉语语料库http://www.cncorpus.org/ 现代汉语通用平衡语料库现在重新开放网络查询 ...

  8. 转:资源 | 我爱自然语言处理

    转自:http://www.52nlp.cn/resources 这里提供一些52nlp博客的一些系列文章以及收集的自然语言处理相关书籍及其他资源的下载,陆续整理中!如有不妥,我会做删除处理! 特别推 ...

  9. 文本分类step by step(二)

    (注:如有转载请标明作者:finallyliuyu, 和出处:博客园) <文本分类 step by step(一)> 在<文本分类step by step(一)>中,我们从处理 ...

  10. chatbot:基于 AIML 的 PHP 聊天机器人

    基于AIML的PHP聊天天机器人 本文章中讲介绍用PHP实现的一个小聊天机器人程序,用到了php操作dom相关的知识和mysql数据库,可以用来学习.代码可以从https://github.com/k ...

最新文章

  1. boost::fusion::back_extended_deque用法的测试程序
  2. jenkins 安装android 插件, gradle 插件搭建linux构建机器
  3. Http协议(7)—Http缓存
  4. mac电脑如何与手机同步复制粘贴_如何将电脑里的文件同步到手机里?
  5. java tostring方法_Java虚拟机如执行方法调用的(二)?
  6. Latex的表格注释
  7. 图表(Chart Graph)你真的用对了吗?
  8. TensorFlow 学习(九)—— 初始化函数(概率分布函数 api、常数生成函数)
  9. centos 安装mysql5.7
  10. CABasicAnimation 按home键后台之后,再切回来动画就停止
  11. Mysql报错(必解决):The user specified as a definer (‘mysql.infoschema‘@‘localhost‘) does not exist
  12. [转载]Coursera课程批量下载(保持资源原目录结构)
  13. 支持hicar的华为手机
  14. Matlab线性规划求解
  15. 自学车载以太网笔记(1)
  16. 斯坦福大学C语言课程观后感,看《斯坦福大学公开课:编程方法学》有感之一...
  17. 一文读懂什么是数据产品交易
  18. Python爬虫教程,采集bilibili弹幕并生成词云
  19. dell电脑如何安装ubuntu系统_Dell电脑 U盘启动盘 安装ubuntu
  20. spark分区读写mysql

热门文章

  1. SmartDeblur-图片模糊处理器
  2. C# ffmpeg工具将视频转为SWF格式
  3. QQ默认表情消失的解决办法
  4. html文件vbs病毒,又一个VBS病毒源码的解密
  5. 【IT之路】LoadRunner系列-Win7 64bit下搭建Loadrunner11破解版
  6. 股票分时数据HTML,股票历史分时数据
  7. 基于mint-ui的移动应用开发案例一(简介)
  8. java jre 和jed_需要jre的软件如何安装,如jedit?
  9. android 浏览器抓包工具下载,WebSee app下载-WebSee抓包工具v1.2.1 安卓版-腾牛安卓网...
  10. mysql php apache源码_用源码包安装php+mysql+apache+vbb总结