点击上方“Github中文社区”,关注

看遍Github好玩的项目

第015期原创分享 作者:huber

大家好,我是hub妹,咱们又见面了!

最近看到小侄女整天抱着pad背诵古诗词,让我想起了自己曾经背诵诗词的苦逼时代,那时候没pad,  都是抱着课本啃,背不完当天任务就不让回家,现在想起来都有阴影……

那么问题来了:她们pad里的古诗词,数据都是哪来的?APP厂家自己收集的?还是有公共数据资源?  好奇之下网上查了一下,居然发现了GitHub上有这么个让人鸡冻的项目 : chinese-poetry

这可真是一个情怀项目啊,来自几十位贡献者,搜集出了最全的中华古典文集数据库,包含5.5 万首唐诗、26 万首宋诗、2.1 万首宋词和其他古典文集。诗人包括唐宋两朝近1.4 万古诗人,和两宋时期 1.5 千古词人。数据基本都是来源于互联网。

而且目前已经收获 Star 近 30k !

这么受欢迎的数据,把诗人们都给激动坏了:

为什么要做这个仓库?

据官方简介:古诗是中华民族乃至全世界的瑰宝,我们应该传承下去,虽然有古典文集,但大多数人并没有拥有这些书籍。从某种意义上来说,这些庞大的文集离我们是有一定距离的。而电子版方便拷贝,所以此开源数据库诞生了。此数据库通过 JSON 格式分发,可以让你很方便的开始你的项目。

词频分析

项目对数据库做了一个初步的词频分析,不过用现代技术去分析古诗词,总感觉怪怪的呢?????  这里列举部分词频分析图:

宋词受欢迎的词牌名:

宋词高频词:

宋词作者榜:

唐诗高频词:

唐诗作者榜:

已含数据集

每一个集合可直接点击进入子集,比如我点击诗经后,进入了诗经的子集页面,有进一步介绍:

诗经

中国最早诗歌总集, 《诗经》,是中国古代诗歌开端,最早的一部诗歌总集,收集了西周初年至春秋中叶(前11世纪至前6世纪)的诗歌,共311篇,其中6篇为笙诗,即只有标题,没有内容,称为笙诗六篇(南陔、白华、华黍、由康、崇伍、由仪),反映了周初至周晚期约五百年间的社会面貌。来自百科

数据格式

shijing.json

[

{

"title": "关雎",

"chapter": "国风",

"p": "周南",

"content": [

"关关雎鸠,在河之洲。窈窕淑女,君子好逑。",

"参差荇菜,左右流之。窈窕淑女,寤寐求之。",

"求之不得,寤寐思服。悠哉悠哉,辗转反侧。",

"参差荇菜,左右采之。窈窕淑女,琴瑟友之。",

"参差荇菜,左右芼之。窈窕淑女,钟鼓乐之。"

]

}

应用案例

项目还提供了数个应用案例:

咱们就点第一个案例看一下效果:

关于贡献

目前已经聚集了近30位贡献者

贡献的方式也很简单,可用自己的方式将采取到的古诗词以JSON格式按照项目官方标准提交即可

传送门

https://github.com/chinese-poetry/chinese-poetry

写在最后

中文诗词,之所以让人们从古至今都在学习,是因为那都是古人们思想与智慧的结晶,大家来随便欣赏几句李白被网友们评为最狂的诗句:

十步杀一人,千里不留行。

事了拂衣去,深藏身与名。

——《侠客行》

仰天大笑出门去,我辈岂是蓬蒿人。

——《南陵别儿童入京》

兴酣落笔摇五岳,诗成笑傲凌沧洲。

——《江上吟》

这个项目是一个典型的,拿GitHub当公共数据库使用的项目????????,这种方式简单并且方便维护,贡献者直接上传json文件就行,应用端对数据获取也很方便直接,开发者们能如此快捷的使用这些数据,都要归功于这些无私的贡献者们

大家请起立,为贡献者们鼓掌


OK!到这就是这期分享

如果觉得文章有意思,请点赞在看,分享。

历史原创

★ 卧槽!红色警戒游戏源代码被开源了!

 毫无破绽!用这个开源项目换了张脸后,连女朋友都难分真假,能否骗过刷脸支付?

★ 强!这个GitHub官方终端命令行工具!星标10K!真是让人相见恨晚啊

★ 当年锤子的大爆炸,如今12个语言版本都可轻松搞定!

点个在看呗!

另类!这项目没有一行代码,30k star 和 近40w的内容收录,登顶GitHub热榜相关推荐

  1. “狗屁不通文章生成器”项目登顶GitHub热榜~

    点击上方"IT平头哥联盟",选择"置顶或者星标" 你的关注意义重大! 前言 GitHub 被誉为全球最大的同性交友网站,--,陪伴我们已经走过 10+ 年时间, ...

  2. 这个GitHub项目,5天狂揽2500星登顶GitHub热榜

    前言 最近在 GitHub 上最火的项目是一个对视力友好的十六进制编辑器,它上线仅 5 天就收获了 2500 star,最近 24 小时涨了 1600 star 量. 十六进制编辑器是用于编辑单个字节 ...

  3. 滴滴开源AI项目登上GitHub热榜,人机对话模型可从论文到产品部署无缝衔接

    乾明 发自 凹非寺  量子位 报道 | 公众号 QbitAI 没想到,滴滴开源的自然语言理解(人机对话)模型训练平台,就这样登上了GitHub热榜. 这一项目名为DELTA,是一个深度学习模型训练框架 ...

  4. 腾讯最新开源项目登上GitHub热榜:QQ音乐等18项业务都在用,日均PV过亿

    乾明 发自 凹非寺  量子位 报道 | 公众号 QbitAI 腾讯又又又开源.这次是一个跨端框架,名为Hippy. 在GitHub上开源不到一周,便斩获近1200+星,一举登上趋势榜. 腾讯介绍称,H ...

  5. GitHub热榜第一,标星近万:这个用Python做交互式图形的项目火了

    乾明 发自 凹非寺  量子位 报道 | 公众号 QbitAI GitHub上,一份用Python做交互式图形的资源火了. 这一工具名为Bokeh,官方介绍称,它能读取大型数据集或者流数据,以简单快速的 ...

  6. Github 热榜项目:如何让你的终端酷炫到没朋友

    点击上方"小詹学Python",选择"加为星标" 第一时间关注Python技术干货! 作者:程序员G哥 来自:码农小黑屋 不知道你统计过没有,你一天运行过多少次 ...

  7. GitHub 热榜第一!这个 Python 项目超 8.4k 标星,网友:太实用!

    这个十一,又经历了一波抢票大战.常规办法根本抢不到,大家就把目光转移到"技术手段"上,顺便把一个Python抢票工具,送到了GitHub趋势榜第一: 标星超过8.4k,来自名叫文贤 ...

  8. GitHub 热榜:天才黑客开源新项目,不到 1000 行代码,1400 Star!

    点击上方"Github爱好者社区",选择星标 回复"资料",获取小编整理的一份资料 来自机器之心 在深度学习时代,谷歌.Facebook.百度等科技巨头开源了多 ...

  9. 一行代码都不用写,教你如何快速搭建Github博客!!!

    关注上方"深度学习技术前沿",选择"星标公众号", 资源干货,第一时间送达! 转载自量子位 GitHub不仅可以传代码,还可以建博客.利用GitHub Page ...

最新文章

  1. Java工具类之:包装类
  2. 流形学习之LLE(LocallyLinearEmbedding)模型
  3. es6 语法 (Promise)
  4. 函数参数---动态参数
  5. 分组密码Feistel结构补充说明
  6. OpenCV中cvAdds和cvAdd中的mask的用法探讨
  7. C#程序在线升级代码---webservice
  8. c语言自己编译自己,TCC研究(一): Tiny C Compiler最小的C语言编译器,自己编译自己...
  9. Oracle 数据文件迁移过程中 执行 shartup mount 报ORA03113:通讯通道的文件结尾 问题解决过程
  10. ssh远程连接Ubuntu 20.04
  11. NGUI Sprite的各种Type(Simple、Sliced、Tiled、Filed、Advanced)
  12. thinkpad触控笔怎么用_联想yoga720触控笔怎么用
  13. 拒酒词、与领导喝酒的诀窍、酒量不行的技巧
  14. 你以为 Snapchat 做的是社交,但它却说自己是一家相机公司
  15. 将JSON数组转化为List集合
  16. 妞,你给爷听好了...
  17. mysql表名备注_「备注」mysql添加备注信息 - seo实验室
  18. valine评论系统使用
  19. 【我遇到了更好的你】
  20. 游戏类APP应用周末下载量达最高

热门文章

  1. 编译opencv出现Could NOT find PythonLibs: Found unsuitable version “3.6.9“, but required is exact version
  2. Qt之实现360安全卫士主界面(一)
  3. Unity标准开发实例——Shuriken粒子系统06
  4. 某网络安全公司员工,窃机密信息进行内幕交易获利超700万美元
  5. 毕业设计游戏商城项目
  6. VUE动态变换背景图片的实现 +背景图片铺满+ 一般路由的配置
  7. 再用电子计算机会计的,关于附发“中国人民建设银行会计核算应用电子计算机暂行规定》的通知...
  8. python3 [爬虫入门实战]爬虫之scrapy爬取织梦者网站并存mongoDB
  9. 【ArduPilot开发指南】1.2.7 完整的参数列表 - BATTx_参数
  10. java的学习--第二章 java流程控制