目录

数据格式总览

第一页

OMAHA术语集样例

webdatacommons数据集

中文症状库 热门

快雨-证券数据api

基于limes的中文知识图谱融合实战演练教程

国内主要中文百科知识图谱之间的链接数据集 热门

中文百科知识图谱Zhishi.me-提供Dump 热门

Zhishi.me 热门

清华大学-科技知识图谱 热门

北京大学中文百科知识图谱-PKU-PIE 知识库 热门

中文百科知识图谱-zhOnto-提供Dump 热门

基于CNSchema的城市知识图谱(交通数据) 热门

空气质量语义描述

第二页

OpenStreetMap和Wikidata的实体链接数据集(部分国外区域)

百科人物概念与实例 热门

KG-Buddhism

音乐知识图谱 热门

日本餐厅数据 热门

天气语义数据 热门

XLORE双语百科知识图谱 热门

影视双语知识图谱 热门

中医医案知识图谱 热门

第三页

YAGO多语言知识库(包含中文) 热门

Microsoft Concept Graph

城市内涝语义数据 热门

BabelNet-多语言百科字典和语义网络 热门

中国旅游景点知识图谱 热门

人物类RDF知识 热门

疾病术语集 热门

Linked Open Schema

MulType

观测指标标识符逻辑命名与编码系统

乳腺癌临床试验语义标注

第四页

Music 热门

新三板企业数据

突发事件知识图谱 热门

Clinga 热门

Zhishi.lemon

herbnet

第五页

结论


数据格式总览

OpenKG共有86个数据集。

首先,我们看一下其格式的标签列表。

可能与三元组相关的标签(一个数据集可能有多个标签)的总计数为 51,不算特别多,所以我打算把每个数集看一下,看看有没有 满足大小在 1G-10G

所有数据集共有5页。

下面图片中红框为可能符合要求的,其余   绿框内为格式或大小肯定不符合要求的。

第一页

下面我们一一来看第一页有可能可用的数据集

OMAHA术语集样例

 下载后发现大小只有15k。

webdatacommons数据集

没有rdf格式的数据。

中文症状库 热门

进行下载后总大小只有10M

快雨-证券数据api

基于limes的中文知识图谱融合实战演练教程

是一个教程,测试数据大小28M。

国内主要中文百科知识图谱之间的链接数据集 热门

上图中可以看到四个文件的大小。

中文百科知识图谱Zhishi.me-提供Dump 热门

大小2.64G

下载解压后打开发现有非常多的压缩文件,数据都压扁了:

打开看文件内容

Zhishi.me 热门

对里面的所有可获取文件进行下载,发现和上一个数据集是一样的。

清华大学-科技知识图谱 热门

北京大学中文百科知识图谱-PKU-PIE 知识库 热门

分别点击三个浏览

尝试右击,没有反应

中文百科知识图谱-zhOnto-提供Dump 热门

基于CNSchema的城市知识图谱(交通数据) 热门

数据是按月份归档的,浏览第一个:

尝试下载或另存为这个文件,发现是禁止的:

空气质量语义描述

除了本体描述都是JSON-LD

第二页

http://www.openkg.cn/dataset?_res_format_limit=10&page=2

OpenStreetMap和Wikidata的实体链接数据集(部分国外区域)

浏览数据集:

发现 subject一直是主语,没有作为object,往下继续浏览这个文件也是。 下面检查一个ttl中的subject是否会是另一个文件的object:

包含的主语有  <http://openstreetmap.org/node/41231232> , 宾语均为属性。

包含的主语有: 包含的主语有  <http://openstreetmap.org/node/41231232>, 实体宾语有 <http://www.wikidata.org/wiki/Q355827>

没有实体宾语。

至此所有ttl文件,检查完毕,只有sameas 关系连接了两个实体,但是只有一跳。

百科人物概念与实例 热门

三个文件加起来不到100M。

KG-Buddhism

只有API,没有下载,且triple总数为 324,911,非常小。

音乐知识图谱 热门

网页数据无法下载或复制,且数据加载很快,估计不超过10M。

日本餐厅数据 热门

天气语义数据 热门

浏览第一个,下载下来是owl,且瞬间就下载下来了。

XLORE双语百科知识图谱 热门

影视双语知识图谱 热门

只有样例数据,尝试进入门户(查询系统),看是否开放源数据:

结果无法访问。

中医医案知识图谱 热门

该网站不提供下载。

第三页

http://www.openkg.cn/dataset?_res_format_limit=10&page=3

YAGO多语言知识库(包含中文) 热门

最后链接到yago官网,yago源数据集都是压扁的,且非常大。

Microsoft Concept Graph

对数据进行下载:

大小为300M

谓语都是数字

城市内涝语义数据 热门

BabelNet-多语言百科字典和语义网络 热门

搜索网站,没有下载。

中国旅游景点知识图谱 热门

人物类RDF知识 热门

文件瞬间打开,且subject不出现在object中。

疾病术语集 热门

Linked Open Schema

MulType

 

宾语全部都是属性

观测指标标识符逻辑命名与编码系统

乳腺癌临床试验语义标注

第四页

http://www.openkg.cn/dataset?_res_format_limit=10&page=4

Music 热门

11.4M

新三板企业数据

点击进去后是API文档:

突发事件知识图谱 热门

300kb不到

Clinga 热门

详细阅读文件后,找不到多跳关系。

Zhishi.lemon

跟之前的zhime差不多

herbnet

门户无法打开:

第五页

OpenKG数据逐一截图说明相关推荐

  1. Python win32com 控制excel自动刷新保存数据并截图发送到企业微信

    Python win32com 控制excel自动刷新保存数据并截图发送到企业微信 业务需求 功能模块 爬虫 运行excel宏,刷新保存excel数据 指定区域截图 发送图片到企业微信 业务需求 每天 ...

  2. C# 串口+示波+数据存储+截图

    小菜鸡学习C#一个星期的心得 因学校课设需要,小学期期间花了几天学了一下C#,因为没有人带,纯野生的那种,就算是现在的作品也有不少的Bug,但应付一下答辩什么的还是可以的,费话不多说,先讲讲我的处女作 ...

  3. python tkinter编写界面,使用win32com操作excel获取数据生成截图后,wxpy登录微信,给租客发送房租(二)

    '''Open_Excel是根据每个excel里的每个租客租金详情,生成房租信息send_info 以及对应的表格图片过程:Open_Excel(月份) 输入月份实例化get_send_info() ...

  4. python自动化表格截图_python自动化操作——excel刷新数据并截图发送微信

    1 importos2 importwin32gui, win32api, win32con, win32com3 from win32com.client importDispatch4 from ...

  5. python自动化操作——excel刷新数据并截图发送微信

    我真的是服了,一堆复制党到处粘贴,也太肆无忌惮了吧,麻烦尊尊下版权好吗,好歹这也是我辛辛苦苦写出来的......   原封不动的抄,错了的也不知道.真的是搞笑!   1 import os2 impo ...

  6. python tkinter编写界面,使用win32com操作excel获取数据生成截图后,wxpy登录微信,给租客发送房租(三)

    tkinter界面: 这部分很大坨,不过跟上部分一样,代码里备注得很完整了,慢慢消化就能看得懂了!! 操作步骤: 运行程序后, 1.先点击"获取房租信息"按钮,所有租客该月的房租信 ...

  7. python tkinter编写界面,使用win32com操作excel获取数据生成截图后,wxpy登录微信,给租客发送房租(一)

    家里有几个单间出租,可是每到月头收房租就是件麻烦事,挨个挨个去收,对方有时候不在,或者说还没出粮,过几天再给,又或者没到时间,太麻烦了,而且还得写收据,学了python这么久,自己来写个GUI,用ex ...

  8. python抓取网页数据并截图_手把手教你使用python抓取并存储网页数据!

    作者:刘早起 来源:早起Python 爬虫是Python的一个重要的应用,使用Python爬虫我们可以轻松的从互联网中抓取我们想要的数据,本文将基于爬取B站视频热搜榜单数据并存储为例,详细介绍Pyth ...

  9. python抓取网页数据并截图_python实现自动网页截图并裁剪图片

    本文实例为大家分享了python自动网页截图并裁剪图片的具体代码,供大家参考,具体内容如下 代码: # coding=utf-8 import time from selenium import we ...

  10. python抓取网页数据并截图_网络爬虫-使用Python抓取网页数据

    搬自大神boyXiong的干货! 闲来无事,看看了Python,发现这东西挺爽的,废话少说,就是干 准备搭建环境 因为是MAC电脑,所以自动安装了Python 2.7的版本 添加一个 库 Beauti ...

最新文章

  1. AVL树入门(转载)
  2. 【实习项目记录】(一)加密算法MD5和RSA
  3. java接收的文件转换成临时文件_Android中怎样使用createTempFile实现将字节数据创建到临时文件并转换成FileOutputStream和FileInputStream...
  4. 可爱的穆里尼奥,可爱的切尔西!
  5. 协议簇:TCP 解析: Sequence Number
  6. SDN精华问答 | 了解SDN架构
  7. c语言爱心代码空心,c语言心形图案代码,是什么?
  8. 基于Spark的电影推荐系统(电影网站)
  9. Android OpenSL ES 开发:Android OpenSL 录制 PCM 音频数据
  10. 【Java基础知识 1】Java入门级概述
  11. Z-Wave 700 秘钥生成、固件签名、及OTA过程
  12. 【阿里云ECS使用FTP】使用FileZilla连接阿里云Windows服务器
  13. Java面试题(九)-----编写程序实现判断E: / 根目录下是否有后缀名为.jpg的文件,如果有则输出文件名称
  14. 【词汇】BOSS系统
  15. python3 urllib 内存泄露_【专家专栏】张昊 | 从urllib2的内存泄露看python的GC
  16. 久别重逢的 std::bad_alloc
  17. 怎样清除浏览器缓存?
  18. C语言考试知识点汇总(实践知识点)
  19. 2017-3-18号巽寮湾游记
  20. linux系统老毛桃怎么安装,windows10系统怎么安装运行linux系统

热门文章

  1. Android WiFi功能实现,知其然必知其所以然! (二)
  2. QProgressDialog setValue过快导致死机问题记录
  3. nodejs设置镜像源
  4. 属性动画和补间动画的原理及区别
  5. 华佗穿越来教程序员睡觉
  6. 大数据时代是什么意思?
  7. 用python画滑稽表情_Python-画一个滑稽
  8. 对强化学习理解及其与有监督学习和无监督学习的比较
  9. Ubuntu联网安装GCC
  10. Java setlocale方法_Java Configuration.setLocale方法代碼示例