Freebase 文章数量超过英文维基百科达400万篇
世界上最大的语义知识库 Freebase 今天宣布,他们的文章总数即将超过400万篇,比英文维基百科的 240万篇超过60%,接近全语种(250种语言)维基百科1000万篇的一半。
什么是 Freebase
Freebase 是一个由计算机和人共同组织维护的一个庞大的信息库,它通过 wikipedia, MusicBrainz 一类的信息源,加上人工上传和编辑,对知识和信息进行采集,整理,归纳,并提供语义技术,以便更好地从中查找资料。
很多 Web2.0 公司使用 Freebase 的数据库,对某个领域的知识进行归纳,获得有价值的资料,如:
- Taught or Not - 一个非常可爱的小游戏,用来测试你对历史上那些思想家之间的相互影响关系的了解。
- Shot or Not - 另一个有趣的游戏,测试你对有些历史著名人物死因的了解。
- Random Walk Through Influences - 一个小程序,输入某个艺术家的名字,你就可以知道他受哪个流派影响。
- Pull Quotes - 如果你对政治感兴趣,这个网站值得一看。
- Powerset - 刚刚以1亿美金卖给微软的 Powerset 也使用 Freebase 作知识来源。
本文国际来源:http://www.readwriteweb.com/archives/metawebs_freebase_now_60_large.php 中文翻译来源:COMSHARP CMS 官方网站
Freebase 文章数量超过英文维基百科达400万篇相关推荐
- hexo博客生成博文,当生成的文章数量超过1000时,耗尽所有内存资源后出现out of memory
问题 当hexo生成博文的时候,你的文章数量超过1000.2000或3000时,就是文章数量很多时,会出现生成不了的情况,具体的错误是out of memory,具体的错误如下: ATAL ERROR ...
- Gensim官方教程翻译(五)——英文维基百科的实验
仅供个人学习之用,如有错误,敬请指正.原文地址 为了测试gensim的性能,我们在维基百科英文版上运行了一些实验. 这个页面描述了获取与处理维基百科的过程,以便任何人都能再现这个结果.本教程要求已经正 ...
- 利用Gensim训练关于英文维基百科的Word2Vec模型(Training Word2Vec Model on English Wikipedia by Gensim)
Training Word2Vec Model on English Wikipedia by Gensim 更新:发现另一篇译文:中英文维基百科语料上的Word2Vec实验,该译文还提供了中文维基百 ...
- 摩根大通正在放出更多区块链职位,数量超过任何一家华尔街企业
点击上方 "蓝色字" 可关注我们! 暴走时评: 美国最大的银行摩根大通正在不断放出大量区块链工作岗位,其数量超过任何一家金融企业.此外,过去一年中,摩根大通是十大公司中唯一一家发布 ...
- CSDN:因博主近期注重写专栏文章(已超过150篇),订阅博主专栏人数在突增,近期很有可能提高专栏价格(已订阅的不受影响),提前声明,敬请理解!
CSDN:因博主近期注重写专栏文章(已超过150篇),订阅博主专栏人数在突增,近期很有可能提高专栏价格(已订阅的不受影响),提前声明,敬请理解! 目录 博客声明 大数据了解博主粉丝 博主的粉丝群体画像 ...
- SharePoint List item数量超过5000的解决办法
SharePoint一个list里面的item数量超过5000会提示"视图无法显示,因为超过管理员限制设定的列表视图阈值" 在CSDN里面有比较好的解决方案,在这里先记录下来,以后 ...
- Android中当item数量超过一定大小RecyclerView高度固定
Android中当item数量超过一定大小时,将RecyclerView高度固定 方法1 直接通过LayoutParams来设定相应高度 ViewGroup.LayoutParams lp = rv. ...
- 统计个人CSDN的博客文章数量
统计个人CSDN的博客文章数量 第一版 原始版本比较简单 只能统计第一页,而且没有进行排序 # coding:utf-8 import urllib2 from bs4 import Beautifu ...
- CSDN发表文章数量限制的缺陷
假期闲着没事,编译了一把doubango.吾详细记录了所有下载源码.编译细节.为了方便查询,每个模块都发表一篇文章.一天之内只能发表10篇,多余的第二天发.然后吾确认了一个缺陷: 如果当天发表文章不超 ...
- python爬取pubmed的文献_利用selenium爬取pubmed,获得搜索的关键字最近五年发表文章数量...
PubMed 是一个提供生物医学方面的论文搜寻以及摘要,并且免费搜寻的数据库.是一个做生物方面经常要用到的一个查找文献的网站.最近刚学了爬虫相关的知识包括urllib库,requests库,xpath ...
最新文章
- html表单的创建和css的构成
- android 拨打电话 号码判断
- 两雄争霸:解读MSU2019年度视频编码大赛
- javafx 内存占用_JavaFX:TouchGesture内存泄漏?
- 我为什么在这里写博客
- Nginx高并发系统内核优化
- ! [remote rejected] master - master (pre-receive hook declined)
- 华为平板电脑_华为MatePad Pro 5G:云游戏、云电脑加持,这台平板不只是平板
- python期末考试及答案单引号、双引号和三引号_python脚本中单引号’ 双引号“ 三个单引号‘’‘ 三个双引号”“” 差别 及反斜杠的用法...
- java如何建立数据库_Java怎么连接数据库
- 小米路由器r2d_小米路由器R2D亮黄灯维修
- 高通功耗调试17之TLOC DEAMON导致待机/亮屏电流异常问题
- 2019 力扣杯全国秋季编程大赛:3. 机器人大冒险(模拟)
- 【HoloLens】启用Mixed Reality Portal混合现实门户
- 新的用户故事待办列表就是一副地图
- Java中事务的处理全解析
- 【装机吧U盘装系统】
- 自己动手写一个番茄小助手
- Codeforces Problem-133A HQ9+
- WebView实现改变选中区域颜色以及添加下划线
热门文章
- 【历史上的今天】4 月 18 日:第一款交互式电子游戏;IBM 率先研发兆位芯片;硬件公司 Roland 成立
- VFP控制Excel插入图表
- 使用CM快速搭建CDH集群
- 超低频测试信号产生电路软件流程图,一种0_20Hz超低频信号发生器的设计与实现...
- 小米2/2S刷基于Android 5.1.1的CM12.1系统教程
- 腾讯游戏客户端一面准备
- 1050Ti 安装CUDA、cuDNN
- 05.SQL Server(高级查询)
- 百度网盘linux版本怎么安装
- 基于大型数字视频监控系统解决方案