世界上最大的语义知识库 Freebase 今天宣布,他们的文章总数即将超过400万篇,比英文维基百科的 240万篇超过60%,接近全语种(250种语言)维基百科1000万篇的一半。

什么是 Freebase

Freebase 是一个由计算机和人共同组织维护的一个庞大的信息库,它通过 wikipedia, MusicBrainz 一类的信息源,加上人工上传和编辑,对知识和信息进行采集,整理,归纳,并提供语义技术,以便更好地从中查找资料。

很多 Web2.0 公司使用 Freebase 的数据库,对某个领域的知识进行归纳,获得有价值的资料,如:

  • Taught or Not - 一个非常可爱的小游戏,用来测试你对历史上那些思想家之间的相互影响关系的了解。
  • Shot or Not - 另一个有趣的游戏,测试你对有些历史著名人物死因的了解。
  • Random Walk Through Influences - 一个小程序,输入某个艺术家的名字,你就可以知道他受哪个流派影响。
  • Pull Quotes - 如果你对政治感兴趣,这个网站值得一看。
  • Powerset - 刚刚以1亿美金卖给微软的 Powerset 也使用 Freebase 作知识来源。

本文国际来源:http://www.readwriteweb.com/archives/metawebs_freebase_now_60_large.php 中文翻译来源:COMSHARP CMS 官方网站

Freebase 文章数量超过英文维基百科达400万篇相关推荐

  1. hexo博客生成博文,当生成的文章数量超过1000时,耗尽所有内存资源后出现out of memory

    问题 当hexo生成博文的时候,你的文章数量超过1000.2000或3000时,就是文章数量很多时,会出现生成不了的情况,具体的错误是out of memory,具体的错误如下: ATAL ERROR ...

  2. Gensim官方教程翻译(五)——英文维基百科的实验

    仅供个人学习之用,如有错误,敬请指正.原文地址 为了测试gensim的性能,我们在维基百科英文版上运行了一些实验. 这个页面描述了获取与处理维基百科的过程,以便任何人都能再现这个结果.本教程要求已经正 ...

  3. 利用Gensim训练关于英文维基百科的Word2Vec模型(Training Word2Vec Model on English Wikipedia by Gensim)

    Training Word2Vec Model on English Wikipedia by Gensim 更新:发现另一篇译文:中英文维基百科语料上的Word2Vec实验,该译文还提供了中文维基百 ...

  4. 摩根大通正在放出更多区块链职位,数量超过任何一家华尔街企业

    点击上方 "蓝色字" 可关注我们! 暴走时评: 美国最大的银行摩根大通正在不断放出大量区块链工作岗位,其数量超过任何一家金融企业.此外,过去一年中,摩根大通是十大公司中唯一一家发布 ...

  5. CSDN:因博主近期注重写专栏文章(已超过150篇),订阅博主专栏人数在突增,近期很有可能提高专栏价格(已订阅的不受影响),提前声明,敬请理解!

    CSDN:因博主近期注重写专栏文章(已超过150篇),订阅博主专栏人数在突增,近期很有可能提高专栏价格(已订阅的不受影响),提前声明,敬请理解! 目录 博客声明 大数据了解博主粉丝 博主的粉丝群体画像 ...

  6. SharePoint List item数量超过5000的解决办法

    SharePoint一个list里面的item数量超过5000会提示"视图无法显示,因为超过管理员限制设定的列表视图阈值" 在CSDN里面有比较好的解决方案,在这里先记录下来,以后 ...

  7. Android中当item数量超过一定大小RecyclerView高度固定

    Android中当item数量超过一定大小时,将RecyclerView高度固定 方法1 直接通过LayoutParams来设定相应高度 ViewGroup.LayoutParams lp = rv. ...

  8. 统计个人CSDN的博客文章数量

    统计个人CSDN的博客文章数量 第一版 原始版本比较简单 只能统计第一页,而且没有进行排序 # coding:utf-8 import urllib2 from bs4 import Beautifu ...

  9. CSDN发表文章数量限制的缺陷

    假期闲着没事,编译了一把doubango.吾详细记录了所有下载源码.编译细节.为了方便查询,每个模块都发表一篇文章.一天之内只能发表10篇,多余的第二天发.然后吾确认了一个缺陷: 如果当天发表文章不超 ...

  10. python爬取pubmed的文献_利用selenium爬取pubmed,获得搜索的关键字最近五年发表文章数量...

    PubMed 是一个提供生物医学方面的论文搜寻以及摘要,并且免费搜寻的数据库.是一个做生物方面经常要用到的一个查找文献的网站.最近刚学了爬虫相关的知识包括urllib库,requests库,xpath ...

最新文章

  1. html表单的创建和css的构成
  2. android 拨打电话 号码判断
  3. 两雄争霸:解读MSU2019年度视频编码大赛
  4. javafx 内存占用_JavaFX:TouchGesture内存泄漏?
  5. 我为什么在这里写博客
  6. Nginx高并发系统内核优化
  7. ! [remote rejected] master - master (pre-receive hook declined)
  8. 华为平板电脑_华为MatePad Pro 5G:云游戏、云电脑加持,这台平板不只是平板
  9. python期末考试及答案单引号、双引号和三引号_python脚本中单引号’ 双引号“ 三个单引号‘’‘ 三个双引号”“” 差别 及反斜杠的用法...
  10. java如何建立数据库_Java怎么连接数据库
  11. 小米路由器r2d_小米路由器R2D亮黄灯维修
  12. 高通功耗调试17之TLOC DEAMON导致待机/亮屏电流异常问题
  13. 2019 力扣杯全国秋季编程大赛:3. 机器人大冒险(模拟)
  14. 【HoloLens】启用Mixed Reality Portal混合现实门户
  15. 新的用户故事待办列表就是一副地图
  16. Java中事务的处理全解析
  17. 【装机吧U盘装系统】
  18. 自己动手写一个番茄小助手
  19. Codeforces Problem-133A HQ9+
  20. WebView实现改变选中区域颜色以及添加下划线

热门文章

  1. 【历史上的今天】4 月 18 日:第一款交互式电子游戏;IBM 率先研发兆位芯片;硬件公司 Roland 成立
  2. VFP控制Excel插入图表
  3. 使用CM快速搭建CDH集群
  4. 超低频测试信号产生电路软件流程图,一种0_20Hz超低频信号发生器的设计与实现...
  5. 小米2/2S刷基于Android 5.1.1的CM12.1系统教程
  6. 腾讯游戏客户端一面准备
  7. 1050Ti 安装CUDA、cuDNN
  8. 05.SQL Server(高级查询)
  9. 百度网盘linux版本怎么安装
  10. 基于大型数字视频监控系统解决方案