一、DeepDive简介

deepdive帮助你从更少的结构化数据和统计推断中提取结构化的知识而无需编写任何复杂的机器学习代码。deepdive是一种新的数据管理系统,能够解决提取、整合型,并在一个单一的系统预测问题,它允许用户快速构建复杂的端到端的数据管道。

二、DeepDive优势

  • deepdive让开发者只需要关心实体特征,不需要在乎算法。相比之下,其他机器学习系统需要开发者认为,聚类算法,分类算法,等用。在DeepDive的联合推理为基础的方法,用户只需指定必要的信号或特征
  • deepdive系统可以实现高质量:PaleoDeepDive比志愿者更高质量在提取复杂的知识科学领域和获奖的性能进入实体关系抽取的比赛
  • deepdive知道数据往往是嘈杂和不准确的:名字拼错的,自然语言是模糊的,人会犯错误。以这样的不精确性的考虑,deepdive计算校准对于每一个断言它使概率。例如,如果deepdive产生事实的概率是0.9,事实上90%可能是真的。
  • deepdive能够使用大量的数据从一个品种来源构建的应用程序使用。deepdive从数以百万计的文件,提取数据的网页,PDF文件,表格和数字。
  • deepdive允许开发者用某一领域的知识为了提高结果的质量写简单的规则告知推理(学习)process.deepdive也考虑到用户的反馈,对预测的准确性提高的预测。
  • deepdive能够使用数据学习“远亲”相反,大多数机器学习系统需要为每个预测冗长的训练。事实上,许多deepdive应用,尤其是在早期阶段,不需要传统的在所有的训练数据!
  • deepdive的秘密是一个可扩展的、高性能的推理和学习机过去几年,我们一直在努力使底层算法尽可能快的跑,技术率先在该项目是商业和开源工具,包括部分Madlib,黑斑羚,从产品Oracle,和低级别的技术,如“HOGWILD!

前两章内容主要引用:https://blog.csdn.net/u013412066/article/details/68065518

三、DeepDive依赖环境搭建

  1. java SDK1.8安装参考:https://blog.csdn.net/u012707739/article/details/78489833
  2. python2.7安装参考:https://www.jianshu.com/p/6425d18d3e47

四、DeepDive安装

DeepDive安装可以参考:

  1. https://zhuanlan.zhihu.com/p/53804721
  2. https://blog.csdn.net/cx943024256/article/details/79056726

以上两个大神写的文章都非常给力。在java环境和python环境安装完成之后,结合参考这两篇文章的方法,可以成功跑通平台。
其中需要注意的地方(踩坑记录):

  1. java sdk1.8一定要安装正确,否则后续在调用NLP的jar包时会出现错误(严格按照第三章中的方法配置)
  2. 在用虚拟机运行时,需要给虚拟机分配足够大的内容(第一次跑给虚拟机分配2G内存,结果出错,报无法开辟内容,后将内存调至16G,成功跑通)。

ubantu16.04下配置使用DeepDive相关推荐

  1. ubuntu 14.04 java_Ubuntu14.04下配置Java环境

    Java环境配置网上已经有很多资料了,不过大多不适合初学者,Linux菜鸟更是不知所措了...Ubuntu14.04下配置Java环境,具体方案如下: Oracle官网上下载"jdk-8-l ...

  2. apache2+支持php7,Ubuntu14.04下配置PHP7.0+Apache2+Mysql5.7

    Apache 步骤一:安装apache ronyao@ubuntu:~$ sudo apt install apache2 安装好后,在浏览器上输入localhost(服务器端,请输入你的IP地址), ...

  3. vscode linux新建c语言,Ubuntu16.04下配置VScode的C/C++开发环境

    1. Vscode安装 Visual studio code是微软发布的一个运行于 Mac OS X.Windows和 Linux 之上的,针对于编写现代 Web 和云应用的跨平台源代码编辑器.第一种 ...

  4. linux arm移远重启4g,如何在Ubuntu16.04下配置移远RM500工业模组(5G工业模组)

    如何在Ubuntu16.04下配置移远RM500工业模组(5G工业模组) 如何在Ubuntu16.04下配置移远RM500工业模组(5G工业模组) 最近由于工作原因入手了移远的5G(RM500H工业模 ...

  5. Ubuntu 16.04下配置openWRT开发环境

    Ubuntu 16.04下配置openWRT开发环境 1.配置openwrt开发环境,本实验室在ubuntu16.04系统下测试 在编译之前我们先要搭建环境,ubuntu下OpenWrt编译环境需要安 ...

  6. Ubuntu16.04下配置ORB-SLAM2与运行单目实例

    Ubuntu16.04下配置ORB-SLAM2与运行单目实例 一.安装相关工具 二.安装Pangolin 三.安装opencv 四.安装Eigen 五.安装ORB_SLAM2 六.安装usb_cam ...

  7. Ubuntu12.04下配置Eclipse+PyDev

    开发平台:Ubuntu12.04 IDE:Eclipse3.7.2 python版本:python3.4.4 搭建Eclipse+PyDev的开发环境,在网上找了一些教程,有一些错误,尝试了许久,也走 ...

  8. linux创建django项目,Ubuntu 16.04下配置Django项目

    记录一次在全新服务器下配置Django项目说明: Linux操作系统:Ubuntu 16.04 Django版本:1.8.7 Python版本:2.7.12 运行模式:Ubuntu+Django+Ap ...

  9. Ubuntu18.04下配置Nooploop UWB LinkTrack

    上位机的安装可以去Nooploop UWB LinkTrack官网,下载对应版本的安装包,安装即可,Ubuntu下下载Ubuntu_64bit的安装包,然后使用sudo dpkg -i ***.deb ...

最新文章

  1. 从今天开始,我就要潜心研究软件开发技术了,不在被名利所困
  2. Oracle 10g 应用补丁PSU 10.2.0.5.180717
  3. 通过ngx-lua来统计Nginx上的虚拟主机性能数据
  4. 【递归】【线段树】【堆】AtCoder Regular Contest 080 E - Young Maids
  5. linux 下安装JDK
  6. Teams的MessageExtension最新功能:Initiate actions
  7. spark java 计数_spark程序——统计包含字符a或者b的行数
  8. stream 提取某字段_java8从list集合中取出某一属性的值的集合案例
  9. 深度学习目标检测之 YOLO v2
  10. 2019.08.26关于分页
  11. java 新增的方法外部调用提示不存在_Java面试简答题(一)
  12. ajax的data数据无意间的致命错误
  13. LabView 2018破解版下载
  14. 蒸汽管道图纸符号_如何正确画工艺流程图?图标、符号、图示、标志及含义
  15. Windows 错误报告
  16. html打印 去除页眉页脚,js客户端打印html并且去掉页眉、页脚
  17. oracle14047,Oracle数据库之ORA-14047
  18. Nodejs+MongoDB+WebRTC搭建视频通话协同应用
  19. SQL 2008 -数据库的创建与管理
  20. 刘同——谁的青春不迷茫,给你冬日满满正能量

热门文章

  1. 手机变身蓝牙键盘、鼠标Serverless Bluetooth Keyboard Mouse for PC/Phone
  2. python整数运算_Python实现整数的四则运算
  3. unix时间戳转换c语言算法,聊聊时间(2)硬核算法篇——UNIX时间戳转UTC时间
  4. 软件质量管理实践全面总结
  5. FineReport普通报表使用总结
  6. 无法打开.chm格式文件/java api无法打开.chm文件
  7. pygame飞机大战 小游戏
  8. java类中只有一个public类
  9. 快速构建一个完整的Selenium框架
  10. Azure IoT 中级(1)-Device Provisioning Service(DPS)概览