以下内容来自《自然语言处理实践-聊天机器人技术原理与应用》
目前,工业界已有很多成型的 KBQA 系统,其中最著名的是 IBM 2011 年推出的 Watson 问答系统 ,它因在美国最受欢迎的智力问答电视节目《危险边缘》中一举打败了人类智力竞赛冠军而名声大噪。下面从技术的角度对 Watson 进行分析。Watson 采用的知识库是一个广义的知识库,其中不仅包含各种结构化知识,也包含各种非结构化的文本语料和语言学知识。Watson 作为一个集理解、推理、学习、交互功能于一体的强大问答系统,学习处理信息的过程分 4 个阶段,在一定程度上也模拟了人的认知思考过程。
(1) 观察 。观察可见的现象和有形的证据。
(2) 推断 。根据已有知识理解所见之事,然后对其中含义做一些假设。
(3) 评估 。判断某个假设的对错。
(4) 决策 。做出决策,选择最佳选项,并依此采取行动。整个流程称为 Deep QA,包含问题分解、假设生成、基于证据进行假设评估及排序等关键步骤,这里的 Deep QA 并非指通过深度学习技术提供问答。如下图所示为 Watson 问答系统的学习过程。首先,通过分析问题的语义,找出查询所需的依赖关系及查询的焦点;然后,根据查询线索生成候选答案,并给出相关性的评分;最后,归并重复的候选答案,由候选答案评估算法做排序选出最终的答案。
当 Watson 在某个特定领域开始工作的时候,它需要学习相应的语言、术语,以及该领域中的思维模式。以癌症为例,癌症有许多类型,每种都有不同的症状和治疗方案,然而除了癌症,其他疾病也可能出现这些症状,因此 Watson 会基于医疗实践和该领域内最优秀的技术文献进行标准评估,从而识别出最佳治疗方案,供医生为患者进行治疗时选择。Watson 的训练需要在「掌握」某个特定领域知识语料库的领域专家的指导下进行。Watson 的训练过程如图。

  • 首先,进行语料库的「摄取」工作。语料库包含大量优秀的技术文献,还需加以一定的人工干涉进行降噪,并对数据进行预处理,构建索引和其他元数据,并依此构建一个知识图谱。
  • 然后,对 Watson 进行问答训练。摄取语料库之后,Watson 需要接受人类专家的培训,学习如何理解信息。为了提升 Watson 的学习质量,主要通过机器学习的方法来训练。专家将训练数据以基本问答对的形式输入给 Watson,这里指的并不是问题的明确答案,而是教会它这个领域中专业知识所对应的语言模式。
  • 最后,反馈修正不断学习。接受问答训练以后,Watson 会通过持续交互继续学习,用户和 Watson 之间的交互会定期由专家进行审核,并将反馈输入系统,帮助 Watson 更好地理解信息。新信息发布后,Watson 会根据新信息进行自我更新,以便不断适应特定领域中知识和语言阐释方面的变化。
    当用户输入一个问题后,Watson 会经历以下处理过程,才生成最终的答案反馈给用户。
  • 首先, 通过自然语言理解处理问句,识别出问题中的一些信息词;
  • 接着 Watson 会根据信息词从答案源中生成候选答案,即生成假设;
  • 然后它会寻找支持或推翻每一个假设的论据,并根据每个论据的统计建模结果,对每个论据进行评分,也就是「加权论据得分」;
  • 最后,合并每一个假设的所有证据评分并进行综合排序,Watson 会根据答案响应率的高低估计答案的可信度,反馈给用户。

(二)典型KBQA 系统介绍:IBM WASTON相关推荐

  1. 手把手教你搭建 IBM Waston(聊天机器人)

    本文主要介绍如何搭建一个IBM Waston ,本次搭建的waston主要包含聊天功能, 首先环境不需要自己手动搭建,需要准备以下材料: 1. ibm账号(官网注册 简单方便) 2. idea 或者 ...

  2. IBM Waston:缓解人工智能预制数据的痛苦

    关注52AI,做AI的行业领先者.QQ人工智能行业交流群:626784247. 01 IBM Waston新功能包括数据目录.数据加工和分析引擎,以使企业更好地了解数据.执行安全策略.访问和移动公共云 ...

  3. 邓仰东专栏|机器学习的那些事儿(五):基于GPU的机器学习实例之IBM Waston

    目录 1.绪论 1.1.概述 1.2 机器学习简史 1.3 机器学习改变世界:基于GPU的机器学习实例 1.3.1 基于深度神经网络的视觉识别 1.3.2 AlphaGO 1.3.3 IBM Wast ...

  4. Cocos Creator教程 ——(二)UI系统介绍(上)

    目录 前言 一.Sprite(精灵) 二.Label(文字) 三.Weight(对齐挂件) 四.Layout(自动布局) 前言 这里会通过一个demo项目去介绍现在的UI系统有生产什么游戏的能力,以及 ...

  5. 什么是知识图谱?有哪些典型应用?终于有人讲明白了

    公众号后台回复"图书",了解更多号主新书内容 导读:本文将详细阐述知识图谱的基本概念,包括知识图谱的背景.定义以及典型应用. 作者:邵浩 张凯 李方圆 张云柯 戴锡强 来源:大数据 ...

  6. 超全IBM MQ安装运行与代码连接测试

    前言 选择windows安装测试是有必要的,IBM MQ不同于其他MQ,其运行与创建队列管理器很复杂,在打算部署linux之前,建议先把windows下的可视化操作理清,不至于踩坑! 安装 IBM M ...

  7. 【重磅】物联网产业全景图谱报告,首开国内IoT产业二维视角全景图之先河

    重大科技的发展成熟带来了人类经济结构的变革,曾经电力技术的成熟和广泛应用,让人类社会告别了蒸汽时代,生产力得到大跨步提升.如今,物联网就像十九世纪末的电力技术一样,正在逐渐的成熟且向各行业不断渗透,推 ...

  8. IBM小型机基本知识

    在中国,小型机习惯上用来指UNIX服务器.1971年贝尔实验室发布多任务多用户操作系统UNIX,随后被一些商业公司采用,成为后来服务器的主流操作 系统.在国外,小型机是一个已经过时的名词,指60年代由 ...

  9. 数字化转型“水多深”?IBM“老司机”告诉你

    (上图为IBM大中华区董事长陈黎明) IBM"老司机"又重返增长了.2017年底到2018年前两个季度,IBM结束了长达5年的营收下滑,连接三个季度恢复增长.在IBM的2017年报 ...

最新文章

  1. java drools5_Java Drools5.1 规则流基础【示例】
  2. 前端测试 karma mocha should 都是什么鬼?
  3. python把光标定义到指定的位置并删除之前的字符_python 批量修改预定字符串并将修改后的字符串插入文件指定位置...
  4. 海外客户的营销新思路(内容营销)
  5. 黑色背景下,将照片内封闭空心图案的空心区域染成Cyan并保存
  6. VS2013正在等待所需操作完成
  7. vs2010 学习Silverlight学习笔记(11):数据与通信之WebClient
  8. matlab 三维绘制
  9. 使用php简单网页抓取和内容分析,使用PHP简单网页抓取和内容分析_php
  10. es6去除重复项_ES6 常用知识总结
  11. php字符串替换多余逗号_PHP字符过滤函数去除字符串最后一个逗号(rtrim)_php技巧...
  12. centos通过yum的方式快速安装jdk1.8
  13. (译)如何使用spritehelper和levelhelper教程:引子
  14. 中国移动亮相2012亚洲移动通信博览会
  15. 论文中的统计学如何计算机,统计学教学中如何利用Excel软件及其利弊分析论文...
  16. 关于opencv打开摄像头黑屏的问题
  17. 开学季将至 华硕重炮手主板让你学习娱乐两不误
  18. SCAFFOLD: Stochastic Controlled Averaging for Federated Learning
  19. Xposed插件编写
  20. laragon mysql版本_laragon 使用(php版本升级切换)

热门文章

  1. js 将800秒转换为分钟秒钟显示
  2. python猜拳小游戏代码200行左右_python简单小游戏代码,python简单小游戏代码200行...
  3. 论文怎么添加引用参考文献(附word添加引用标注教程)
  4. android脚本删除app,安卓删除系统垃圾软件,无需Root
  5. 读懂timing report
  6. 高等数学——函数连续性的相关证明(凯哥)
  7. 阿里云 SSL证书部署(DigiCert 免费版 SSL)
  8. 【Unity编程】Unity中关于四元数的API详解
  9. 如何在Mac,iPhone或iPad上标记文件
  10. Batch_Normalization 、Layer_Normalization 、Group_Normalization你分的清楚吗