导读 电力大数据时代的来临,使得基于人工智能、云计算、物联网的技术在电力行业之中得到了广泛的应用。而对于各个行业的创新与发展而言,知识图谱技术成为全新动力,针对电力领域知识图谱方面的研究却很少。本文聚焦在电力行业,以整合行业内知识资源为目标构建知识图谱,提供了场景化专业知识搜索、精准知识推送、决策支持等形态的知识应用,服务于该行业内的从业人员、企业机构及行业决策者。本文将分享知识图谱在电力行业应用上的一些探索和实践。

今天的分享围绕下面四部分展开:

1. 电力知识体系构建

2. 电力知识图谱构建

3. 应用场景

4. 落地应用及感受


分享嘉宾|张涛 英大传媒投资集团有限公司编审

编辑整理|侯红梅

出品社区|DataFun


01/电力知识体系构建

在做知识图谱的构建过程中,我们首先要做的就是知识建模。

1. 电力知识数据

电力行业数据与电力知识数据不同。电力行业数据包括电力运行数据、营销数据和管理数据,是由电力生产产生的数据;电力知识数据以服务电力行业生产为目标,在电力生产中形成的科学、系统、公开、可确权的数据。为什么要说可确权呢?因为从出版的角度,我们做的是知识的生产和传播,因此我们要将所传播的知识进行分享,就必须要确定知识的版权归属,后期才能更好地进行知识运营

2.多维知识体系构建

在知识图谱的构建过程中,我们首先要确定知识图谱的用途。因此,我们确定了三大目标:

  • 第一,利用不同的电力行业的知识资源。把人物与机构相关联,实现对机构和人物的成果画像和评价。
  • 第二,结合业务场景来推送专业的知识内容。我们采用的是直接推送内容的方式,这样可以提高知识的搜索效率。这里的直接推送指的是一个片段的知识内容,即碎片化了的知识,这样就避免了知识的二次搜索。
  • 第三,充分利用我们在电力行业70年的深耕所形成的专业知识内容,建立基础的知识体系和知识库,之后可以形成知识服务的产品,实现知识共享和定制化服务。

在知识图谱构建过程中,主要涉及到三方面的人员:

  • 一线业务专家,前期确定场景和需求,后期对成果进行确认,当然,在中间过程中也需要提供咨询服务。
  • 专业人员,起到桥梁作用和整体把控,主要将需求转化为知识图谱构建人员能够理解的思路、方法,最终确定方案以实现我们的目标。
  • 计算机技术人员,负责知识的建模、融合和存储,使其最终使用电力行业的知识资源将人物与机构相关联,实现人物和机构的成果画像。

电力知识建模采用的是自顶向下的方法,首先为知识图谱定义数据模式,数据模式从最顶层概念构建,逐步向下细化。在构建过程中采用的是人工+计算机+专家审核的方式。

  • 人工建立基本的体系框架,同时结合各种场景化的应用,使该体系更加完善。
  • 专家审核并确认人工建立的体系框架。
  • 计算机自动提取,利用计算机进行自动提取使其对确定的体系框架进行深层次的挖掘。

没有完全用计算机的自动提取是因为计算机的自动提取受限于它所学的资源和内容,这样形成的体系有一定的局限性。

3. 多维电力知识体系构建:五个维度

在知识建模初期,采用人工结合场景化的应用和各个企业情况,最终基于两大原则构建了5大体系。

基于学科原则:

  • 电力专业:依托《中国电力百科全书》,形成了9卷、92个分支、6200个条目的完整电力学科类体系。

基于场景原则(4个体系,1100个知识模块):

  • 电力生产:电力生产发输变配用的维度,涉及到的各领域知识。
  • 岗位培训:结合岗位培训的维度,涉及各岗位应知应会的相关内容。
  • 基建:从电力建设的维度,从勘测、设计、施工到最后的验收。
  • 设备:交直流设备以及用电防侧的一些设备。

针对基于场景的知识体系,我们通过人工+计算机的方式最终形成了规模为20多万个实体,30万个相互间的关系的知识模块。

02/电力知识图谱构建

1.知识来源

在具体的知识图谱的构建过程中,我们首先确定了构建的原则——保证专业性、权威性以及可确权。

数据来源,我们使用的是公开的数据:

  • 文献、成果、专利、图书和标准,用来作为人物、机构画像。
  • 知识内容碎片化,从图书和标准中选取内容,主要做专业知识的精准推送。
  • 多源异构知识资源,包括音视频、图书中照片、新闻中的图片等,用来丰富专业知识库。

2. 知识结构化

  • 原则:基于电子化图书,即XML电子文件格式,大大提升了知识获取和知识融合的效率和准确率。

为了知识获取能够碎片化和保证知识的准确性,我们的质量保证措施如下:

  • 制定加工规范:依据新闻出版总署对于电子书基本的标准,制定了加工规范。对科技图书最多的图表公式、符号等,均细化要求,并且我们对表中的数据也进行了解析和拆解,进行不同深度的加工,保证获取最细碎片化的内容。
  • 质量检查:采用人工+计算机的方式进行质量检查,保证加工质量的规范性、完整性、准确性和有效性。

3. 电力知识数据解析和关联

在知识融合的过程中,我们要做数据的解析和关联。我们对内容进行了解析和拆解,同时,对于不同的图书,我们也确定了不同的加工深度,保证获取到合理的最细碎片化的内容。

数据解析:根据前面制定的加工规则,知识图谱技术人员对数据进行正确地解析。

关于知识层次的关联,我们做了两方面:

  • 体系间的关联,通过实体来进行关联。
  • 体系自身的知识关联,将上下级和同级的知识点提取出来,形成同级推荐和上下级推荐。

  • 知识属性关联:针对电力设备确定了11类属性,包括定义、组成、分类、特点等,这样在内容解析的时候,对不同的相关内容打上属性、标签,从而形成对某类设备的全方位的属性关联。

03/应用场景

1.个人成果汇总

第一个应用是个人成果汇总,应用场景如下:

  • 个人职称申报材料收集:个人职称申报过程中需汇总很多资料,通过我们这个系统,可以方便地将所涉及的成果进行一键导出。
  • 筛选推荐领域专家:可以筛选和推荐相关领域的专家。
  • 查找相近领域专家:输入两个专家的名字或通过进一步的探索,能够找到和这个专家相关联的其他专家。

2. 专业知识学习

第二个应用是可以进行专业知识学习,通过应用场景确定相应知识体系,从而定位最精准的知识内容、也通过知识推荐结果的返回提升了用户的交互体验。

  • 用户输入检索的关键词,通过确定具体应用场景,用户可以选择不同知识体系(如电力生产、岗位培训、基建等)的相关内容,可以快速地定位到最精准的知识内容。

  • 知识推荐:可获取与其关联的同级、上下级的知识内容,很方便地实现了知识相互、上下和溯源的探索。这样我们可以拓展知识的广度和深度。

在知识学习过程中,我们可以充分利用知识图谱的直观性、趣味性的特点,形成知识图谱和知识点之间的互动。

  • 在可视化知识图谱中,我们以树状层次结构及网状关联关系展示,因此你可以看到你搜索的某一点在整个知识体系中的位置和关系,帮助理清知识脉络,同时也可以进入到相应的内容页。
  • 在知识内容详情页中,我们也可以直接链接到知识图谱。

3. 岗位培训

第三个应用是岗位培训:

  • 在搜索框输入所在岗位和级别就可以快速地查阅你需要掌握的知识内容。该应用有两方面的助力:首先是为员工自学提供便利,助力员工技能等级提升;同时,有利于跨岗位、跨专业学习。

4. 通用专业知识服务

第四个应用是通用专业知识服务:

  • 作为基础知识图谱库,我们提供底层的知识体系和知识内容。
  • 在该服务的基础上,可以快速搭建并形成自己的知识库和知识体系,也可以以不同形式打印和下载关注的知识内容,也可作为知识传播的产品,来为各个企业提供服务。

5. 电力生产决策支持

第五个应用是做电力生产的辅助决策支持:

  • 在电力生产答疑或缺陷故障处理过程中,能快速地提供准确的电力知识数据。
  • 利用电力的标准,为他们的标准编写和宣贯提供支持。
  • 将年鉴、年报、内部已有文件等各类电力数据提取出来,快速形成数据知识产品,以提供更专业的知识服务,这样也可以挖掘内部自有数据,快速形成统计及情报分析文档,提升企业数据资产的价值。

04/落地应用及感受

1.落地应用-中国电力百科网

落地应用一是外网部署的中国电力百科网,主要有以下三个模块:

  • 知识图谱模块,实现了专家、机构的成果画像。
  • 知识地图模块,主要实现了专业知识学习、岗位培训和专业知识库输出等功能,该模块将于今年推出。
  • 电力标准术语查询。

2.落地应用-国网甘肃电力、国网山东电力

落地应用二是内网部署的国网甘肃电力和国网山东电力,主要服务于他们内部系统基础知识的查询和搜索工作。

3.感受

做某垂直领域的知识图谱的工作时,有三个关键点:

  • 高质量的专业数据资源,这样可以保证知识获取和搜索的准确性。
  • 结合实际应用场景来构建相关知识图谱,并持续优化和完善知识图谱,这样我们后期图谱技术才能不断进步,对行业生产有更好的助力作用。技术一定要和业务数据捆绑,这样才能产生更多的价值。
  • 专注的行业团队,对后期成果的运行和持续使用非常关注,这样才能使产品更符合实际需求。

这里有一点建议,在做某垂直领域的知识图谱或构建自己的信息库时,建议与专业的出版机构合作,因为他们有专业、权威、可靠的海量数据资源,同时他们了解相关领域,也更关注后期产品的运营。




电力行业知识资源建设及场景化应用 - 知乎

中国电力百科网

电力知识图谱

电力知识图谱:电力行业知识资源建设及场景化应用相关推荐

  1. 通用知识图谱VS行业知识图谱

      众所周知,知识图谱是Google于2012年提出,用来优化搜索结果.经过多年的发展,知识图谱在人工智能的许多行业都拥有了成熟落地的应用.按照知识图谱的覆盖面来看,主要分为通用知识图谱与行业知识图谱 ...

  2. 从零学习知识图谱——01(知识图谱技术介绍)

    今年研一,导师给的大范围是知识图谱.从零开始学习知识图谱相关知识,内容大多为笔记和心得,仅供参考.欢迎各位大牛来指导. 知识图谱 (Knowledge Graph,KG) 以结构化的形式描述客观世界中 ...

  3. 知识图谱02:知识图谱的应用

    公众号:数据挖掘与机器学习笔记 知识图谱提供了一种更好的组织.管理和理解互联网信息的能力, 可用于语义搜索.智能问答.个性化推荐等, 在社交和电子商务等领域中实现价值. 基于知识图谱的应用是信息领域当 ...

  4. neo4j 知识图谱_知识图谱里的知识存储:neo4j的介绍和使用

    一般情况下,我们使用数据库查找事物间的联系的时候,只需要短程关系的查询(两层以内的关联).当需要进行更长程的,更广范围的关系查询时,就需要图数据库的功能. 而随着社交.电商.金融.零售.物联网等行业的 ...

  5. 【知识图谱】关于知识图谱,我们接下来该研究什么?斯坦福教授们给出了答案...

    文 | 舒意恒(南京大学硕士生,知识图谱方向) 编 |  北大小才女小轶 本文整理了斯坦福大学 CS 520 知识图谱研讨会课程的第 10 集的内容,主要是关于知识图谱未来的研究方向,推荐给研究知识图 ...

  6. python知识图谱实战_知识图谱实战

    原标题:知识图谱实战 知识图谱是近来非常红火的技术,融合网络爬虫,自然语言处理,机器学习,深度学习,图数据库,复杂网络分析等多种热门技术于一身,技术含量密集,在构造语义搜索,问答平台,高智能的人机界面 ...

  7. 知识图谱 01:知识图谱概述

    前言   本内容主要介绍 知识图谱(Knowledge Graph) 的发展.定义.构建和应用. 1.1 知识图谱的发展   知识图谱(Knowledge Graph)的起源可以追溯到 1960 年, ...

  8. 知识图谱入门 (一) 知识图谱与语义技术概览

    欢迎大家关注我的博客 http://pelhans.com/ ,所有文章都会第一时间发布在那里哦~ 知识图谱与语义技术概览.主要介绍知识表示.知识抽取.知识存储.知识融合.知识推理.知识众包.语义搜索 ...

  9. 知识图谱入门——认识知识图谱

    知识图谱是知识工程的分支,在人工智能领域有重要的作用.我们日常使用的搜索引擎背后的工作逻辑****.电商平台的智能推荐等都运用了知识图谱,本文主介绍知识图谱的基本概念.相关技术,以及知识图谱构建流程. ...

  10. 【知识图谱】解读知识图谱的技术与应用

    导读:从一开始的Google搜索,到现在的聊天机器人.大数据风控.证券投资.智能医疗.自适应教育.推荐系统,无一不跟知识图谱相关.它在技术领域的热度也在逐年上升. 本文以通俗易懂的方式来讲解知识图谱相 ...

最新文章

  1. 2022-2028年中国液晶电视市场投资分析及前景预测报告
  2. 皮一皮:减肥如此简单...
  3. python打怪之路【第二篇】:ImportError: No module named setuptools
  4. Stark 组件:快速开发神器 —— 模板设计
  5. rabbitmq手动确认ack
  6. vagrant使用centos的环境安装..
  7. 干货|219个opencv常用函数汇总
  8. Data Collection with Apache Flume(一)
  9. tp5连接mysql数据库_TP5的链接数据库
  10. 阿里云云计算 48 云安全中心
  11. GD32F103ZKT6替换STM32F103调试手记
  12. 小学教师计算机培训记录内容,中小学教师信息技术培训计划
  13. 锐捷设备AC旁挂核心交换机①
  14. centos6.2安装office及PDF阅读器
  15. Java SimpleDateFormat 中英文时间格式化转换
  16. 学习编程,既要仰望星空,又要脚踏实地
  17. php 时间格式大全
  18. Beaglebone Black–GPIO 高低电平控制 LED 灯
  19. 记录每天背的单词,准备考研。(4月11日)
  20. u盘win7纯净版_教你安装纯净版windows系统

热门文章

  1. MySQL创建用户时报错“Your password does not satisfy the current policy requirements“
  2. UNI-APP从入门到实战学习资料
  3. c++:使用*号打印三角形
  4. 解决 ipykernel_launcher.py: error: unrecognized arguments
  5. 在CentOS上部署一个简单的Python实现的UDP服务(包含MySQL数据库写入)
  6. 2022年汽车修理工(中级)复训题库及模拟考试
  7. 美剧《硅谷》里大开脑洞的新型互联网,原来真的能实现!
  8. Android UI 实现表格布局
  9. BS1071-基于javaweb+springboot实现医疗健康档案大数据采集清洗数据分析可视化系统
  10. 【HNU-CSEE jetson nano 第四节】部署torch环境框架以及torchvision