最近在准备数学建模,其中的很多问题涉及了数据的处理挖掘,同时,机器学习和数据挖掘也是我以后想从事的方向,因此我花时间阅读了《matlab数据挖掘分析与实战》,下面是书中的第一个实战主题。

数据
1、电路负荷信息
包括电路上的各项电流、电压、功率等、
2、窃漏电报警消息
不准确的报警消息,可能存在误报
1、数据获取
窃电是一个从开始窃电到结束窃电的过程,题目中所给的电路负荷信息为每十五分钟的数据,时间较短,为了反应整个窃电的过程,将每天的总有功功率求和得到每天的总用电量,
2、数据分析
(1)分布分析
对五年来所有用户的窃电情况进行分析,发现非居民类别不存在窃电的情况
(2)周期性分析
随机选取一个正常用户和非正常用户,对他们用电符合的周期进行分析。发现正常用户的周期呈现波动趋势,窃电用户则出现下降趋势。
3、数据处理
(1)数据清洗
过滤掉非居民用户的用电量,同时由2中数据分析发现,周末的用电量普遍较低,也过滤掉周末的数据
(2)缺失值处理
利用拉格朗日插值处理缺失的数据
(3)数据变换
用电负荷中的电流、电压、功率等数据虽然直观,但是要构建更加具体和可靠的专家评价指标
1)电量趋势下降指标
2)线损指标
3)终端报警指标
4、构建专家样本
将1)、2)、3)中的数据作为输入,用户实际是否存在窃电作为输出,构建专家样本,作为后续模型的训练数据
5、构建模型
分别利用LM神经网络模型和CART决策树模型进行识别,并比较ROC曲线,比较两个模型的结果
6、窃漏电诊断
针对一些判断错误的数据,再进行一些特征的提取和判断。

数据挖掘案例一:窃漏电用户的识别相关推荐

  1. 数据挖掘项目---电力窃漏电用户自动识别

    1.挖掘目标 1) 归纳出窃漏电用户的关键特征,构建窃漏电用户的识别模型 2) 利用实时监测数据,调用窃漏电用户识别模型,实现实时诊断 2.分析方法与过程 1) 从电力计量自动化系统.营销系统有选择性 ...

  2. 数据挖掘I 电力窃漏电用户自动识别

    一.项目背景 传统的防漏电窃电方法主要通过定期巡检.定期校验电表.用户举报窃电等方法来发现窃电或者计量装置故障,对人的依赖性比较强,抓窃查漏的目标不明确. 供电局相关人员利用相关数据构建的基于指标加权 ...

  3. Python 数据挖掘之电力窃漏电用户自动识别

    Python 数据挖掘之电力窃漏电用户自动识别 综述 拉格朗日插值 决策树模型 LM神经网络模型 结果 决策树模型结果图 LM神经网络模型结果图 综述 对电力公司数据进行挖掘分析,首先使用拉格朗日插值 ...

  4. 二十六、数据挖掘电力窃漏电用户自动识别

    电力窃漏电用户自动识别 1. 综合案例数据预处理 电力窃漏电用户自动识别的内容 背景与挖掘目标 分析方法与过程 数据探索性分析 综合案例的目标 通过综合案例分析了解数据挖掘的整体流 掌握使用sklea ...

  5. 数据挖掘实战:电力窃漏电用户自动识别

    案例来自<python数据分析与挖掘实战> 背景 需求:防用户窃漏电 传统方法:定期巡检.定期校验电表.用户举报窃电.计量装置故障 缺陷:对人的依赖性太强,抓窃查漏的目标不明确. 当前方法 ...

  6. 数据分析系列之电力窃漏电用户自动识别

      在线监测用户用电负荷数据,经过数据预处理,得到模型输入数据,利用构建好的识别模型计算用户窃漏电诊断结果,实现窃漏电用户的实时诊断,并与实际稽查结果对比 背景与挖掘目标   传统的防窃漏电方法主要是 ...

  7. 电力窃漏电用户自动识别

    一.背景与挖掘目标 传统防窃漏电主要通过定期巡检.定期校验电表.用户举报等手段来发现窃电或者计量装置故障.但这种方法对人的依赖性太强,抓取查漏目标不明确.目前,很多供电局主要通过营销稽查人员.用电检查 ...

  8. matlab fitctree 原理,电力窃漏电用户自动识别.PDF

    电力窃漏电用户自动识别 <MATLAB 数据分析与挖掘实战>第 6 章 第6章 电力窃漏电用户 自动识别 6.1背景与挖掘目标 传统的防窃漏电方法主要通过定期巡检.定期校验电表.用户举报窃 ...

  9. 电力窃漏电用户自动识别(SPSS Modeler)

    据统计,全国每年因窃电造成的损失都在200亿元左右:被查获的窃电案件不足总窃电案件的30%.而传统的用电检查及反偷查漏工作主要依靠突击检查的手段来打击窃电行为:存在先天性的缺陷和不足. 现有的电力计量 ...

最新文章

  1. HDU 4411 Arrest(费用流)
  2. 卷积神经网络要点解析
  3. asp2.0缓存概述
  4. 10个免费开源的项目管理工具
  5. httpf发送 json_Java用HttpClient3发送http/https协议get/post请求,发送map,json,xml,txt数据...
  6. 面对人口塌方式下降,必须把房子转移到省会以上级别城市的理由
  7. Python matplot画散列图
  8. Hbase之过滤器的使用
  9. Excel·VBA自定义函数扩展VLOOKUP
  10. System Repair Engineer (SREng) 2.6 正式发布
  11. 经典运放电路详细分析(模拟电子技术)
  12. linux代码丢了,Linux 使用ss命令代替 netstat
  13. 不可思议有氧机器人_不思议迷宫机器人生产线选什么好 机器人合成公式一览...
  14. 挥别2022再战2023 | 平行云“逆势增长”与“顺势而为”
  15. ubuntu桌面便签_在Ubuntu 上有什么必装的实用软件?
  16. X86汇编语言学习手记(1)
  17. xmind转Excel测试用例
  18. 会声会影X10中文版序列号32位/64位下载教程
  19. C# 基础之Linq编程
  20. Revit 2020发布

热门文章

  1. UVA 10480 - Sabotage (最大流)
  2. 九寨沟游玩体会大汇总 :)
  3. 高级ACL配置实验报告
  4. 如何用c语言return数组函数
  5. 跨部门沟通的冷板凳,你坐过吗?
  6. 【docker设置host】docker镜像设置hosts
  7. centos7 安装
  8. 2021 祥云杯 pwn-PassWordBox_ProVersion
  9. MIPI CSI-2 Receiver Subsystem(AXI-Stream) 的tuser里都可以定义哪些数据
  10. 【智能优化算法-飞蛾扑火优化算法】基于水循环混合飞蛾扑火优化算法求解约束的工程优化问题附matlab代码WCMFO