威布尔分析中的删失数据及其处理方法-威布尔分析

1、前言

在开展可靠性工作时,我们经常会遇到不同删失类型的数据。那到底什么是删失数据?删失数据包含哪些呢?

例如,我们在开展可靠性试验过程中,往往会设置好一定的测试间隔时间,每间隔一段时间进行检测,这样所得到的数据往往属于间隔/区间删失数据。即我们只知道开始测试、结束测试时间,但是我们不知道具体是什么时刻样品出现了故障。我们平时开展可靠性分析工作时,经常说的故障数据,又是什么类型数据呢?包含删失数据吗?这里给大家详细介绍删失数据的类型及定义。

2、删失数据类型及定义

我们平时开展可靠性数据分析、威布尔分析工作时,主要遇到的数据类型包括完全数据/确切失效数据、右删失数据(包括I型和II型,也有一些资料提到III型)、左删失数据、间隔/区间删失数据、批量删失数据、成组删失数据、零失效数据等。

(1)完全数据/确切失效数据

完全数据/确切失效数据是我们明确知道样本是什么时候失效的。例如,可靠性试验时,共3个样本参加试验。试验过程中实时观察样本的情况。通过试验,记录下样本2的失效时间是100小时,样本1的失效时间是120小时,样本3的失效时间是150小时。

图1 完全数据/确切失效数据

(2)右删失数据

右删失的情况在可靠性工作中最为常见,也是我们经常默认的删失数据类型。也称为截断数据。右删失数据是指到观测时间点/试验结束时间点,样本仍未失效的情况。对于高可靠性的产品来说,在试验过程中经常发现右删失数据,即试验结束后,样品仍未失效。例如,我们测试3个试验样本,试验截止时间未1000小时。当试验截止时,我们检测3个试验样本呢,发现只有样本1、样本2失效,而样本3未失效(不知道什么时候才能发生失效),即样本3为右删失数据。

图2 右删失数据

需要注意的是,右删失数据一般又可以分为I型右删失数据、II型右删失数据。I型右删失数据是较为常见的,即到试验截止时间,仍未失效的数据即为I型右删失数据。例如,5个样本参加可靠性试验,试验截止时间T=1000小时。当试验进行到1000小时时,样本1、4、5仍未失效,这三个样本即为I型右删失数据。

图3 I型右删失数据

II型右删失数据是,假设我们选择5个样本进行可靠性试验,并预先设定好3个样本失效即停止试验。当我们试验到出现3个样本失效时,另外两个样本仍未失效,这两个未失效的样本即为II型右删失数据。

图4 II型右删失数据

(3)左删失数据

左删失可以理解为,我们知道某个故障事件(或其他事件)发生的时间小于某个数值,但我们无法确定具体的时间。例如,我们开展可靠性试验时,在1000小时的时刻测试时,该样本已经发生了失效,即知道该试验样本失效的时间小于1000小时,但是我们不知道确切是什么时刻发生的失效。也就是说,它发生失效的时间可能在0到1000小时之间的任意时间,但是我们无法确定具体数值。

例如,某可靠性试验选择3个试验样本进行可靠性试验,试验到1000小时时进行测试。当试验进行到1000小时时检测发现样本1失效、样本2失效,样本3未失效。此时,我们知道样本1、样本2的失效时间小于1000,但是由于试验过程中不是实时检测样本的情况,所以只能确定样本1、样本2的失效时间是0~1000小时之间。

图5 左删失数据

(4)区间/间隔删失数据

区间/间隔删失数据是指我们知道开始测试/观测的时间,以及结束测试/观测的时间。且我们知道样本是在开始到结束测试时间段中间发生了失效,但是我们不知道具体的时间点。这样的数据称为区间/间隔删失数据。例如,我们选择5个样本进行可靠性试验,每隔500小时进行测试。当500小时时,测试所有样本没有失效,当1000小时时测试所有样本,发现样本1、2、3都发生了失效,此时,样本1、2、3即为区间删失数据。

图6 区间/间隔删失数据

(5)批量删失数据

批量删失数据一般指右删失数据,即删失的数据量较多的情况。

(6)成组删失数据

成组删失数据一般是指我们可对删失数据进行分组,尤其是不同时间段进行测试时。

(7)零失效数据

零失效的数据在高可靠性产品经常出现,试验结束时所有样品均无失效。例如航天器等产品。此时,可以使用一些专有算法进行可靠性评估。

3、删失数据案例及分析

开展可靠性数据分析或者威布尔分析工作时,对于包含删失数据的数据处理工作较为复杂,一般可以借助相应的工具(PosWeibull等)进行。对于包含删失数据的可靠性分析,一般可以选择使用最小二乘法(RRX、RRY)、极大似然法进行。需要注意的是,当删失数据较多时,建议选择极大似然法进行分析。

案例1:刹车部件故障数据的寿命分析(完全数据)

试验过程中,监测13个样本的试验情况,并记录13个样本的故障时间数据。然后录入到工具中计算。

图7 数据录入

图8 参数估计及寿命分析

案例2:汽车部件故障数据(右删失和区间删失数据混合)

现在对新旧两个系列的汽车部件失效数据进行可靠性分析。并估计未来50000公里的返修比例。新旧两个系列的产品每隔10000公里进行一次失效检测。新旧两类产品分别检测了90000公里,每隔10000公里进行检测。

其中旧产品第一次检测是不知道具体开始时间的(左删失),90000公里后还有83个样品是未失效的(即右删失),有965个样品是区间删失的,即只知道开始和结束检测时间,但是不知道具体失效时间。

新产品第一次检测是不知道具体开始时间的(左删失),且所有被检测产品均没有发生失效,90000公里后还有210个样品是未失效的(即右删失),有829个样品是区间删失的,即只知道开始和结束检测时间,但是不知道具体失效时间。

对于这种即存在左删失、右删失,又存在区间删失的多种删失数据、任意删失、大批量删失数据的可靠性分析,首先按照开始检测时间、结束检测时间、故障数量/频数、产品类型(新/旧)对检测数据进行梳理、整理。

将整理的数据录入到PosWeibull软件中,使用寿命分析工具进行分析。

图9数据录入

图10 参数估计及寿命分析(综合)

图11 参数估计及寿命分析(分设备类别)

案例3:质保数据分析(右删失与区间删失数据混淆带来的问题)

已知某设备的每月销售数据,以及各月份返修数据。每月销售量为1000台,各月份返修的数据如下图所示。数据按Nevada表格式录入。按照正常情况,我们是每个月都监测、汇报各月份的返修设备数量。所以,应该理解为检测间隔为1个月。所以这些数据应该使用区间删失数据处理方法处理,而大量未出现返修的设备数据作为右删失数据处理。把这些数据按照Nevada表格式录入到PosWeibull工具中,然后计算得到的估计参数为β=1.26,η=399.26。

如果我们错误地把这些返修的设备数据都当成右删失数据(不考虑每个月进行检测问题),计算出来的结果是β=20.60,η=12.06。

由此可见,所计算得到的结果与前面的计算结果相差非常大。所以,在开展可靠性数据分析工作、威布尔分析(weibull)时一定要分析各个数据属于什么类型数据,否则将会出现错误。

图12 设备返修数据录入(正确方法)

图13设备返修数据录入(返修数据当成右删失-错误方法)

图14 正确计算结果

图15 错误计算结果

matlab删失数据威布尔,威布尔分析的删失数据数据及其处理方法-PosWeibull软件相关推荐

  1. 2020年中国新基建大数据中心产业链全景图深度分析汇总(附大数据中心产业链完整企业名单)...

    全球范围内,美国数据中心数量遥遥领先,亚太市场是全球数据中心市场的亮点,与2018年同期相比投资增长达到12.3%,增速遥遥领先.截止2019年中国数据中心数量大约有7.4万个,大约能占全球数据中心总 ...

  2. matlab segy文件,利用matlab实现segy格式数据的读写研究和分析.ppt

    利用matlab实现segy格式数据的读写研究和分析 2.SEGY数据格式 地震数据一般以地震道为单位进行组织,采用SEG-Y文件格式存储.SEG-Y格式是由SEG (Society of Explo ...

  3. PythonR爬取分析赶集网北京二手房数据(附详细代码)

    本文转载自数据森麟(ID:shujusenlin) 作者介绍:徐涛,19年应届毕业生,专注于珊瑚礁研究,喜欢用R各种清洗数据. 知乎:parkson 如何挑战百万年薪的人工智能! https://ed ...

  4. 如何用SQL分析电商用户行为数据(案例)

             叮当之前主要是做增长方向的,平时工作中主要基于问题做数据分析,大部分时候都是怎么快怎么来. 很少有各种工具,各种分析方法全来一遍的,所以本次借分析"淘宝用户行为数据集&qu ...

  5. 数据湖 VS 数据仓库之争?阿里提出大数据架构新概念:湖仓一体

    作者 |关涛.李睿博.孙莉莉.张良模.贾扬清(from 阿里云智能计算平台) 黄波.金玉梅.于茜.刘子正(from 新浪微博机器学习研发部) 编者按 随着近几年数据湖概念的兴起,业界对于数据仓库和数据 ...

  6. 《大数据》2015年第2期“专题”——关于大数据交易核心法律问题 —— 数据所有权的探讨及建议...

    关于大数据交易核心法律问题--数据所有权的探讨及建议 王 融 中国信息通信研究院互联网法律中心 北京 100191 摘要:清晰的产权归属是交易的前提与基础.然而,当前关于数据的产权归属问题还远未达成共 ...

  7. 图解大数据 | 综合案例-使用Spark分析挖掘零售交易数据

    作者:韩信子@ShowMeAI 教程地址:http://www.showmeai.tech/tutorials/84 本文地址:http://www.showmeai.tech/article-det ...

  8. 作为数据分析师,我一般都是去哪查数据的

    做可视化和做数据分析的时候除了对自己公司的业务数据要做处理的同时,也要去寻找一些行业内的大数据来支撑自己的分析结果. 而"找数据"这件事真的让很多刚入行的新人头大的不行,因为已经从 ...

  9. 吴甘沙:让不同领域的数据真正流动、融合起来,才能释放大数据的价值

    很有思想的一篇大数据的文章,内容也很丰富,视角也算开阔,大数据现在特别火,结合到自己的行业.项目和具体工作中,一定要深入思考,找到价值所在,不要人云亦云.来自36大数据网站的转载. 我们大数据的研究轨 ...

最新文章

  1. Oracle笔记 四、增删改、事务
  2. 成功解决pml.Simple derived_col_names[int(obj[‘split_feature‘])],\ IndexError: list index out of range
  3. 你是PHP菜鸟,如果......
  4. 解决yarn全局安装模块后但仍提示无法找到命令的问题
  5. Asprise OCR SDK 15.3试用版破解
  6. 哎!又要过年了,程序员最怕问到什么?
  7. Java的synchronized的使用_Java中synchronized的用法
  8. 软件工程网络15个人作业3——案例分析
  9. bash脚本基础知识
  10. Black Salt Audio All Plug-Ins Mac 实用音频压缩插件套装
  11. C#调用WPS转换WORD,EXCEL,PPT文件为PDF
  12. 两个文件定义了同名的变量,会是同一个变量吗?
  13. Java——IDEA
  14. Java基础(自己总结)
  15. 解决安装import nonebot后报错importError问题
  16. excel仪表盘_免费的Excel仪表板工具
  17. 贪心--2016cqround4火车运输
  18. Compose remember、mutableStateOf的使用
  19. 27 岁学编程是不是太晚了
  20. xshell服务器命令

热门文章

  1. 【支付接口】玩一下支付宝沙箱环境
  2. 3DLC系列:LUT 管理器
  3. 24岁“天才少年”曹原再次一天连发2篇Nature!
  4. 高考结束,快收下这份AI专业指南!| 至强非凡问答
  5. Group Policy Client解决方法
  6. 【Linux】常见面试题2023版
  7. 爱快 Docker NodeRed Tcp服务器远程连接试验
  8. JSP在线教学质量评价系统的设计与实现(源代码+论文)
  9. 商标无效宣告怎么答辩,商标无效的证据有哪些?
  10. windows下用批处理文件修改网络适配器设置