比赛名称:无线网络故障定位的根本原因分析

一、背景

当故障发生时,根本原因分析在无线网络运行和管理中起着重要作用。快速、准确的故障定位对于及时恢复网络至关重要。真实的网络往往有复杂的环境和部署场景,故障的发生是不规律的。因此,根据现有的知识来推断已经发生或即将发生的问题是很有挑战性的。

根源定位依赖于变量之间的依赖关系。关键是要确定因果关系。以下图为例,其中Y受变量 X1,X2,X3X_1,X_2,X_3X1​,X2​,X3​的影响。当Y的值发生变化时,我们需要分析X1,X2,X3X_1,X_2,X_3X1​,X2​,X3​中的哪个变量对Y有最重要的影响。目前的操作多以工程师的主观意见来完成,这有几个缺点。首先,估计的因果效应严重依赖于工程师的专业知识。与数据驱动的方法相比,这种方法不能灵活地推广到其他应用中,而且复杂的关系也很难把握。其次,工程师的专业知识通常是有限的,因此有可能忽略了某些因素。例如,在说明性的例子中, X3X_3X3​也会影响X2X_2X2​。在测量X2X_2X2​的影响时,我们也应该考虑到X3X_3X3​。


在本次竞赛中,我们将提供如图1所示的因果关系图供参考。本次竞赛的目的是根据收集到的真实网络数据和图1中给出的相关因果关系图,学习一个通用的根本原因分析模型。

由于数据安全问题,我们对特征名称进行了匿名处理。我们已经建立了一个竞赛平台来支持这个活动,注册用户可以在这里下载数据,分享想法,并提交他们的结果。

二、描述


在电信网络中,feature0的性能低于预期始终是一个客户关心的问题。本次比赛主要是对feature0的不良表现(KPI低)进行根本原因分析。当它的值小于200时,我们需要分析影响因素并定位出原因。因果关系如图1所示。在电信网络中,每个特征feature都可以被解释为一个key performance indicator关键性能指标(KPI)。这些KPI的值随时间变化,并相互影响。根据图1中提供的关系,我们需要推断出feature0的低值的根本原因。

(图中)
1、资源不足Resource insufficient
2、边缘地区的信号较弱Weak signal in marginal areas
3、节点间的强干扰Strong interference among nodes
4、特征Y中的元素分辨力低Low discrimination of the elements in feature Y
5、特征Y对于n来说是不平衡的Feature Y is not balanced regarding to n
6、KPI的四个实体不平衡

三、数据集

提供的真实世界数据集包括:

  • 因果关系图(见图1)。这个因果关系图来自一个标准的通信协议,在不同的场景下是通用的。椭圆代表一个变量或一组变量。白色椭圆代表观察到的变量。灰色椭圆代表一个中间变量(不可观察)。矩形代表可能的根本原因。在顶部,feature0是操作者关心的目标变量。变量之间的关系往往是非线性的。有些关系是决定性的,有些是概率性的。
  • 特征数据集。这个数据集总共包含2984个样本。每个样本是一个从不同的5G道路测试中收集的时间片。**有23个可观察的变量(图1中的白色椭圆),携带着在时间片中测量的不同KPI的信息。**在2984个样本中,只有约45%的样本被标记为根源性故障,其他的仍未被标记。
    我们在数据会中留下了更详细的描述。

3.1数据集细节

Data in each time slice:

我们采用时间片分析,这意味着我们只需要 at the time slice level上定位根本原因。
例如,表1显示了从2020-08-18 18:24:40到2020-08-18 18:25:42的一个时间片(一分钟,每秒钟数据都会列出来)。数据点每秒钟都被记录下来。
特征0的值保持在一定范围内,允许有一些抖动。
在这里,这个时间片中feature0的值大约是300。我们根据这个时间片中的所有数据点来标注根本原因。注意,多个根本原因也可以同时出现,例如,表1中的时间片同时被标记为根本原因2和3。

一些备注:

  • 特征值可以是连续的或离散的Feature values can be continuous or
    discrete:例如,特征0是连续的,特征15是离散的。
  • 有些特征反映的是统计信息:例如,特征3_1-3_8表示特征3落在相应数值1~8的计数。
  • 空间特征:例如,特征28_0-28_7表示特征28在0~7方向的数值。
  • 时间特征:例如,特征19的波动将导致特征0的不稳定行为。
  • 不同的数据收集粒度:例如,特征19每隔几秒钟报告一次,而特征0则是每秒钟记录一次。

注:数据是从不同的场景中收集的。在一些场景中,一些特征可能没有任何内在的值,这并不是由缺失的收集造成的。

部分标记的数据:

  • 只有少数数据被贴上了标签:在现实中,所有的标签都应该由工程师来做,依靠专业知识因此很昂贵。大量的数据仍然没有被标注。
  • 标签并不全面:在2984个样本中,我们对其中的45%进行了标注(可能是多标签)。未标记的样本也可能有缺陷。The unlabeled samples may also have faults.

3.2 特征细节


特征3_1-3_8表示特征3落在相应数值1~8的计数。

四、输出形式

参与者需要输出每个时间片的根本原因。最终结果应如下表所示,为CSV格式,代表一个带有指标函数的根本原因集。

五、判断指标

我们将抽取KaTeX parse error: Undefined control sequence: \epslion at position 4: N_t\̲e̲p̲s̲l̲i̲o̲n̲ ̲=150个样本作为测试集,参与者应该对每个根本原因作出判断,我们将把他们的预测PiP_iPi​与我们的真实标签IiI_iIi​进行比较。

分数为SiS_iSi​初始值为0,预测对了加一分,预测不对减一分,最后得分除以真实标签分数(满分),相当于做了归一化操作得到一个比率值。
最后计算每个样本的平均分
备注 (1) 如果所有的预测都是正确的,你将得到最高的最终分数S=1。(2) 如果预测的输出结果留有空白(全部为零),最终得分将为S=0。 (3) 如果预测的根本原因不在标签集中,将被扣除一个分数,因此最终得分可能为负。
比如说本来六个原因是{1,1,1,0,0,0},你预测的是{1,1,1,1,0,0},得两分。你预测的是{0,0,0,1,1,1}得-3分。

AIOPS2022_题目相关推荐

  1. LeetCode简单题之完成一半题目

    题目 有 N 位扣友参加了微软与力扣举办了「以扣会友」线下活动.主办方提供了 2N 道题目,整型数组 questions 中每个数字对应了每道题目所涉及的知识点类型. 若每位扣友选择不同的一题,请返回 ...

  2. 阿里巴巴Web前端面试的一道JS题目,求解答!!!

    题目大概是这种: function outer(){return inner;var inner = "a";function inner(){};inner = 9; } ale ...

  3. 个人作业1——四则运算题目生成程序

    需求分析: 1.控制运算表达式的题目数量,根据键盘输入数字提供对应数量表达式 2.运算符个数不能超过三个 3.能够自动生成四则运算 4.随机生成分数运算或整数运算 5.程序判断对错并给出正确答案 6. ...

  4. 九度oj 题目1411:转圈

    题目描述: 在一个有向图有n个顶点(编号从1到n),给一个起点s,问从起点出发,至少经过一条边,回到起点的最短距离. 输入: 输入包括多组,每组输入第一行包括三个整数n,m,s(1<=n< ...

  5. 题目1000:计算a+b

    题目描述: 求整数a,b的和. 输入: 测试案例有多行,每行为a,b的值. 输出: 输出多行,对应a+b的结果. 样例输入: 1 2 4 5 6 9 样例输出: 3 9 15 #include< ...

  6. 题目1460:Oil Deposit

    题目描述: The GeoSurvComp geologic survey company is responsible for detecting underground oil deposits. ...

  7. 2014百度面试题目---“求比指定整数大且最小的不重复数”解答

    题目:给定任意一个正整数,求比这个数大且最小的"不重复数","不重复数"的含义是相邻两位不相同,例如1101是重复数,而1201是不重复数. 代码: #incl ...

  8. virtual hust 2013.6.20 数论基础题目 D - Just the Facts

    题目:Just the Facts 思路:枚举10000素数内,各因子出现的次数,然后取模为10.因为0是由2和5构成的,所以2和5的幂单独讨论,同时由于2的幂肯定大于5的,所以我们最后要算的再乘上2 ...

  9. [Quiz]竞赛题目 Word Trace

    一.竞赛题目  Problem Statement   You are given a String[] grid representing a rectangular grid of letters ...

最新文章

  1. iOS逆向(1)——利用ipa重签名,3分钟iPhone安装多个微信
  2. python写gui导入图片并处理_Python图像处理库:Pillow 初级教程
  3. 左右居中_008布局题:div垂直居中,左右10px,高度始终为宽度一半
  4. python 列表比较不同物质的吸热能力_飘着雪花的冬天
  5. 工业POE交换机使用中的常见问题汇总
  6. 电子计算机简称什么也称什么,点点点电子美容仪
  7. python自学视频教程 38-python编程开发入门中文视频培训教程38讲
  8. linux 停止正在执行的shell 程序
  9. 电机轴承的检查和安装方法
  10. linux appium 安装教程,Ubuntu 系统安装 Appium 及样例运行教程
  11. Tribon参数化建模之__对型材端切的参数化建模解析
  12. layui 时间控件 只显示时分或者分秒
  13. Oracle索引原理
  14. 计算机文件无法移动,电脑上不能拖动文件怎么办 电脑上不能拖动文件如何解决...
  15. 向量的各种积,都有哪些,分别如何表示
  16. 机器学习实战(一)——员工离职预测
  17. java实现微博九宫格图片切分
  18. 联想拯救者刃7000K 2022 评测
  19. Zygote启动及其作用
  20. python搜索文献 速成_0基础5天速成Python,你也能发top期刊

热门文章

  1. 专注互联网产业链服务 天搜集团赋能传统产业升级
  2. 求解传输问题(四) Modified Distribution算法
  3. 如何限制上传附件的格式?
  4. jsbridge实现及原理_Android JSBridge的原理与实现
  5. 2021年A特种设备相关管理(电梯)考试题及A特种设备相关管理(电梯)试题及解析
  6. 为什么ChatGPT用强化学习而非监督学习?
  7. uwa和java_java字节流和字符流
  8. ad18常用快捷键可以修改吗_AD 常用快捷键记录
  9. 使用iTerm2和OhMyZsh实现一个强大终端
  10. tp5 读取扩展配置文件