Dynatrace系列之- 如何发现和分析问题

Dynatrace用Problem(问题)表示异常情况,即偏离了正常行为或状态。例如某个服务速度变慢或某个用户登录应用速度变慢。每当检测到问题时,Dynatrace都会引发一个特定的problem event(问题事件)来表示此类异常。

请注意,您环境中新检测到的异常事件并不一定会立即引发一个新的问题(Problem)。Dynatrace抛出的问题(Problem)通常带有根本原因分析。为了确定问题的根本原因,Dynatrace采用了一种上下文感知的方法来检测一系列相互依赖的事件。Dynatrace会去分析相应时间段内涉及到的所有主机,所有进程,所有服务,所有应用程序以及他们之间纵向横向的依赖关系。只有通过这种上下文感知的方法,才最可能查明问题发生的真正根本原因。

问题检测

为了确定在什么时间点产生新problem event(问题事件)更合理,Dynatrace 会根据定义的阈值连续不停地评估传入的数据。通过这种方法来保证生成准确的响应时间退化和错误率上升的新problem event(问题事件)。对于应用和服务来说,急速的响应时间退化是根据5分钟时间段来评估的,慢速的响应时间退化是根据15分钟时间段来评估。

理解阈值

Dynatrace使用两种类型的阈值:

自动基线:

多维度基线自动检测随时间变化的各个参考值。自动基线参考值用于应对应用程序或服务“响应时间”,“错误率”和“交易量”中的动态变化。

内置静态阈值:

Dynatrace对所有基础架构相关的事件使用内置静态阈值(例如,检测CPU占用过多,磁盘空间不足或内存不足)。【注:此处最新版本中将会有改变,基础架构相关的事件将可以采用自动基线机制】

基于自动基线触发事件的机制与基于静态阈值完全不同。静态阈值提供了一种简单明了的方法,不需要学习时间就可以立即工作。但是,由于以下缺点,这种方法是不明智的:

  • 缺点1:为每种服务或用户操作设置静态阈值需要大量的人工。
  • 缺点2:为动态服务设置静态阈值可能具有挑战性。
  • 缺点3:无法适应不断变化的环境。
    因此,Dynatrace使用AI来开发一种智能的,自动化的多维基线方法。与静态阈值相反,此方法无需使用手动配置阈值即可立即使用,最重要的是,可自动适应流量模式的变化。

请注意,Dynatrace允许您通过调整静态阈值或偏离自动基线值来调整问题检测的敏感性。

问题分析

检测到问题后,您可以在问题的概述页面上直接分析其后果。Dynatrace提供了直接影响分析和业务影响分析的功能。另外,在问题的概述页面上,您可以分析问题的根本原因。

根本原因分析

为了确定问题的根本原因,Dynatrace不仅依赖于时间相关性,还遵循上下文感知的方法来检测跨时间,进程,主机,服务,应用程序以及在垂直和水平拓扑监控视角中相互依赖的事件。

下面是一个问题(Problem)的示意图,该问题的根本原因是基础结构层中的性能事件。

  1. Dynatrace检测到基础结构级别的性能事件。将创建一个新问题以进行跟踪,并通过Dynatrace移动应用程序发送通知。

  2. 几分钟后,基础结构问题导致应用程序服务之一出现性能下降问题。

  3. 其他服务级别的性能下降问题开始出现。因此,最初从一个孤立的仅基础架构的问题开始,已经发展成为一系列服务级别的问题,每个问题的根本原因都在于基础结构层的原始事件。

  4. 最终,服务级别的问题开始影响通过桌面或移动浏览器与您的应用程序进行交互的客户的用户体验。在问题生命周期的这一个时间点上,您遇到了一个应用程序问题,其中一个根本原因在基础架构层,而另一个根本原因在服务层。

因为Dynatrace可以了解您环境中的所有依赖关系,所以可以将客户遇到的性能下降问题与基础结构层中的原始性能问题相关联,从而有助于快速解决问题。

问题告警

在检测到异常后,Dynatrace可以生成告警,以通知负责人员出现的问题。Dynatrace允许您根据严重性,客户影响,关联的标签或检测到的问题的持续时间来设置细粒度的警报过滤规则。这些规则实际上使您可以定义警报配置文件。通过警报配置文件,您还可以与第三方消息系统(如Slack,HipChat和PagerDuty)建立过滤后的问题通知集成。

Dynatrace系列之- 如何发现和分析问题相关推荐

  1. Dynatrace系列之- 标记常见问题

    Dynatrace系列之- 标记常见问题 在大型环境中,系统的某些方面可能会持续触发不必要的警报.这些告警可能来自非关键组件或者是非关键情况下的资源不足的问题.通常这些问题不需要人员响应. 为了减少此 ...

  2. 搜索引擎重复网页发现技术分析

    /*版权声明:可以任意转载,转载时请务必标明文章原始出处和作者信息 .*/   搜索引擎重复网页发现技术分析 中科院软件所  张俊林 TIMESTAMP:2006年6月1日 一.  介绍 统计结果表明 ...

  3. SequoiaDB 系列之六 :源码分析之coord节点

    好久不见. 在上一篇SequoiaDB 系列之五   :源码分析之main函数,有讲述进程开始运行时,会根据自身的角色,来初始化不同的CB(控制块,control block). 在之前的一篇Sequ ...

  4. Glide系列(四) — Glide缓存流程分析

    文章目录 一.概述 1.1 背景 1.2 系列文章 二.准备知识 2.1 Glide 的缓存分层结构 2.2 Glide 缓存相关类的关联关系 三.缓存的获取流程 3.1 缓存获取的入口 3.2 内存 ...

  5. ONVIF系列笔记-设备发现机制

    ONVIF系列笔记-设备发现机制 ONVIF系列笔记-功能接口地址的获取 ONVIF系列笔记-流地址的获取 ONVIF系列笔记-PTZ的控制 ONVIF系列笔记-调焦切换及背光控制 SFX流媒体解决方 ...

  6. 网络舆情热点发现及分析(single-pass聚类)

    热点话题的发现模型 在整个的过程中,介绍三个点: 预处理:基于网络新词的识别算法 热点话题发现:增量聚类算法Single-Pass 热点话题分析:文本倾向性分析 基于网络新词的识别算法 算法思路: 首 ...

  7. Experience 发现问题 分析问题 解决问题

    [b]发现问题 分析问题 解决问题[/b] 按照这三个步骤,形成自己的风格,不要发现问题就不知所错了,必须细心的去分析. 积累每一次解决问题的方法, 成就自己动手的能力和解决问题的能力! ~~~~~~ ...

  8. NLP:自然语言处理技术之词语级别相关术语解释(如上位词/WordNet)、基于词汇层面的词法分析六大任务(分词/词性标注/词干提取-词形还原/新词发现/形态分析/拼写校正)的简介及其应用

    NLP:自然语言处理技术之词语级别相关术语解释(如上位词/WordNet).基于词汇层面的词法分析(Lexical Analysis)六大任务(分词/词性标注/词干提取-词形还原/新词发现/形态分析/ ...

  9. paho架构_MQTT系列最终章-Paho源码分析(三)-心跳与重连机制

    写在前面 通过之前MQTT系列-Eclipse.Paho源码分析(二)-消息的发送与接收的介绍,相信仔细阅读过的小伙伴已经对Eclipse.Paho内部发送和订阅消息的流程有了一个较为清晰的认识,今天 ...

最新文章

  1. Android学习书籍参考
  2. latex 公式转为 word 公式
  3. android 连接服务器
  4. JPA_登录校验Controller代码
  5. STM32开发 -- 烧写/启动模式
  6. Class-dump
  7. ctype.h(cctype) 头文件函数大全
  8. Ubuntu DNS bind9 配置
  9. cocos2dx 背景用小尺寸图片滚动填充的方法
  10. 前端后端分离,怎么解决SEO优化的问题呢?
  11. input表单的type属性详解,不同type不同属性之间区别
  12. 类名作为形式参数传递
  13. html++hint标签,html5新标签总结
  14. 阶段5 3.微服务项目【学成在线】_day04 页面静态化_03-freemarker测试环境搭建
  15. matlab 中文注释乱码问题解决
  16. Quake3 快速开平方和开平方倒数计算优化
  17. mysql repaire_mysql之repair table 修复表札记
  18. IP-Guard申请外发流程说明
  19. 误删docker目录/var/lib/docker/overlay2,导致容器build失败
  20. opencv制作微信小游戏 最强连一连 辅助(2)--dfs深度优先搜索算法

热门文章

  1. 失意中年刘强东,内忧外患的京东,他们最终将何去何从?
  2. 超简单的python爬虫教程来了!批量爬取图片,机器学习必备技能(附资源)
  3. 扫描线Sweep Line算法总结
  4. 一种可远程监控的无线压力传感器
  5. 异步电机直接转矩控制与模型预测转矩控制性能对比
  6. linux mule,在Tomcat下部署Mule
  7. 阿里数据模型建设方法总结(全)
  8. mysql附加数据库出错_Sqlserver2005附加数据库时出错解决办法
  9. OPPO售后服务真的好吗?看完用户真实体验,我找到了答案
  10. B2B2C商城源码怎么选择?