度量空间的应用

在上一篇文章中,我们创建了一个简单的索引代码,该代码可以对ElasticSearch进行数千个并发请求。 监视系统性能的唯一方法是老式的日志记录语句:

.window(Duration.ofSeconds(1))
.flatMap(Flux::count)
.subscribe(winSize -> log.debug("Got {} responses in last second", winSize));

很好,但是在生产系统上,我们宁愿有一些集中的监视和图表解决方案来收集各种指标。 一旦在数千个实例中拥有数百个不同的应用程序,这一点就变得尤为重要。 拥有一个单一的图形仪表板(汇总所有重要信息)变得至关重要。 我们需要两个组件来收集一些指标:

  • 发布指标
  • 收集并可视化它们

使用Dropwizard指标发布指标

在Spring Boot 2中, Dropwizard指标被Micrometer取代。 本文使用前者,下一个将在实践中显示后者的解决方案。 为了利用Dropwizard指标,我们必须将MetricRegistry或特定指标注入我们的业务类别。

import com.codahale.metrics.Counter;
import com.codahale.metrics.MetricRegistry;
import com.codahale.metrics.Timer;
import lombok.RequiredArgsConstructor;
import lombok.extern.slf4j.Slf4j;@Component
@RequiredArgsConstructor
class Indexer {private final PersonGenerator personGenerator;private final RestHighLevelClient client;private final Timer indexTimer;private final Counter indexConcurrent;private final Counter successes;private final Counter failures;public Indexer(PersonGenerator personGenerator, RestHighLevelClient client, MetricRegistry metricRegistry) {this.personGenerator = personGenerator;this.client = client;this.indexTimer = metricRegistry.timer(name("es", "index"));this.indexConcurrent = metricRegistry.counter(name("es", "concurrent"));this.successes = metricRegistry.counter(name("es", "successes"));this.failures = metricRegistry.counter(name("es", "failures"));}private Flux<IndexResponse> index(int count, int concurrency) {//....}}

这么多样板,以添加一些指标!

  • indexTimer测量索引请求的时间分布(平均值,中位数和各种百分位数)
  • indexConcurrent度量当前有多少个待处理的请求(已发送请求,尚未收到响应); 指标随时间上升和下降
  • successfailures计算相应的成功索引请求和失败索引请求的总数

我们将在一秒钟内删除样板,但首先,让我们看一下它在我们的业务代码中的作用:

private Mono<IndexResponse> indexDocSwallowErrors(Doc doc) {return indexDoc(doc).doOnSuccess(response -> successes.inc()).doOnError(e -> log.error("Unable to index {}", doc, e)).doOnError(e -> failures.inc()).onErrorResume(e -> Mono.empty());
}

每次请求完成时,上面的这种辅助方法都会增加成功和失败的次数。 而且,它记录并吞下错误,因此单个错误或超时不会中断整个导入过程。

private <T> Mono<T> countConcurrent(Mono<T> input) {return input.doOnSubscribe(s -> indexConcurrent.inc()).doOnTerminate(indexConcurrent::dec);
}

上面的另一种方法是在发送新请求时增加indexConcurrent指标,并在结果或错误到达时将其递减。 此指标不断上升和下降,显示进行中的请求数。

private <T> Mono<T> measure(Mono<T> input) {return Mono.fromCallable(indexTimer::time).flatMap(time ->input.doOnSuccess(x -> time.stop()));
}

最终的助手方法是最复杂的。 它测量编制索引的总时间,即发送请求和接收响应之间的时间。 实际上,它非常通用,它只是计算订阅任意Mono<T>到完成之间的总时间。 为什么看起来这么奇怪? 好了,基本的Timer API非常简单

indexTimer.time(() -> someSlowCode())

它只需要一个lambda表达式并测量调用它花费了多长时间。 另外,您可以创建一个小的Timer.Context对象,该对象可以记住创建时间。 当您调用Context.stop()它将报告此度量:

final Timer.Context time = indexTimer.time();
someSlowCode();
time.stop();

使用异步流,要困难得多。 任务的开始(由预订表示)和完成通常发生在代码不同位置的线程边界上。 我们可以做的是(懒惰地)创建一个新的Context对象(请参阅: fromCallable(indexTimer::time) ),并在包装​​的流完成时,完成Context (请参阅: input.doOnSuccess(x -> time.stop() ))。这是您构成所有这些方法的方式:

personGenerator.infinite().take(count).flatMap(doc -> countConcurrent(measure(indexDocSwallowErrors(doc))), concurrency);

就是这样,但是用这么多低级的度量收集细节污染业务代码似乎很奇怪。 让我们用专门的组件包装这些指标:

@RequiredArgsConstructor
class EsMetrics {private final Timer indexTimer;private final Counter indexConcurrent;private final Counter successes;private final Counter failures;void success() {successes.inc();}void failure() {failures.inc();}void concurrentStart() {indexConcurrent.inc();}void concurrentStop() {indexConcurrent.dec();}Timer.Context startTimer() {return indexTimer.time();}}

现在,我们可以使用一些更高级的抽象:

class Indexer {private final EsMetrics esMetrics;private <T> Mono<T> countConcurrent(Mono<T> input) {return input.doOnSubscribe(s -> esMetrics.concurrentStart()).doOnTerminate(esMetrics::concurrentStop);}//...private Mono<IndexResponse> indexDocSwallowErrors(Doc doc) {return indexDoc(doc).doOnSuccess(response -> esMetrics.success()).doOnError(e -> log.error("Unable to index {}", doc, e)).doOnError(e -> esMetrics.failure()).onErrorResume(e -> Mono.empty());}
}

在下一篇文章中,我们将学习如何更好地组合所有这些方法。 并避免一些样板。

发布和可视化指标

仅仅收集指标是不够的。 我们必须定期发布汇总指标,以便其他系统可以使用,处理和可视化它们。 一种这样的工具是Graphite和Grafana 。 但是,在开始配置它们之前,让我们先将指标发布到控制台。 在对度量进行故障排除或开发期间,我发现这特别有用。

import com.codahale.metrics.MetricRegistry;
import com.codahale.metrics.Slf4jReporter;@Bean
Slf4jReporter slf4jReporter(MetricRegistry metricRegistry) {final Slf4jReporter slf4jReporter = Slf4jReporter.forRegistry(metricRegistry.build();slf4jReporter.start(1, TimeUnit.SECONDS);return slf4jReporter;
}

这个简单的代码片段采用现有的MetricRegistry并注册Slf4jReporter 。 每秒您将看到所有指标打印到日志中(Logback等):

type=COUNTER, name=es.concurrent, count=1
type=COUNTER, name=es.failures, count=0
type=COUNTER, name=es.successes, count=1653
type=TIMER, name=es.index, count=1653, min=1.104664, max=345.139385, mean=2.2166538118720576,stddev=11.208345077801448, median=1.455504, p75=1.660252, p95=2.7456, p98=5.625456, p99=9.69689, p999=85.062713,mean_rate=408.56403102372764, m1=0.0, m5=0.0, m15=0.0, rate_unit=events/second, duration_unit=milliseconds

但这仅仅是为了解决问题,为了将指标发布到外部Graphite实例,我们需要一个GraphiteReporter

import com.codahale.metrics.MetricRegistry;
import com.codahale.metrics.graphite.Graphite;
import com.codahale.metrics.graphite.GraphiteReporter;@Bean
GraphiteReporter graphiteReporter(MetricRegistry metricRegistry) {final Graphite graphite = new Graphite(new InetSocketAddress("localhost", 2003));final GraphiteReporter reporter = GraphiteReporter.forRegistry(metricRegistry).prefixedWith("elastic-flux").convertRatesTo(TimeUnit.SECONDS).convertDurationsTo(TimeUnit.MILLISECONDS).build(graphite);reporter.start(1, TimeUnit.SECONDS);return reporter;
}

在这里,我向localhost:2003报告,我的Graphite + Grafana Docker镜像恰好在其中。 每秒将所有度量标准发送到该地址。 我们稍后可以在Grafana上可视化所有这些指标:


顶图显示了索引时间分布(从第50个百分位数到第99.9个百分位数)。 使用此图,您可以快速发现典型性能(P50)和(几乎)最坏情况的性能(P99.9)。 对数标度是不寻常的,但是在这种情况下,我们可以看到上下百分位。 底部图更加有趣。 它结合了三个指标:

  • 成功的索引操作的速率(每秒的请求数)
  • 操作失败率(红色条,堆叠在绿色条上)
  • 当前并发级别(右轴):进行中的请求数

此图显示了系统吞吐量(RPS),故障和并发性。 故障太多或并发级别异常高(许多操作正在等待响应)可能表明您的系统存在某些问题。 仪表板定义在GitHub存储库中可用。

在下一篇文章中,我们将学习如何从Dropwizard指标迁移到微米。 一个非常愉快的经历!

翻译自: https://www.javacodegeeks.com/2018/01/monitoring-measuring-reactive-application-dropwizard-metrics.html

度量空间的应用

度量空间的应用_使用Dropwizard度量标准监视和测量无功应用相关推荐

  1. 度量学习_使用Dropwizard度量标准监视和测量无功应用

    度量学习 在上一篇文章中,我们创建了一个简单的索引代码,该代码可以对ElasticSearch进行数千个并发请求. 监视系统性能的唯一方法是老式的日志记录语句: .window(Duration.of ...

  2. 使用Dropwizard度量标准监视和测量无功应用

    在上一篇文章中,我们创建了一个简单的索引代码,该代码可以对ElasticSearch进行数千个并发请求. 监视系统性能的唯一方法是老式的日志记录语句: .window(Duration.ofSecon ...

  3. 用paddleocr识别汉字_汉字设计中的度量标准(三)

    x 高度.大写字母高度. 上升部高度.下降部高度. 字干粗细.字身倾斜角度-- 这些参数是今天衡量.描述 一款西文字体最基本的度量标准, 并由此将西文字体带向参数化与可变字体. 回顾汉字设计,我们是不 ...

  4. 软件工程软件开发成本度量规范_软件开发成本度量方法

    软件成本度量一直都是软件行业的一个痛点问题.软件度量一度乱象丛生.拍脑袋的定价方式曾大行其道.软件成本度量的乱象直接导致了软件价格的诸多问题.比如预算费用存在浪费或不足的现象,招标存在投标额过低过高等 ...

  5. 代码质量度量标准_Google研发度量改进实践

    Google改进过程: 本文案例源自:<Measuring Engineering Productivity> 作者:Ciera Jaspen,Google 前言 随着敏捷开发.DevOp ...

  6. 选择正确的错误度量标准:MAPE与sMAPE的优缺点

    MSE,RMSE,MAE,MAPE,sMAPE-等等有大量不同的错误度量标准,每个错误度量标准都有其优点和缺点,并且涉及的案例比以前更多. 那么,如何决定要为我们的项目使用哪种指标呢? 我相信回答这个 ...

  7. 猎头、猎腰还是猎腿?谷露定义猎企数字化度量标准,为猎头打造移动端业务闭环

    2021年1月16日,谷露星选2020颁奖盛典暨猎头行业数字化大会,谷露软件创始人兼CEO施润春(Kevin Shi)以曾经猎头行业从业者.现在猎头行业服务者的角度,分享了他视角中猎头行业这些年的发展 ...

  8. 电子测量与仪器第四版pdf_固定资产管理系统_资产分类名称(电子和通信测量分析仪器篇)...

    大家好,今天小编来给大家讲解一下固定资产管理系统中的资产分类模块包含的与电子和通信声源.声级.声振测量分析仪器相关的固定资产分类名称. 1.声源.声振信号发生器:校准激励器.声源仪.声振信号发生器.声 ...

  9. 代码质量度量标准_追求代码质量(2): 监视圈复杂度

    每位开发人员对代码质量的含义都有着自己的看法,并且大多数人对如何查找编写欠佳的代码也有自己的想法.甚至术语代码味道(code smell) 也已进入大众词汇表,成为描述代码需要改进的一种方式. 代码味 ...

最新文章

  1. 万能 Transformer,你应该知道的一切
  2. WWF(Windows Workflow Foundation)开发环境的建立。 .NET 技术前瞻,WWF,Windows,Workflow,Foundation...
  3. SAP中国际贸易条款的含义
  4. 全志 修改485转CAN串口回显 Patch
  5. 01.elasticsearch请求使用的基本语法
  6. GitHub超级火!任意爬取,超全开源爬虫工具箱
  7. C# 获取枚举的DescriptionAttribute内的字符串
  8. 一起啃PRML - 1.2.2 Expectations and covariances 期望和协方差
  9. 蓝桥杯2015年第六届C/C++省赛B组第二题-星系炸弹
  10. Altera 在线资源使用
  11. win7 蓝牙4.0 ble驱动_传统蓝牙搜索流程分析
  12. 项目管理必备的软件,实用方便
  13. 激光雷达3D建模---读书笔记
  14. 三原色图(最小生成树 kruskal)
  15. 吉他箱体模拟效果器插件-Positive Grid BIAS FX 2 DeskTop 2.3.0.6070 Elite WiN
  16. <数据结构> rear指针指向队尾元素 牺牲一个存储位置 的循环队列实现(C语言)(第4种/共6种)
  17. win11安卓子系统WSA的安装和使用
  18. c语言 平均差 标准差,平均差与标准差计算公式中的平均数是()。
  19. Java使用AES/EBC/PKCS5Padding加密,CryptoJS解密错误
  20. 四巯基卟啉修饰的金属有机框架材料(UiO66)|ZIF67纳米颗粒修饰的C3N4氮化碳(C3N4)|Fe3O4@MOF-199@C18磁性纳米材料

热门文章

  1. CF1192B Dynamic Diameter(LCT)
  2. 51nod-有限背包计数问题【dp】
  3. P3514-[POI2011]LIZ-Lollipop【思路题】
  4. Codeforces Round #684 (Div. 2)
  5. 糊涂的教授【拓扑排序】
  6. Boring Homework 二叉搜索树的打印,模拟
  7. Java进阶学习路线
  8. JavaFX官方教程(十四)之转换,动画和视觉效果教程的源代码
  9. JavaFX官方教程(五)之在JavaFX中创建表单
  10. 独占锁、共享锁、更新锁,乐观锁、悲观锁