Flink 中LatencyMarks延迟监控（源码分析）

ljygz 2019-12-13 原文

Flink 中LatencyMarks延迟监控（源码分析）

Posted on
2019-12-13 17:19
末日布孤单
阅读(…)
评论(…)

编辑

 收藏

流式计算中处理延迟是一个非常重要的监控metric

flink中通过开启配置 metrics.latency.interval 来开启latency后就可以在metric中看到askManagerJobMetricGroup/operator_id/operator_subtask_index/latency指标了

如果每一条数据都打上时间监控输出时间- 输入时间，会大量的消耗性能

来看一下flink自带的延迟监控是怎么做的

其实也可以想到原理很简单，就是在source周期性的插入一条特殊的数据LatencyMarker

LatencyMarker初始化的时候会带上它产生时的时间

每次当task接收到的数据是LatencyMarker的时候他就用当前时间 – LatencyMarker时间 = lateTime 并发送到指标收集系统

接着继续把这个LatencyMarker往下游emit

来看一下源码是如何实现的

因为是从source加入LatencyMarker先看StreamSource.java

在StreamSource的run 方法中

初始化了一个LatencyMarksEmitter

其实就是在processTimeServera中周期性（我们设置的metrics.latency.interval 时长）去向下游emit 当前时间的LatencyMarker

接着来到task接收数据的地方

StreamInputProcessor的processInput方法中

可以看到就是用当前时间 – LatencyMarker，然后就往report发送了

而sink算子的唯一区别就是

区别就是sink没有emit LatencyMarker 因为是最后一个算子了嘛

这里就讲完了

注意的点是：

　　　其实可以看到flink中的LatencyMarker是没有走用户代码逻辑的，也就是说统计出来的延迟时间并不是端到端的，而是除了用户逻辑处理外的延迟，

　　　因为LatencyMarker和数据的处理是同步处理的，虽然监控延迟中没有过用户逻辑代码（正常数据接收以后用户代码处理然后emit,LatencyMarker接收后直接emit）

但是就像马路一样，整个马路拥塞了延迟高了，那还是会使这个指标值越来越大

　　　可能这样的设计是考虑到LatencyMarker如果也走用户处理逻辑的话会消耗过多的性能吧，特别是采集频繁的时候

本文链接：https://www.cnblogs.com/ljygz/p/12036297.html

Flink 中LatencyMarks延迟监控（源码分析）的更多相关文章

Flink 1.10 正式发布！——与Blink集成完成，集成Hive，K8S

Apache Flink社区宣布Flink 1.10.0正式发布！本次Release版本修复1.2K个问题， […]...

Flink监控：Monitoring Apache Flink Applications

This post originally appeared on the Apache Flink blog. […]...

Flink 编程接口

欢迎来 kk大数据，今天分享的是 Flink 提供了哪些编程接口可以给我们开发。一、数据集类型现实 […]...

腾讯基于 Flink 的实时流计算平台演进之路

原文地址：https://www.infoq.cn/article/TjDeQDJQpKZ*NpG71pRW […]...

Apache Flink 分布式执行

Flink 的分布式执行过程包含两个重要的角色，master 和 worker，参与 Flink 程序执行的有 […]...

Flink 专题1 ：搭建Flink 及Flink 简介

目录 Flink 专题1 ：搭建Flink 及Flink 简介 Flink 简介 Flink 的优势: Fl […]...

大数据学习路线

一、大数据处理流程 1.1 数据收集 1.2 数据存储 1.3 […]...

[源码分析] 带你梳理 Flink SQL / Table API内部执行流程

本文将简述Flink SQL / Table API的内部实现，为大家把 “从SQL语句到具体执行 […]...

随机推荐

面试必问的MySQL锁与事务隔离级别

之前多篇文章从mysql的底层结构分析、sql语句的分析器以及sql从优化底层分析，还有工作中常用的sql优 […]...

【dotNet Core】Swagger下简单的给WebApi分组

Startup.cs下ConfigureServices代码这里主要在DocInclusionPredica […]...

python抓取网易图片

　　一个python抓取程序，用来抓取网易图片新闻中的一系列图片(抓取图片默认为大图)。　　首先打开你想要抓 […]...

关于line-height的一些理解

一、前言前两天在腾讯ISD团队博客上看到一篇翻译的文章“深入理解css 行高”(http://isd.ten […]...

ES6语法之变量定义

let 定义变量特点: let 定义的变量,不会进行预解析 […]...

关于Word中复杂表格转完美的Markdown格式的技巧

背景我们都知道有很多工具能做到Word转Markdown格式，但是在某些复杂的需求下，比如带合并单元格的表格 […]...

C语言博客作业–函数嵌套调用

一、实验作业 1.1 PTA题目题目：6-5 递归实现顺序输出整数设计思路 void printdigit […]...

SimpleDateFormat 如何安全的使用？

前言为什么会写这篇文章？因为这些天在看《阿里巴巴开发手册详尽版》，没看过的可以关注微信公众号：zhishe […]...

Flink 中LatencyMarks延迟监控（源码分析）