然后我们再来看上一步我们理解了数据流的执行,生成过程,

然后我们再来看数据流的传输以及任务链,因为如果需要知道

两个任务到底是如何合并的,这里就需要知道数据流传输和任务链才行.

首先我们要知道

1.一个程序中,不同的任务可能有不同的并行度

2.算子也就是不同的任务之间数据传输的模式,可能有one to one的模式,也就是forward模式,也可以是redistributing模式,要知道这个redistributiing模式会导致stream分区的改变,也就一个任务可能会

分成多个任务.比如keyby这个算子,会基于hash值,进行重新数据的重新分区,也就是数据流向不同的slot.

这里的redistribute类似于算子会进行hash等操作,把数据分开,而one to one的操作,比如map ,filter, flatMap不会进行分开,所以是one to one的操作.

大数据_Flink_数据处理_运行时架构8_数据传输和任务链---Flink工作笔记0023相关推荐

  1. 大数据_Flink_数据处理_运行时架构4_作业调度原理及思考问题---Flink工作笔记0019

    首先我们来看这个过程,可以看到 1.比如我们写了一段代码,有可能用java写的,有可能用scala写的,这个代码,首先会生成一个数据流图,然后这个数据流图可以通过客户端client 2.提交给jobm ...

  2. 大数据_Flink_数据处理_运行时架构7_程序结构和数据流图---Flink工作笔记0022

    然后我们再来看实际上,flink对数据的处理,反应到代码上可以看到都是对DataStream的处理对吧,然后我们看,可以分成3个部分,一个是source部分,这里就是对源数据流的读取, 然后trans ...

  3. 大数据_Flink_数据处理_运行时架构6_slot和并行度的关系---Flink工作笔记0021

    上面我们说了flink允许子任务共享slot,等等,有几个任务,如何分配slot等等对吧. 然后我们再继续来看slot和并行度的关系,看到上面左侧,这个任务有A任务4个并行度,然后B任务4个并行度,然 ...

  4. 大数据_Flink_数据处理_运行时架构5_slot和任务调度---Flink工作笔记0020

    1.并行计算不同的任务,分配到不同的线程上就可以并行计算了 2.然后并行任务,现在我们知道,如果我们设置的并行度是3,那么这里需要的slot就是3个对吧 这个跟任务的最大并行度有关 3.然后就是我们写 ...

  5. 大数据_Flink_数据处理_运行时架构3_yarn上作业提交流程---Flink工作笔记0018

    然后我们再来看看,yarn上面的flink的job提交流程,可以看到 首先flink client,1.先去上传flink的jar包和配置,到HDFS,然后,2再提交job任务,给resourcema ...

  6. 大数据_Flink_数据处理_运行时架构2_作业提交流程_抽象架构---Flink工作笔记0017

    1.首先先去提交任务,这个提交任务可以是在网页端后台,也可以是在命令行提交任务. 在网页端后台提交就是flink的网页管理端对吧. 2.第1步任务将会被提交到分发器 3.第2步分发器会把任务转交给jo ...

  7. 大数据_Flink_流式处理_Flik Vs Spark streaming_Flink的特点---Flink工作笔记0007

    然后我们再来比较一下spark和flink,可以看到 spark是虽然也是说是做流的处理,但是spark的架构实现是,基于微批处理的,也就是 来了数据,先攒一攒,攒够了一批以后,才去处理,他的延时,可 ...

  8. 大数据_Flink_数据处理_流式数据源测试---Flink工作笔记0010

    前面我们已经写好了,流式数据处理的案例了. 但是我们执行的时候可以看到,我们输入的流,实际上是我们准备的一个文件对吧. 一个Text文件,实际上不算是一个流式数据源 那么正式环境的时候,一般都是,用流 ...

  9. 大数据_Flink_数据处理_流处理API_Source_自定义测试数据源---Flink工作笔记0028

    然后我们来看,一般情况下,从文件中读取数据,用的,不如 从kafka,中读取数据用的多. 然后我们再来看一种,自定义数据源,这个主要是我们可以在上线之前模拟很多的数据来进行测试对吧. 这里我们新写一个 ...

最新文章

  1. java中引导页面的,Android实现欢迎引导页面
  2. Microsoft Azure News(4) Azure新D系列虚拟机上线
  3. c++ map的使用方法[转]
  4. Python学习-终端字体高亮显示
  5. 【SimMechanics】使用Matlab/SimMechanics仿真机械臂
  6. opencv常用函数整理(二)
  7. 如何使用 AirPlay 在 Mac 上使用 HomePod?
  8. Pulseaudio入门介绍(一)
  9. 用python制作动态二维码_用Python制作动态二维码
  10. Windows下USB驱动开发入门小结
  11. 联邦贸易委员会:大数据带来的歧视风险
  12. Requirement already satisfied的解决方案
  13. 你在工作中遇到过印象深刻的困难是什么,你怎么克服的?
  14. C 喵帕斯之平地摔 SDUT
  15. TI DSP 6657 SRIO 简介
  16. 风险管理可分为哪两类?具体方法是什么?
  17. 旷视回顾全球十大AI治理事件,技术与伦理安全如何进行落地
  18. AI芯片:寒武纪NPU设计分析(DianNao)
  19. C语言:质数和合数的判断
  20. 【flask】 flask

热门文章

  1. C语言实训作业PPT,C语言实训作业.docx
  2. NTV Media Server G3 API All in One
  3. axios请求跨域前端解决_前端跨域请求axios里面withCredentials: true
  4. Redis配置文件redis.config详解以及关闭Redis服务
  5. 图像处理算法工程师——1必备技能总结——2面试题大全
  6. Vue.js - Day4
  7. http://www.codeproject.com/script/Articles/ViewDownloads.aspx?aid=9332 多broser
  8. IDA动态调试Android的DEX文件
  9. 通信网真的面临容量危机?
  10. Error--解决使用Application Loader提交ipa包审核时的报错:ERROR ITMS-90168: The binary you uploaded was invalid....