大数据实时处理框架之Flink win10快速部署
目录
一、依赖环境安装
1、jdk和scala依赖下载
2、flink1.9.0下载
二、环境变量配置
1、FLINK_HOME变量配置
2、将FLINK_HOME\bin变量加入path
三、启动运行flink
1、启动flink
2、访问WEB UI
3、cmd命令行执行flink demo
4、WEB页面上传jar包执行
四、监控 flink JVM使用资源
1、运行 jdk 的 jvisualvm 客户端
五、一键启动脚本
1、win10搭建kafka环境
2、win10搭建flink环境
3、一键启动脚本
一、依赖环境安装
1、jdk和scala依赖下载
jdk1.8:https://www.oracle.com/java/technologies/javase/javase-jdk8-downloads.html
scala12.11:https://www.scala-lang.org/download/
2、flink1.9.0下载
flink官方中文文档:https://flink.apache.org/zh/downloads.html
flink1.9.0安装包:https://archive.apache.org/dist/flink/flink-1.9.0/
二、环境变量配置
1、FLINK_HOME变量配置
2、将FLINK_HOME\bin变量加入path
三、启动运行flink
1、启动flink
打开cmd,执行
start-cluster
2、访问WEB UI
http://localhost:8081
3、cmd命令行执行flink demo
cmd 进入 fink 的 bin 目录
cd %FLINK_HOME%\bin && D:
执行官方 demo wordcount.jar 统计 readme.txt 文件的单词个数,将结果输出到 wordcount.txt 文件
flink run %FLINK_HOME%\examples\batch\WordCount.jar -input %FLINK_HOME%\README.txt --output %FLINK_HOME%\wordcount.txt
4、WEB页面上传jar包执行
点击 Add New 上传本地 jar 包
上传之后点击 submit 提交
四、监控 flink JVM使用资源
1、运行 jdk 的 jvisualvm 客户端
进入jdk bin目录下执行 jvisualvm.exe
选择 org.apache.flink.runtime.taskexecutor.TaskManagerRunner,点击监视查看TaskManager进程的资源利用
其他运行在JVM的任务也可以在 Java VisualVM 客户端下查看
五、一键启动脚本
1、win10搭建kafka环境
https://blog.csdn.net/qq262593421/article/details/109327420
2、win10搭建flink环境
https://blog.csdn.net/qq262593421/article/details/109365896
3、一键启动脚本
start-all.cmd
start %KAFKA_HOME%\bin\windows\zookeeper-server-start %KAFKA_HOME%\config\zookeeper.properties
start %KAFKA_HOME%\bin\windows\kafka-server-start %KAFKA_HOME%\config\server.properties
start %FLINK_HOME%\bin\start-cluster
执行此脚本可以多窗口同时启动 kafka flink
Flink本地模式Linux安装:https://ci.apache.org/projects/flink/flink-docs-release-1.13/zh//docs/try-flink/local_installation/
大数据实时处理框架之Flink win10快速部署相关推荐
- 新代大数据计算框架Apache Flink
大数据计算框架的发展 最近几年,出现了很多热门的开源社区,其中注明的Hadoop Storm,以及很热门的Spark, 它们有着各自专注的应用场景.Spar掀开了内存计算的先河,也以内为基础,赢得了内 ...
- Flink大数据计算框架
大数据计算框架--Flink 什么是Flink 为什么选择Flink(优点.特性) 同时支持高吞吐.低延迟.高性能 支持事件时间(Event Time)概念 支持有状态计算 支持高度灵活的窗口(win ...
- 【2017年第4期】流式大数据实时处理技术、平台及应用
陈纯 浙江大学计算机科学与技术学院,浙江 杭州 310058 摘要:大数据处理系统根据其时效性可分为批式大数据和流式大数据两类.上述两类系统均无法满足"事中"感知查询分析处理模式的 ...
- 全面认识当前市面99%的大数据技术框架(附:各大厂大数据技术应用文章)
目录 大数据领域分析 系统平台 集群管理与监控 文件系统 资源调度 协调框架 数据存储 数据处理 数据查询和分析 数据收集 消息系统 任务调度 数据治理 数据可视化 云平台 大数据必知点 大厂应用实践 ...
- 全面解析流式大数据实时处理技术、平台及应用
一. 引言 大数据技术的广泛应用使其成为引领众多行业技术进步.促进效益增长的关键支撑技术.根据数据处理的时效性,大数据处理系统可分为批式(batch)大数据和流式(streaming)大数据两类.其中 ...
- 大数据计算框架及引擎介绍
一.大数据处理框架 主流的大数据处理框架包括以下三类五种: 1.仅批处理框架:Apache Hadoop 2.仅流处理框架:Apache Storm.Apache Samza 3.混合框架:Apach ...
- 大数据开源框架技术汇总
主要基于对现阶段一些常用的大数据开源框架技术的整理,只是一些简单的介绍,并不是详细技术梳理.可能会有疏漏,发现再整理.参考得太多,就不一一列出来了.这只是作为一个梳理,对以后选型或者扩展的做个参考. ...
- 大数据计算框架期末复习
1. 下面哪个不是Linux发行版本 (D) A. Ubuntu B. Centos C. RedHat Enterprise Linux D. Mac 6.web方式查看hdfs目录结构 ...
- 大数据计算框架与平台--深入浅出分析
http://mp.weixin.qq.com/s/s2DnbgieeQockaLKdZDCzA?utm_source=tuicool&utm_medium=referral 1. 前言 计算 ...
最新文章
- 刷题 - 基础数学/数论问题
- 算法-------反转字符串
- python3爬虫实例代码-Python3爬虫带上cookie的实例代码
- C++set和multiset区别
- java gc error_java.lang.OutOfMemoryError GC overhead limit exceeded原因分析及解决方案
- 包容网关 Inclusive Gateway
- Linux 命令(94)—— env 命令
- java guava cache_java使用guava cache实现本地缓存
- LNMP源码安装教程
- 机器学习:提升算法之Adaboost
- pycharm控制台打印时显示内容,不用省略号代替
- visio 2007 简体中文版下载
- 知乎python小项目_python进阶知乎
- 全国区块链信息服务备案超千个
- 换行、回车、空格等常用的ASCII码值
- 什么样的团队才是理想中的团队? (转自AtTeam官微的博客)
- C语言简单实现14个例题(谭浩强第四版)
- java开发微信抢红包挂_微信抢红包算法实现(JAVA)
- base-64 字符数组的无效长度
- 关于换行以及换行属性
热门文章
- HTML+CSS+JS作品展示(仿写携程网移动端首页②)
- Go time 时间的各种格式转换
- ISO9001认证大致流程
- b站老是服务器中断,B站崩了是怎么回事 B站回应部分服务器机房发生故障
- 华为p9 android版本,多版本同步 华为P9将于4月15日国内发布
- web前端开发-js(网站的行为)
- 最新kali之responder
- 3D图形和网络编程的一次实践——昆特牌Online
- HttpUnit爬取中国知网特定大学网页
- matlab 冒泡排序算法,排序算法一:冒泡排序,插入排序以及选择排序原理与MATLAB实现...