hadoop海量数据实现原理
如何将机器学习与hadoop对接 不考虑安装二次开发运行
数据是机器学习的核心 hadoop框架
谷歌100亿网页 2011年谷歌100万台服务器 双十一购物信息统计机
java+hadoop是大数据工程师
运行和监控是运维工程师 能够会安装部署监控hadoop的运维工程师是云架构工程师
程序员为了分布式系统改造程序和数据
云计算平台 按小时计费的租赁计算系统 大量数据 海量数据处理计算 自己组建hadoop成本高
微软 亚马逊 华为 腾讯 阿里 费用昂贵
节点 机架 通过switch连接组成集群
集群是多个节点干一件事 分布式是多个节点分工干一件事 分布式集群通过hadoop调度将海量数据分解成块 并行处理 聚合
map reduce思想核心如何处理大规模数据 map任务key一般只有一个 1.map逐行 分解 预聚合 2.group by 排序 3.reduce key聚合 value聚合
hadoop 并行 yarn调度监控各个 子节点对数据块进行遍历 一个块一个map 一个任务一个reduce
提高并行效率 调整map reduce默认处理文件大小 map进行预处理 远大于全部reduce集中处理数并行效率
节点故障 map所有此任务节点重启map reduce待完成未完成重启reduce name节点呼叫管理员
spark 框架底层mapreduce 内存运行高效适用计算学习占内存处理效率高 稳定性不如map map适用数据准备占硬盘io
hive数据查询提供hql底层mapreduce 效率高于用Mapreduce进行数据查询 需要装hadoop 或spark mysql适用频繁修改hive适用数据库查询

关联规则基本概念
1.项目 每一个数据样本 一件商品
2.事物 项目的集合 购物车
3.*项集 有意义的项目集合叫项集 面包牛奶搭配经常出现 叫二项集
*参数
4.阀值 支持度高到一定程度才会有观测的意义
5.支持度 项集出现的频繁程

hadoop原理学习笔记 不含命令相关推荐

  1. Golang底层原理学习笔记(一)

    LCY~~Golang底层原理学习笔记 1 源码调试 go源代码地址:GitHub - golang/go: The Go programming language 1.1 源码编译 现在的go语言大 ...

  2. 大数据Hadoop教程-学习笔记01【大数据导论与Linux基础】

    视频教程:哔哩哔哩网站:黑马大数据Hadoop入门视频教程,总时长:14:22:04 教程资源:https://pan.baidu.com/s/1WYgyI3KgbzKzFD639lA-_g,提取码: ...

  3. Java 基础 第3阶段:高级应用——尚硅谷学习笔记(含面试题) 2023年

    Java 基础 第 3 阶段:高级应用--尚硅谷学习笔记(含面试题) 2023 年 Java 基础 第 3 阶段:高级应用--尚硅谷学习笔记(含面试题) 2023 年 第 9 章 异常处理 9.1 异 ...

  4. [编译原理学习笔记2-2] 程序语言的语法描述

    [编译原理学习笔记2-2] 程序语言的语法描述 文章目录 [编译原理学习笔记2-2] 程序语言的语法描述 [2.3.1] 上下文无关文法 [2.3.2] 语法分析树与二义性 [2.3.3] 形式语言鸟 ...

  5. 大数据Hadoop教程-学习笔记02【Apache Hadoop、HDFS】

    视频教程:哔哩哔哩网站:黑马大数据Hadoop入门视频教程 教程资源:https://pan.baidu.com/s/1WYgyI3KgbzKzFD639lA-_g 提取码: 6666 [P001-P ...

  6. MOOC人工智能原理学习笔记1

    人工智能原理学习笔记1 The Foundations of AI: Philosophy Mathematics Economics Neuroscience Psychology Computer ...

  7. 自控原理学习笔记-反馈控制系统的动态模型(4)-频率特性函数Nyquist图及Bode图

    自控原理学习笔记 自控原理学习笔记专栏 文章目录 1.频率特性函数 1.1 图形表示方法: 1.2 零极点位置和暂态增益图 1.2.1 复轨迹曲线 1.2.3 例子 1.3 计算系统响应 2.开环频率 ...

  8. 自控原理学习笔记-系统稳定性分析(2)-环路分析及Nyquist-Bode判据

    自控原理学习笔记 自控原理学习笔记专栏 文章目录 3. 环路分析 3.1环路分析基本思想: 3.2 稳定程度的性能指标(相对稳定) 3.3 环路整形 4.Nyquist判据 4.1 与幅角原理关系 4 ...

  9. 自控原理学习笔记-反馈控制系统的动态模型(1)

    自控原理学习笔记 1.导论 2.反馈控制系统的动态模型(1) 3.反馈控制系统的动态模型(2) 3.反馈控制系统的动态模型(3) 4.反馈控制系统的动态模型(4) 5.反馈控制系统的动态模型(5) 文 ...

最新文章

  1. Hello CNBLOGS
  2. Linux学习之系统编程篇:exec 函数族
  3. C语言入门题-计算到任意日期的总天数
  4. 第五章 MongoDb索引优化 5.6
  5. 【论文复现】使用RCNN进行文本分类
  6. python中的赋值运算符_整理Python中的赋值运算符
  7. 计算机基础ppt_「考前秘笈」2020年3月份计算机二级MS-office考试重点
  8. Centos禁止屏幕虚拟键盘弹出
  9. C# MessageBox用法实例
  10. 华为主题引擎怎么下载_华为搜索引擎app
  11. 线程学习记录-锁原理与对象头
  12. MYSQL数据库报错 1055
  13. 解决雅虎邮箱使用outlook只能收不能发送的问题(针对yahoo.com.cn)
  14. 银行主要业务--负债业务
  15. 【毕业设计】深度学习水果识别系统 - python CNN
  16. Kali从入门到出门-手记
  17. JAVA SE 005——类型转换
  18. 介绍一款功能强大的步进电机控制驱动芯片TMC5240
  19. 创业的捷径!打造黄金人脉!
  20. 计算某年某月的天数问题

热门文章

  1. 这台 2021 新款 iPad 最适合程序员编程!
  2. newFile()一个http绝对路径的文件报文件找不到错误的解决方式
  3. 数学回味系列之7 - 鸡兔同笼问题
  4. 服务器 16路直连 英特尔,16核超猛神U:Intel Xeon D-1587性能测试
  5. [乐意黎原创] 红米1刷MIUI 6 系统
  6. excel单元格斜线_excel表格入门教学(1)斜线的添加与应用
  7. Oracle系统函数
  8. 对搜狐视频弹幕地域黑问题的一次社工经历
  9. java 幂取模_计算一个数与2的n次方取模
  10. Android 实现Json数据解析,并进行应用!