数据挖掘学习07 - 《数据挖掘导论》第二章:数据
- 数据类型
- 数据质量
- 数据预处理
- 相似度测量
- 名称(Noimal):仅仅只是名称,用来区分不同记录,一一对应,如ID
- 有序(Ordinal):可以理解为计算机语言中枚举类型,有序,有限
- 区间(Interval):数字区域,主要用于加减运算,如时间,日期
- 比例(Radio):计算比例,主要用于乘除运算。
- 记录:类似表格,矩阵
- 图:节点和关联组成的数据,典型的例子是网页和网页中的连接。图论。
- 时序:按时间排列,带有时间属性的数据集。
- 聚合(Aggregation):将分散的数据聚合成一起,减少数据量,如统计商品的销售额,可以讲流水中每一笔的销售情况按照天,月的方式合并起来,这样可以大大介绍数据量。
- 采样(Sampling):统计学得方法,采样的最大好处是可以大大减少数据集大小,但是关键点是如何以最小的样本数来获得最具代表的样本集。一般方法有随机采样,或根据权重采样。
- 降维(Dimensionaity Reducetion):线性代数的方法--PCA(主成分分析)和SVD(奇异值分解)
- 选取子属性集(Feature Subset Selection):选取问题最相关的属性,去掉无用属性,如ID
- 创造属性:傅里叶分析
- 离散化和二进制化:运用熵,离散化连续的值
- 变量转换:函数,规范化,标准化
数据挖掘学习07 - 《数据挖掘导论》第二章:数据相关推荐
- 软考网络管理员学习笔记2之第二章数据通信基础
第二章.数据通信基础 1.奈奎斯特定理与香农理论 [考法分析] 奈奎斯特定理是理想情况下,求数据速率 香农理论是在受到噪声干扰后,求数据速率 [要点分析] 看题目中是否提及到噪声或信噪比等关键词 如果 ...
- 计算机科学导论第二章,计算机科学导论第二章.doc
计算机科学导论第二章.doc (2页) 本资源提供全文预览,点击全文预览即可全文预览,如果喜欢文档就下载吧,查找使用更方便哦! 3.9 积分 第二次作业 2.1 数值数据1. 计算机只识别二进制编 ...
- 计算机导论重写算法,计算机导论第二章.ppt
<计算机导论第二章.ppt>由会员分享,可在线阅读,更多相关<计算机导论第二章.ppt(66页珍藏版)>请在人人文库网上搜索. 1.1.第二章计算机系统的组成2.1四个功能部件 ...
- 统计机器学习导论第二章答案
R语言学习笔记 统计机器学习导论第二章部分习题 文章目录 R语言学习笔记 一.8题 8. This exercise relates to the College data set, which ca ...
- 计算机导论免费阅读 小说,计算机导论第二章.ppt
计算机导论第二章.ppt (66页) 本资源提供全文预览,点击全文预览即可全文预览,如果喜欢文档就下载吧,查找使用更方便哦! 19.90 积分 第二章 计算机系统的组成 2.1 四大功能部件 2.2 ...
- ASP.NET3.5 企业级项目开发 -- 第二章 数据访问层(DAL)的开发
为什么80%的码农都做不了架构师?>>> ASP.NET3.5 企业级项目开发 -- 第二章 数据访问层(DAL)的开发 前言:本篇主要讲述数据访问层的开发, ...
- 第二章 数据的表示和运算 2.1.2 BCD码 [计算机组成原理笔记]
第二章 数据的表示和运算 2.1.2 BCD码 本笔记参考书目: 计算机组成原理(第六版.立体化教材)白中英.戴志涛 2021王道计算机组成原理视频公开课 本节重点: 8421/2421/余3码 转载 ...
- 计算机组成原理第二章数据,计算机组成原理第二章数据在计算机中的表示
计算机组成原理第二章数据在计算机中的表示 (91页) 本资源提供全文预览,点击全文预览即可全文预览,如果喜欢文档就下载吧,查找使用更方便哦! 14.90 积分 第二章 数据在计算机中的表示 n 概述 ...
- 信息学奥赛一本通(C++版)第二部分 基础算法 第二章 数据排序
第二章 数据排序 T1310 : 车厢重组 时间限制: 1000 ms 内存限制: 65536 KB [题目描述] 在一个旧式的火车站旁边有一座桥,其桥面可以绕河中心的桥墩水平旋转.一个车站的职工 ...
- 第二章 数据的表示和运算 2.1.6 循环冗余校验码/CRC码 [计算机组成原理笔记]
第二章 数据的表示和运算 2.1.6 循环冗余校验码/CRC码 本笔记参考书目: 计算机组成原理(第六版.立体化教材)白中英.戴志涛 2021王道计算机组成原理视频公开课 本节重点: 循环冗余校验码/ ...
最新文章
- js在线压缩工具 支持Base62 encode 和 Shrink variables
- Blockchain技术之区块链的应用领域——智能合约
- PHP如何添加变量 $_SERVER
- java mysql 异步查询数据库_java 异步操作数据库
- Launcher结构之home screen
- 在MATLAB R2020a中设置m文件的字体大小
- Oracle触发器5-Instead of触发器
- OpenSSL历史版本整理
- 步步为营 .NET 代码重构学习笔记 十四
- 欠采样临界采样matlab,信号临界采样、过采样、欠采样实验报告.doc
- 量子计算机原理 纠缠,白话量子计算机原理【前面的那个有错误,重新理清了一下思路】...
- WinPE (老毛桃最终修改版) V09.11 硬盘安装操作系统详细图解
- 算数-02-史丰收算法
- 游戏挂机还开着电脑?那就真的out了!
- PS 如何制作Vista的毛玻璃效果
- 作为SLAM中最常用的闭环检测方法,视觉词袋模型技术详解来了
- PHP上传文件大小限制大全
- 汉语属于哪个语系_汉语,日语,韩语分别属于什么语系?
- Office Tool Plus 下载使用 365 2021/2019等版本
- Android集成bilibili播放器以及弹幕
热门文章
- relu函数_激活函数解析:Sigmoid, tanh, Softmax, ReLU, Leaky ReLU
- ioinic 怎样配置 android sdk,NiceFish-ionic: 这是一个移动端项目,示范Angular移动端组件库Ionic的基本用法,基于Ioinic 2.0,已支持PWA。...
- yum mysql 无法启动失败_Linux下MySQL数据库yum升级后无法启动解决办法
- c语言 intptr_t
- chmod命令的用法
- Android报错:IllegalStateException: The specified child already has a parent问题解决办法
- Futter基础第13篇: 实现Drawer侧边栏、以及侧边栏内容布局
- ecshop实现弹出登录框
- java基础 内部类详解
- GeoServer地图开发解决方案(二):地图数据处理篇