1.CRAN任务视图

CRAN提供了任务视图,https://cran.r-project.org/web/views/,将所有R程序包按照不同的处理任务组织起来。与数据挖掘相关的几个任务视图是:

  • 机器学习和统计学习
  • 聚类分析与有限混合模型
  • 时间序列分析
  • 多元统计
  • 空间数据分析
2.R Reference Card for Data Mining
它提供了一套完整的用于数据挖掘的R程序包和函数的索引,并根据功能进行分类。最新版可以从这里下载 :https://cran.r-project.org/doc/contrib/YanchangZhao-refcard-data-mining.pdf
3.常用的内置数据集
①iris数据集
包含3种不同类型的鸢尾花,每种有50个样本,共150个样本。包含5个属性:
> str(iris)
'data.frame': 150 obs. of  5 variables:$ Sepal.Length: num  5.1 4.9 4.7 4.6 5 5.4 4.6 5 4.4 4.9 ...$ Sepal.Width : num  3.5 3 3.2 3.1 3.6 3.9 3.4 3.4 2.9 3.1 ...$ Petal.Length: num  1.4 1.4 1.3 1.5 1.4 1.7 1.4 1.5 1.4 1.5 ...$ Petal.Width : num  0.2 0.2 0.2 0.2 0.2 0.4 0.3 0.2 0.2 0.1 ...$ Species     : Factor w/ 3 levels "setosa","versicolor",..: 1 1 1 1 1 1 1 1 1 1 ...

Sepal.Length  花萼长度
Sepal.Width  花萼宽度
Petal.Length 花瓣长度
Petal.Width  花瓣宽度
Species     种类。(离散型变量)

②Bodyfat数据集
由TH.data包提供。71行,10列(数值型),每行代表一个客户信息。
> #install.packages('mboost')
> library(TH.data)
> data("bodyfat",package = "TH.data")
> str(bodyfat)
'data.frame': 71 obs. of  10 variables:$ age         : num  57 65 59 58 60 61 56 60 58 62 ...$ DEXfat      : num  41.7 43.3 35.4 22.8 36.4 ...$ waistcirc   : num  100 99.5 96 72 89.5 83.5 81 89 80 79 ...$ hipcirc     : num  112 116.5 108.5 96.5 100.5 ...$ elbowbreadth: num  7.1 6.5 6.2 6.1 7.1 6.5 6.9 6.2 6.4 7 ...$ kneebreadth : num  9.4 8.9 8.9 9.2 10 8.8 8.9 8.5 8.8 8.8 ...$ anthro3a    : num  4.42 4.63 4.12 4.03 4.24 3.55 4.14 4.04 3.91 3.66 ...$ anthro3b    : num  4.95 5.01 4.74 4.48 4.68 4.06 4.52 4.7 4.32 4.21 ...$ anthro3c    : num  4.5 4.48 4.6 3.91 4.15 3.64 4.31 4.47 3.47 3.6 ...$ anthro4     : num  6.13 6.37 5.82 5.66 5.91 5.14 5.69 5.7 5.49 5.25 ...

age         年龄
DEXfat      以DXA计算的体脂重,响应变量
waistcirc   腰围
hipcirc     臀围
elbowbreadth   肘宽
kneebreadth   膝宽
anthro3a    三项人体测量的对数和
anthro3b    三项人体测量的对数和
anthro3c    三项人体测量的对数和
anthro4     三项人体测量的对数和

R语言数据挖掘常用资源相关推荐

  1. 【R语言】常用的R语言数据挖掘包

    常用的R语言数据挖掘包 与Python相比,R语言的很多算法分别会有不同的作者实现,而每个人有不同的实现方式,所以会产生大量的package.因此,学习R语言需要广泛了解与所研究问题相关的包,这样就比 ...

  2. 独家 | 手把手教你学习R语言(附资源链接)

    作者:NSS 翻译:杨金鸿 术语校对:韩海畴 全文校对:林亦霖 本文约3000字,建议阅读7分钟. 本文为带大家了解R语言以及分段式的步骤教程! 人们学习R语言时普遍存在缺乏系统学习方法的问题.学习者 ...

  3. 超级干货 :手把手教你学习R语言(附资源链接)

    作者:NSS:翻译:杨金鸿:校对:韩海畴,林亦霖: 本文约3000字,建议阅读7分钟. 本文为带大家了解R语言以及分段式的步骤教程! 人们学习R语言时普遍存在缺乏系统学习方法的问题.学习者不知道从哪开 ...

  4. R语言数据挖掘实战系列(4)

    R语言数据挖掘实战系列(4)--数据预处理 数据预处理一方面是要提高数据的质量,另一方面是要让数据更好地适应特定的挖掘技术或工具.数据预处理的主要内容包括数据清洗.数据集成.数据变换和数据规约. 一. ...

  5. R语言数据挖掘(关联规则、聚类算法等)——美国黑色星期五

    R语言数据挖掘(关联规则.聚类算法等) 实验内容和步骤: 数据概览 产品分析 性别统计 畅销品 年龄统计 城市居住时间分析 查找顶级消费者 关联规则分析 聚类 实验内容和步骤: 一. 实验内容: 对原 ...

  6. 《R语言数据挖掘》----1.12 数据集成

    本节书摘来自华章出版社<R语言数据挖掘>一书中的第1章,第1.12节,作者[哈萨克斯坦]贝特·麦克哈贝尔(Bater Makhabel),李洪成 许金炜 段力辉 译,更多章节内容可以访问云 ...

  7. 《R语言数据挖掘:实用项目解析》——第2章,第2.9节无参数方法

    本节书摘来自华章出版社<R语言数据挖掘:实用项目解析>一书中的第2章,第2.9节无参数方法,作者[印度]普拉迪帕塔·米什拉(Pradeepta Mishra),更多章节内容可以访问云栖社区 ...

  8. 《R语言数据挖掘》----1.15 结果可视化

    本节书摘来自华章出版社<R语言数据挖掘>一书中的第1章,第1.15节,作者[哈萨克斯坦]贝特·麦克哈贝尔(Bater Makhabel),李洪成 许金炜 段力辉 译,更多章节内容可以访问云 ...

  9. 《R语言数据挖掘:实用项目解析》——1.11 apply原理

    本节书摘来自华章计算机<R语言数据挖掘:实用项目解析>一书中的第1章,第1.11节,作者[印度]普拉迪帕塔·米什拉(Pradeepta Mishra),译 黄芸,更多章节内容可以访问云栖社 ...

最新文章

  1. pythonide机制_强化vim打造python的IDE
  2. canvas画布 带箭头的虚线_娇小女生只能走可爱风?No!带你解锁别样的高级穿搭法则...
  3. 编辑器之神VIM入门
  4. sqlserver垮库查询_SQLServer跨库查询--分布式查询
  5. Flutter 随机颜色 颜色处理工具类
  6. Linux服务器安装JavaWeb环境(二) Redis,MySql,Zookeeper,Keepalive
  7. Express入门 模板引擎hbs 服务端渲染
  8. 应用内广告帮助乐易实现收入+玩家时长双丰收
  9. CF-697B Barnicle与691C Exponential notation
  10. Linux静态库、动态库的制作
  11. Mac怎么合并文件夹
  12. 成渝城市群数据(空气质量、地图矢量、面板数据等)
  13. wim工具扫描linux磁盘,install.wim怎么提取 install.wim文件在哪里
  14. 网页实现从数据库读取数据并简单分页
  15. Linux中编写Shell脚本
  16. 如何使用Arduino制作摩尔斯电报翻译器
  17. Leetcode 606: 根据二叉树建立字符串
  18. 《定投十年财务自由》书中精髓:我们如何通过定投获得更高的收益?
  19. 上海无居住证120积分随迁子女如何求学(中考)
  20. python计算macd指标

热门文章

  1. 连接公共WiFi时无法弹出验证登录界面
  2. 玲珑杯 1164 - 战舰萝莉 线段树水题
  3. 装饰百强第一名金螳螂的信息化办公秘籍
  4. tess4j linux so文件,linux上安装tess4j项目
  5. firebase 云推送_使用Firebase云消息传递在Android中推送通知
  6. java毕业设计流浪动物的救助管理平台源码+lw文档+mybatis+系统+mysql数据库+调试
  7. matlab循环读取文件
  8. 机械结构件的结构要素和设计方法
  9. 透明度叠加算法:如何计算半透明像素叠加到另一个像素上的实际可见像素值(附 WPF 和 HLSL 的实现)
  10. 数据的偏度和峰度——df.skew()、df.kurt()