作为一名R语言新手,第一步是要学会对数据进行一个调整与处理。现介绍几种常见对数据框架处理的函数:

使用R语言自带的heightweight数据集:

library(gcookbook)
library(tidyverse)
heightweight

可以看到五列代表每个人的身体信息,这个时候我们可以用str()来查看数据集的结构。

str(heightweight)

这里面可以看到sex为factor因子变量;ageYear,heightIn,weightLb为数值型向量;ageMonth为整型向量;同时还会有character字符型向量。(在画图中,经常要将factor和character相互转化)

调整一:选择需要的变量列(使用函数select())

heightweight%>%select(sex,heightIn)

调整二:对某一变量数据进行排序(arrange())

heightweight%>%arrange(heightIn)    #(数据heightIn从原始状态变为从小到大排序)
heightweight%>%arrange(desc(heightIn))  #(从大到小排序)

从小到大                                                               从大到小

                                        

可以几个变量一起调整

heightweight%>%arrange(desc(heightIn,heightLb)) 

 调整三:筛选掉某变量中的值(filter())

heightweight%>%filter(heightIn>60)  #(筛选出heightIn>60的值)

 heightweight%>%filter(heightIn>60,weightLb>110) #(筛选出heightIn大于60,“且”weightLb大于110的值)

 调整四:添加变化的变量到原始数据中(mutate())

For example:计算weightLb与heightIn的比值,并且将比值数据添加为原始数据的第一列

heightweight%>%mutate(w_h=weightLb/heightIn)%>%
+ select(w_h,everything())

如果你想把比值放在第四列

heightweight%>%mutate(w_h=weightLb/heightIn)%>%
+ select(sex,ageYear,ageMonth,w_h,everything())

数据基本调整函数就这些,关于数据转化,计算,请关注下一次内容。

如果这些内容对你有帮助,请点个赞啦!

R语言—数据的调整与处理相关推荐

  1. 半折预售:新书-R语言数据可视化之美|ggplot2作者推荐

    我本来想等正式发售的时候,再告诉大家我的新书<R语言数据可视化之美>已经出版,奈何新书还太贵,这几天刚好京东有买100减50的活动,所以想想还是赶紧告诉大家吧,不然平时购买的话,太真有点小 ...

  2. R语言数据可视化 ggplot2基础1 ggplot2 图形的分层语法 Layered Grammar 简介

    R语言数据可视化 ggplot2基础1 ggplot2 图形的分层语法 Layered Grammar 简介 分层语法的组成(data-stat-geom-scale-coord-facet) 用分层 ...

  3. r 语言ylim = c(0 1),小白R语言数据可视化进阶练习一

    原标题:小白R语言数据可视化进阶练习一 作者:路遥马亡R语言中文社区专栏作者 知乎ID: https://zhuanlan.zhihu.com/c_135409797 00 布局参数 先介绍一个布局参 ...

  4. R语言数据可视化——图形色彩设计(调色盘)

    R语言数据可视化--图形色彩设计 图形颜色的选择对我们最终图形呈现的效果影响很大,我们需要用到的图形配色也跟随着图形出现的场合而变化,这篇文章整理了前辈们制作的在ggplot包绘制图形时,常常使用的配 ...

  5. 【组队学习】【28期】R语言数据科学

    R语言数据科学 论坛版块: http://datawhale.club/c/team-learning/36-category/36 开源内容: https://github.com/datawhal ...

  6. 推荐:一本“高颜值”的R语言数据可视化图书(包邮送3本)

    文章留言点赞前3名的朋友,每人送1本<R语言数据化可视化之美增强版>,名单揭晓日期为:本周日 (2020年7月12日晚7点).到时,获奖的朋友可以直接添加微信:meta-genomics, ...

  7. R语言数据包自带数据集之ISwR包的melanom数据集字段解释、数据导入实战

    R语言数据包自带数据集之ISwR包的melanom数据集字段解释.数据导入实战 目录 R语言数据包自带数据集之ISwR包的melanom数据集字段解释.数据导入实战 #数据字段说明 #导入包 #导入数 ...

  8. R语言数据包自带数据集之survival包的colon数据集字段解释、数据导入实战

    R语言数据包自带数据集之survival包的colon数据集字段解释.数据导入实战 #数据字段说明 colon数据集:B/C期结肠癌辅助化疗治疗数据 d # 患者编号 study # 所有患者都是1 ...

  9. R语言数据包自带数据集之survival包的lung数据集字段解释、数据导入实战

    R语言数据包自带数据集之survival包的lung数据集字段解释.数据导入实战 目录 R语言数据包自带数据集之survival包的lung数据集字段解释.数据导入实战 #数据字段说明 #导入包 #导 ...

  10. R语言数据包自带数据集之ToothGrowth数据集字段解释、数据导入实战

    R语言数据包自带数据集之ToothGrowth数据集字段解释.数据导入实战 目录 R语言数据包自带数据集之ToothGrowth数据集字段解释.数据导入实战 #数据字段说明 #导入包 #导入数据 #数 ...

最新文章

  1. Python常用函数与技巧总结(一)
  2. es6 Module语法
  3. JavaScript从内容中筛选出手机号码集合
  4. Spring 的优秀工具类盘点
  5. git 提交遇到error:fail to push some refer to 远程地址(url)
  6. 一副眼镜一千多贵吗_成都配眼镜去哪里好一点?怎样配眼镜才不被坑
  7. 建立ssr服务器_如何从零打造一款轻量且天然支持SSR的个人博客系统?
  8. 2020 COCO Keypoint Challenge 冠军之路!
  9. Ant部署测试出错(关键字:Ant NoClassDefFoundError xml-apis/jar)
  10. tum数据集_数值预报尚能战否?来自数据驱动的挑战
  11. CRF++中的unigram和bigram features指定是uni/bigrams的输出标签
  12. Android程序设计报告总结,Android编程常用技巧实例总结
  13. Many to many example - 1 of 4
  14. Android Studio builde.gradle 配置说明
  15. 冰点文库 3.2.14
  16. 学习CNN的比较好的网站
  17. java源码转换e4a_E4A核心代码生成类库工具
  18. 一线大公司面试必备技能
  19. FPGA的NIOS-II开发入门
  20. 录像机中码流类型中定时、事件、网传代表什么意思?

热门文章

  1. WDF驱动开发- CONTEXT和IO QUEUE
  2. 在移动通信中如何测试5G网络?
  3. (三)Lucene中Index.ANALYZED分词相关
  4. beta函数与置信度估计
  5. emlog5.3.1后台暴力破解
  6. 易康(eCognition)对象几何特征--1:几何(Geometry)_范围(Extent)
  7. 解决电脑低俗弹窗广告
  8. npm install报错10054,Error while executing
  9. manjaro安装docker使用
  10. 求两个数的最小公倍数(C语言)