R语言—数据的调整与处理
作为一名R语言新手,第一步是要学会对数据进行一个调整与处理。现介绍几种常见对数据框架处理的函数:
使用R语言自带的heightweight数据集:
library(gcookbook)
library(tidyverse)
heightweight
可以看到五列代表每个人的身体信息,这个时候我们可以用str()来查看数据集的结构。
str(heightweight)
这里面可以看到sex为factor因子变量;ageYear,heightIn,weightLb为数值型向量;ageMonth为整型向量;同时还会有character字符型向量。(在画图中,经常要将factor和character相互转化)
调整一:选择需要的变量列(使用函数select())
heightweight%>%select(sex,heightIn)
调整二:对某一变量数据进行排序(arrange())
heightweight%>%arrange(heightIn) #(数据heightIn从原始状态变为从小到大排序)
heightweight%>%arrange(desc(heightIn)) #(从大到小排序)
从小到大 从大到小
可以几个变量一起调整
heightweight%>%arrange(desc(heightIn,heightLb))
调整三:筛选掉某变量中的值(filter())
heightweight%>%filter(heightIn>60) #(筛选出heightIn>60的值)
heightweight%>%filter(heightIn>60,weightLb>110) #(筛选出heightIn大于60,“且”weightLb大于110的值)
调整四:添加变化的变量到原始数据中(mutate())
For example:计算weightLb与heightIn的比值,并且将比值数据添加为原始数据的第一列
heightweight%>%mutate(w_h=weightLb/heightIn)%>%
+ select(w_h,everything())
如果你想把比值放在第四列
heightweight%>%mutate(w_h=weightLb/heightIn)%>%
+ select(sex,ageYear,ageMonth,w_h,everything())
数据基本调整函数就这些,关于数据转化,计算,请关注下一次内容。
如果这些内容对你有帮助,请点个赞啦!
R语言—数据的调整与处理相关推荐
- 半折预售:新书-R语言数据可视化之美|ggplot2作者推荐
我本来想等正式发售的时候,再告诉大家我的新书<R语言数据可视化之美>已经出版,奈何新书还太贵,这几天刚好京东有买100减50的活动,所以想想还是赶紧告诉大家吧,不然平时购买的话,太真有点小 ...
- R语言数据可视化 ggplot2基础1 ggplot2 图形的分层语法 Layered Grammar 简介
R语言数据可视化 ggplot2基础1 ggplot2 图形的分层语法 Layered Grammar 简介 分层语法的组成(data-stat-geom-scale-coord-facet) 用分层 ...
- r 语言ylim = c(0 1),小白R语言数据可视化进阶练习一
原标题:小白R语言数据可视化进阶练习一 作者:路遥马亡R语言中文社区专栏作者 知乎ID: https://zhuanlan.zhihu.com/c_135409797 00 布局参数 先介绍一个布局参 ...
- R语言数据可视化——图形色彩设计(调色盘)
R语言数据可视化--图形色彩设计 图形颜色的选择对我们最终图形呈现的效果影响很大,我们需要用到的图形配色也跟随着图形出现的场合而变化,这篇文章整理了前辈们制作的在ggplot包绘制图形时,常常使用的配 ...
- 【组队学习】【28期】R语言数据科学
R语言数据科学 论坛版块: http://datawhale.club/c/team-learning/36-category/36 开源内容: https://github.com/datawhal ...
- 推荐:一本“高颜值”的R语言数据可视化图书(包邮送3本)
文章留言点赞前3名的朋友,每人送1本<R语言数据化可视化之美增强版>,名单揭晓日期为:本周日 (2020年7月12日晚7点).到时,获奖的朋友可以直接添加微信:meta-genomics, ...
- R语言数据包自带数据集之ISwR包的melanom数据集字段解释、数据导入实战
R语言数据包自带数据集之ISwR包的melanom数据集字段解释.数据导入实战 目录 R语言数据包自带数据集之ISwR包的melanom数据集字段解释.数据导入实战 #数据字段说明 #导入包 #导入数 ...
- R语言数据包自带数据集之survival包的colon数据集字段解释、数据导入实战
R语言数据包自带数据集之survival包的colon数据集字段解释.数据导入实战 #数据字段说明 colon数据集:B/C期结肠癌辅助化疗治疗数据 d # 患者编号 study # 所有患者都是1 ...
- R语言数据包自带数据集之survival包的lung数据集字段解释、数据导入实战
R语言数据包自带数据集之survival包的lung数据集字段解释.数据导入实战 目录 R语言数据包自带数据集之survival包的lung数据集字段解释.数据导入实战 #数据字段说明 #导入包 #导 ...
- R语言数据包自带数据集之ToothGrowth数据集字段解释、数据导入实战
R语言数据包自带数据集之ToothGrowth数据集字段解释.数据导入实战 目录 R语言数据包自带数据集之ToothGrowth数据集字段解释.数据导入实战 #数据字段说明 #导入包 #导入数据 #数 ...
最新文章
- Python常用函数与技巧总结(一)
- es6 Module语法
- JavaScript从内容中筛选出手机号码集合
- Spring 的优秀工具类盘点
- git 提交遇到error:fail to push some refer to 远程地址(url)
- 一副眼镜一千多贵吗_成都配眼镜去哪里好一点?怎样配眼镜才不被坑
- 建立ssr服务器_如何从零打造一款轻量且天然支持SSR的个人博客系统?
- 2020 COCO Keypoint Challenge 冠军之路!
- Ant部署测试出错(关键字:Ant NoClassDefFoundError xml-apis/jar)
- tum数据集_数值预报尚能战否?来自数据驱动的挑战
- CRF++中的unigram和bigram features指定是uni/bigrams的输出标签
- Android程序设计报告总结,Android编程常用技巧实例总结
- Many to many example - 1 of 4
- Android Studio builde.gradle 配置说明
- 冰点文库 3.2.14
- 学习CNN的比较好的网站
- java源码转换e4a_E4A核心代码生成类库工具
- 一线大公司面试必备技能
- FPGA的NIOS-II开发入门
- 录像机中码流类型中定时、事件、网传代表什么意思?