雇员数据中,教育年限变量原本有10个水平,不长不短很难受,不利于有关统计结果解读。


我希望把它压缩一下,将原来的10个水平重新编码为4个水平。翻译为国内的意思就是,1初中及以下,2高中,3大学,4研究生及以上,这样本身也好理解,统计结果解读更有利。

car包的recode函数在多分类变量重新编码方面优势明显,今天来练习一下。

recode(x,recodes,as.factor.result,levels)

其中:

x为数值向量,字符向量或者factor 变量。

recode为设定重新编码规则的字符串。

as.factor.result为是否输出factor变量。若是则为TRUE,不是为FALSE。

levels为排序向量。指定新的编码分组的顺序(默认是按照分组名称排序)。

recodes参数的值是一个字符串,字符串里面是以分号分隔的编码规则:

recodes=“规则1;规则2…”

每一个编码规则的格式为旧码列表=新码,“旧码列表”部分可用lo代表旧码的最小值(low)、hi代表旧码的最大值(high)。

撰写规则如下:

1)旧码=新码 旧码只有单一数值。例如:“0=NA”表示将0改为NA。

2)旧码向量=新码 多个旧码改为一个新码。例如:“c(7,8,9)=‘high’”,将7,8

car包recode函数多分类变量的重新编码相关推荐

  1. R语言dplyr包recode函数、recode_factor函数数值或因子替换实战

    R语言dplyr包recode函数.recode_factor函数数值或因子替换实战 目录 R语言dplyr包recode函数.recode_factor函数数值或因子替换实战 #导入dplyr包

  2. R语言glmnet包lasso回归中分类变量的处理

    我们在既往文章<手把手教你使用R语言做LASSO 回归>中介绍了glmnet包进行lasso回归,后台不少粉丝发信息向我问到分类变量处理的问题,我后面查了一下资料之前文章分类变量没有处理, ...

  3. R语言基本统计分析方法(包及函数)

    转载自:http://blog.csdn.net/s04023083/article/details/40344273 摘要:目前经典的统计学分析方法主要有回归分析,Logistic回归,决策树,支持 ...

  4. r library car_第三十九讲 R语言-线性回归:自变量中存在分类变量时

    当我们提到"线性"回归时,特指的是因变量(结果变量)为连续性变量,与自变量(预测变量)有线性关系,而对自变量(预测变量)并没有要求一定要是连续性变量.前面我们已经提到,当自变量是连 ...

  5. 分类变量回归: R语言中哑变量编码本质

    本篇描述分类变量如何进行回归(翻译自http://www.sthda.com/english/articles/40-regression-analysis/163-regression-with-c ...

  6. r语言中,如何将分类变量化为虚拟变量

    在 R 中,可以使用 model.matrix 函数将分类变量转换为虚拟变量(也称为 one-hot 编码). 例如,假设你有一个数据框 df,其中包含一列名为 fruit 的分类变量,其取值为 &q ...

  7. 机器学习中的特征工程——分类变量的处理

    出品 | CDA数据分析研究院,转载需授权 文章目录 分类变量 概念 判断 类型 少类别分类变量处理方法 独热编码(One-hot encoding) 虚拟编码(Dummy coding) 效应编码( ...

  8. 特征工程:分类变量的处理方式总结

    1.什么是分类变量? 通常来说,分类变量是用来表示某一属性的类别或标识的.例如:一年中的四季,月份,OS,brand,行业(银行.保险.券商.科技......),地区等等:大型分类变量例如:IP地址, ...

  9. 机器学习——特征工程之分类变量

    机器学习--特征工程之分类变量 前言 分类变量的编码 1.one-hot 编码 2.虚拟编码 3.效果编码 处理大型分类变量 1.特征散列化 2.分箱计数 总结 前言 关于特征工程,已经对空值.数值型 ...

最新文章

  1. 建基小型计算机,建碁AOpenminiITX小型化平台应用(44页)-原创力文档
  2. 驱动开发 - WDK 调试及 SVN 环境搭建[转]
  3. c++异常处理的基本思想
  4. python的flask实现接口_Flask快速实现简单python接口
  5. 打造素质魅力 树立个人威信30条准则
  6. window 显示本机信息的脚本 bat
  7. matlab2c使用c++实现matlab函数系列教程-ceil函数
  8. 北京理工大学c语言课后答案,《北京理工大学C语言教材习题答案》.doc
  9. UDS协议-代码完整性测试
  10. 微信小程序marker官方示例中,模拟器和真机显示不同的原因
  11. 代码大全 服装尺寸图html,最全服装尺码对照表
  12. matlab图论软件包,MATLAB_bgl_toolbox 图论通用工具箱总汇:GraphTheory for St 247万源代码下载- www.pudn.com...
  13. 深度学习速成版01---神经网络
  14. spider for qsbk
  15. 1638_chdir函数的功能
  16. eas之F7专用选择界面设置
  17. 【转载】软件测试行业趋势分析和思考
  18. 工作的驱动力——成就感
  19. 鸿蒙灵儿宠物奔驰法拉利,鄂P66666,从奔驰换成法拉利,车主还有限量版劳斯莱斯,中国只有三台...
  20. 一段关于霸面腾讯的经历以及霸面的技巧跟准备

热门文章

  1. 淘宝无人直播防违规的操作方式
  2. 小米怎么快速回到顶部_小米无线充电宝,149元无线快充,出门不用带数据线,小米9必备...
  3. 【实操版】用户分层,这样做会更合理!
  4. C语言【求最大公约数、最小公倍数】详解
  5. iis发布mvc 遇到的HTTP错误 403.14-Forbidden Web 服务器被配置为不列出此目录的内容.
  6. java计算机毕业设计综合测评系统源码+数据库+系统+lw文档+mybatis+运行部署
  7. word里图片格式为嵌入型时,图片显示不全问题
  8. H5单页面应用(SPA)架构总结
  9. C#OWC11.DLL失敗: 80040154
  10. pd对焦速度_Find X2搭载全新4PD对焦技术 白天夜景一样轻松