缩尾处理

如果样本量很大的时候,为了防止异常值对研究结果的影响,通常对连续变量进行缩尾处理。缩尾处理的思想:将超出变量特定百分位范围的数值替换为其特定百分位数值的方法
对于离群值的处理有取对数和缩尾处理(暂时接触到的两种),都是为了让数据更平滑、稳定。

均值和中位数的差异检验

实证分析中,经常需要对比多个变量在两个子样本组中的均值或者中位数是否存在显著差异。

我们选取的是在99%的置信水平下(1%的显著性水平下),用P值来决定是否显著。
在stata中来计算

*-在1%水平上下进行缩尾处理
winsor2  var1 var2 var3 , cuts(1 99) replace *-ttest:单个变量组间均值差异检验(独立样本)
ttest Debt_cost, by(Oversea_CEO) unequal level(99)*-median:单个变量组间中位数差异检验
*-通过exact选项计算Fisher's exact test方法下的显著性水平
median Debt_cost, by(Oversea_CEO) exact

缩尾处理、均值和中位数的差异检验相关推荐

  1. Stata:多个变量组间均值\中位数差异检验

    2019暑期Stata现场班,7.17-26日,北京,连玉君+刘瑞明 主讲     作者:韩少真(西北大学) || 刘婉青(西北大学) Stata 连享会: 知乎 | 简书 | 码云 | CSDN   ...

  2. 集中趋势中均值、中位数、众数以及偏态分布、偏度和峰度计算相关

    1 案例:计算出下面数据中的均值.众数.中位数 超市一天收款账单的金额分别为: ​ 21,100,30,25,26,27,26,10 均值:33.125 众数:26 中位数:26 计算有限个数的数据的 ...

  3. R语言plotly可视化:plotly可视化箱图、基于预先计算好的分位数、均值、中位数等统计指标可视化箱图、箱图中添加缺口、可视化均值和标准差(With Precomputed Quartiles)

    R语言plotly可视化:plotly可视化箱图.基于预先计算好的分位数.均值.中位数等统计指标可视化箱图.箱图中添加缺口.可视化均值和标准差(Box Plot With Precomputed Qu ...

  4. R语言使用ggplot2包使用geom_violin函数绘制分组小提琴图(配置显示均值、中位数)实战

    R语言使用ggplot2包使用geom_violin函数绘制分组小提琴图(配置显示均值.中位数)实战 目录

  5. seaborn使用boxplot函数可视化箱图并基于分组均值或者中位数进行箱图降序(descending)排序(Sort Boxplots in Descending Order)

    seaborn使用boxplot函数可视化箱图并基于分组均值或者中位数进行箱图降序(descending)排序(Sort Boxplots in Descending Order with Pytho ...

  6. R语言使用ggplot2包使用geom_dotplot函数绘制分组点图(添加均值、中位数)实战(dot plot)

    R语言使用ggplot2包使用geom_dotplot函数绘制分组点图(添加均值.中位数)实战(dot plot) 目录 R语言使用ggplot2包使用geom_dotplot函数绘制分组点图(添加均 ...

  7. R语言使用ggplot2包geom_jitter()函数绘制分组(strip plot,一维散点图)带状图(添加均值、中位数)实战

    R语言使用ggplot2包geom_jitter()函数绘制分组(strip plot,一维散点图)带状图(添加均值.中位数)实战 目录 R语言使用ggplot2包geom_jitter()函数绘制分 ...

  8. R语言dplyr包获取dataframe分组聚合汇总统计值实战(group_by() and summarize() ):均值、中位数、分位数、IQR、MAD、count、unique

    R语言dplyr包获取dataframe分组聚合汇总统计值实战(group_by() and summarize() ):均值.中位数.分位数.IQR.MAD.count.unique 目录

  9. R语言colSums函数、rowSums函数、colMeans函数、rowMeans函数、colMedians函数、rowMedians计算dataframe行或者列的加和、均值、中位数实战

    R语言colSums函数.rowSums函数.colMeans函数.rowMeans函数.colMedians函数.rowMedians计算dataframe行或者列的加和.均值.中位数实战 目录

最新文章

  1. 【Ubuntu】ping: unknown host www.baidu.com
  2. mysql 必须掌握的工具pt-query-digest安装
  3. go不使用工具包将大写字符转成小写字符的方法
  4. 无障碍开发(六)之ARIA在HTML中的使用规则
  5. 初见shell,设置端口参数
  6. 维监控利器Nagios:概念、结构和功能
  7. 使用tinylog 1.1改进您在Java EE应用程序中的登录
  8. 得益于数据中心芯片业务提升,AMD公司财务表现令投资者欣喜
  9. Ubuntu13.04安装OpenCV2.4.5
  10. 基于JAVA开发的在线双人联机坦克大战小游戏
  11. 怎样把PDF文件压缩变小?
  12. 高速信号线PCB走线中的阻抗匹配
  13. [BZOJ2298]problem a
  14. 传到Action后BLH层中文乱码问题
  15. 关于文件not found 的几个常见排查点的总结
  16. 使用NOWSMS搭建自己的彩信中心
  17. 交通产业百年变局:从运力时代到算力时代
  18. java web搜索引擎优化_搜索引擎优化(SEO)与网站开发优化
  19. AES加密有什么用,AES加密算法安全性如何
  20. 分享一些 Mac 上非常好用的工具软件

热门文章

  1. 【微信小程序】基于百度大脑人体检测、人脸识别以及调用阿里垃圾分类识别小程序利用canvas完成人脸画图、分割手部部分图片算法
  2. 一个优秀的职场人必须知道的四点建议
  3. 跟着团子学SAP PS:增补订单及分配订单
  4. css height 100% 和 100vh 区别
  5. centos7配置mysql主从数据库
  6. modbus通讯协议详解(转载)
  7. 免费馅饼 (动态规划)
  8. 快排——Java实现快速排序代码
  9. uel表达式 字符串截取_activiti工作流引擎之uel表达式
  10. 「Python数据分析系列」6. 概率论基础介绍