补充一下其他大佬的回答。我自己是学经济的,所以从这个角度提供一点建议:

1.根据定义删除:某个指标(比如企业生存年限),那数值跟你定义严重冲突的时候(例如企业生存年限为负数),在排除数据本身的问题的情况下,不管有多少都是异常值,采取全部删除或者使用其他方法修正。

2. 根据辅助标准(或者专业范围内的通用标准)删除:例如有篇文章认为某数据库某指标具有5%的异常值,并且给出了相关的依据,那这个就可以作为辅助标准(相应的如果你是同样的操作得到的异常值大大超出5%,那可能就是有其他问题,需要及时回头自查)。而在缺乏依据的情况下随意判定异常值并进行缩尾等处理,则有可能被认为有操纵数据的嫌疑。

当题主你的提问结合到具体的研究主题时,可能执着于异常值“比例”是无意义的,很多时候没有办法判断你这个“异常值”的比例是不是“正常”(例如某些数据库某些年份的数据质量就是很差,在使用过程中会发现大量的异常值)。所以更多的时候我们可能考虑的是在尽量减少对数据的“人工修补”的情况下通过合并其他数据库,利用历史数据均值等方式来减小异常值带来的影响,这一点楼上有写,这几种都是常用的方法。

希望对你有帮助。

python剔除异常值的方法_异常值如何剔除?相关推荐

  1. python计算时间差的方法_如何计算时间差,用Python算法的话

    这篇文章主要介绍了python计算时间差的方法,实例分析了Python时间操作的相关模块与技巧,需要的朋友可以参考下 本文实例讲述了python计算时间差的方法.分享给大家供大家参考.具体分析如下: ...

  2. python函数的使用方法_百度资讯搜索_python函数的使用方法

    金生水起程序猿 2020年11月22日 11:23函数语法格式及调用参数:默认值.元组和字典可变参数的使用全局变量和局部变量作用域,局部变量如何升级为全局变量函数是可重复使用的,实现单一功能的代码块. ...

  3. python method与function方法_学编程这么久,还傻傻分不清什么是方法(method),什么是函数(function)?...

    在编程语言中有两个很基础的概念,即方法(method)和函数(function).如果达到了编程初级/入门级水平,那么你肯定在心中已有了初步的答案. 也许在你心中已有答案了 除去入参.返回值.匿名函数 ...

  4. python xpath定位元素方法_二、appium+python xpath、android_uiautomator定位元素的方法

    1.继承webdriver的几个常见的定位方法 a.find_element_by_id("id") b.find_element_by_name() #text值,appium ...

  5. python小甲鱼安装方法_【Python】easygui小甲鱼

    翻译改编自官方文档:http://easygui.sourceforge.net/tutorial/index.html 翻译改编者:小甲鱼,本文欢迎转载,转载请保证原文的完整性! 演示使用 Pyth ...

  6. python中hashmap的方法_如何为Java的HashMap模拟Python的dict的“ items(...

    我知道我应该学习如何使用Java进行高效编程,而不再认为它是Python.但是问题在于,这种事情在Java中变成了一场噩梦. 我在Python中具有以下函数,该函数将字符串作为参数: def deco ...

  7. python安卓自动化实现方法_带你用 Python 实现自动化群控(入门篇)

    原标题:带你用 Python 实现自动化群控(入门篇) 来自公众号: AirPython 1. 前言 群控,相信大部分人都不会陌生!印象里是一台电脑控制多台设备完成一系列的操作,更多的人喜欢把它和 H ...

  8. python打包安卓的方法_打包发布Python模块的方法详解

    前言 昨天把自己的VASP文件处理库进行了打包并上传到PyPI,现在可以直接通过pip和easy_install来安装VASPy啦(同时欢迎使用VASP做计算化学的童鞋们加星和参与进来), 由于自己的 ...

  9. python计算文件大小的方法_使用Python计算目录的大小?

    拉丁的传说 这将遍历所有子目录; 汇总文件大小:import osdef get_size(start_path = '.'):    total_size = 0    for dirpath, d ...

最新文章

  1. Numpy入门教程:12. 线性代数
  2. 利用HTML5开发Android
  3. android将被代替的控件,Android 控件被忽略的属性
  4. python 合并排序的数组
  5. 再度吐槽,PHP在centos7的安装方式稍不注意可能就打击你的积极性
  6. php smarty分页原理,SMARTY分页详解
  7. Nginx笔记-反向代理中配置WebSocket及设置超时
  8. 如何选指数基金?何时买入指数基金?长投温度如何计算?
  9. k8s核心技术-Pod(概念和存在意义)_Pod多进程设计_Pause根容器---K8S_Google工作笔记0020
  10. 云计算学习笔记003---Hadoop简介,hadoop实现原理,NoSQL介绍...与传统关系型数据库对应关系,云计算面临的挑战
  11. 【操作系统】进程的异步性
  12. QueueUserWorkItem函数
  13. 在代码中将CAD图形转换为PDF!Aspose.CAD轻松搞定
  14. 【CC2530入门教程-05】CC2530的串行接口原理与应用
  15. Windows操作系统注册表registry
  16. 企业邮箱注册—企业微信邮箱2.0时代正式来临!
  17. 建立积分兑换商城的意义
  18. R语言进行Box-Cox变换
  19. Nginx 性能优化 Gzip 压缩配置
  20. JOL探索synchronized锁-子路老师

热门文章

  1. 关于用户角色权限的一点想法(1)
  2. 千万级别高并发秒杀架构设计
  3. 毒鸡汤+舔狗语录+社会语录3合1网站源码
  4. 从子类化到Typeclass
  5. 做女人,真好!一个男程序员的妇女节真实感悟
  6. 想入行 AI,别让那些技术培训坑了你...
  7. 相比谷歌微软,苹果今年的WWDC可能有些凉凉
  8. 小程序制作海报,保存本地
  9. 读书记录四之《皮囊》
  10. 2013-BIT程序设计 14.古罗马的加法