关于孤立点的思考也有一段时间了,但是也没怎想出头绪。
实际的数据中总是有异常点(孤立点)存在,数据的期望,方差
E,V. 而且在作回归分析,主成分分析,聚类分析的时候效果都会
受到孤立点(异常点)的影响。

孤立点的存在是事实,但是我们做统计分析的时候总是想要把他们
从数据中剔出到,来提高统计分析的效果,为什么这样做呢?

这又涉及到了价值观的问题,是多数决定整体还是少数决定整体?
或者说是多数决定趋势,还是少数决定趋势?

从数据中剔出孤立点,是因为我们认为他们不代表整体,反而会对整体
的统计结果造成不好的影响,真的是这样吗?

举个例子:一群收入平均收入是10000的人群,突然来个100B的人,他们
的平均收入会怎么样? 还要看这个人群的数量n了.

如果越南去个盖茨会怎样?

E,V的统计指标都是总体的特征的描述,当然这似乎也能反映出整体的
情况。

但是对于个人而言,或者对某个具体问题而言的意义是多少?
正如"是多数决定整体还是少数决定整体?或者说是多数决定趋势,还是
少数决定趋势?"

教课书上说,是人民创造了历史..................................
但是现在某个人单个创新就可以改变现在的历史........

孤立点是什么, 是与众不同的, 可以是最坏,也可使是最好, 可以是希特勒,
可以使斯大林, 但他们永远是大众水平的.

发现的孤立点, 可能你就发现了机会, 正因为他的异常可以给你带来不同,
当然可以是好的,也可以是坏的......

似乎我更喜欢做个 outlier 这样才能与众不同...

我的意思似乎还没有表达出来, 可能是我文字水平的问题, 也可能是这问题
本身就说不清.

Email: ariszh...@gmail.com    欢迎交流(无论同意 or 反对)

孤立点outlier的意义相关推荐

  1. 数据分析惯用的5种思维方法

    来源:数据分析不是个事儿 在数据分析中,数据分析思维是框架式的指引,实际分析问题时还是需要很多"技巧工具"的.就好比中学里你要解一元二次方式,可以用公式法.配方法.直接开平方法.因 ...

  2. 软件项目管理大作业_信息系统项目管理师该如何备考?

    教材和培训班选择 此考试网上资料多,选择也是因人而异,总时间只有70天,而看书时间更少,因此不可能把教材和各种备考书籍都看完,我的书就这几本:1. 信息系统项目管理师考试试题分类精解(2019)2. ...

  3. 在人工智能领域,人工智能机器无法如人一样理解常识知识

    https://www.toutiao.com/a6664721599637225987/ 在人工智能领域,人工智能机器因为无法如人一样理解常识知识,而使人工智能机器表现出的智能程度极其有限. 因此, ...

  4. jpa和hibernate_JPA和Hibernate级联类型的初学者指南

    jpa和hibernate 介绍 JPA将实体状态转换转换为数据库DML语句. 由于对实体图进行操作很常见,因此JPA允许我们将实体状态更改从父级传播到子级 . 通过CascadeType映射配置此行 ...

  5. 记忆英语单词方法20种

    人们通常认为掌握一门外语要过三关(语音关.词汇关.语法关),斩六将(听.说.读.写.译),相对来说,掌握英语单词是最难过的一关.英语的词汇量大,总词汇量至少在60万以上,实用词汇量为8千至1万,基本词 ...

  6. 5种经典的数据分析思维和方法

    作者:启方 来源:数据分析不是个事儿 在数据分析中,数据分析思维是框架式的指引,实际分析问题时还是需要很多"技巧工具"的.就好比中学里你要解一元二次方式,可以用公式法.配方法.直接 ...

  7. 创业6年,估值$750亿!张一鸣:人才不是核心竞争力,机制才是!

    创业6年,估值$750亿!张一鸣:人才不是核心竞争力,机制才是! 陈思 技术领导力 2019-12-01 导读:短短6年时间里,一个从知春路锦秋家园走出的技术团队,因推出"今日头条" ...

  8. 英语单词记忆方法20种

    人们通常认为掌握一门外语要过三关(语音关.词汇关.语法关),斩五将(听.说.读.写.译),相对来说,掌握英语单词是最难过的一关.英语的词汇量大,总词汇量至少在60万以上,实用词汇量为8千至1万,基本词 ...

  9. 【业务数据分析】——十大常用数据分析方法

    目录 一.数据分析方法 二.营销管理方法论 1.SWOT分析 2.PEST分析 3.4P理论 三.常用数据分析方法论 1.公式拆解 2.对比分析 3.A/Btest 4.象限分析 5.帕累托分析 6. ...

最新文章

  1. 零基础学习Java培训有什么攻略
  2. 某程序员吐槽:回老家被乡镇公务员表哥怼,催他赶紧上岸!表哥月薪3800,而他年包90w!...
  3. linux优化网页加载过程,HTML页面加载和解析流程 介绍
  4. 黑马程序员-异常介绍与处理
  5. Spring-SpringMVC父子容器
  6. 操作系统学习笔记-2.1.4进程通信
  7. NS2相关学习——完成一个新协议(3)
  8. 容器开启数据服务之旅系列(二):Kubernetes如何助力Spark大数据分析 1
  9. 【POJ 3614 Sunscreen】贪心 优先级队列
  10. 盲审不到4分的论文竟中了ICLR 2019??!!ICLR 2019官方这样回应
  11. 从零开始编写深度学习库(一)SoftmaxWithLoss CPU编写
  12. 包括循环和分支的C语言程序,《C语言程序设计》分支和循环的C程序设计.ppt
  13. MariaDB:在Linux下修改编码
  14. lsb算法 java,解决:-bash: lsb_release: command not found办法
  15. 在Mac下配置php开发环境:Apache+php+MySql
  16. postSql insert into 去重
  17. 2018全球50大最佳发明名单
  18. 学3dmax赚钱吗?学3dmax工资怎么样?
  19. Python使用Win32和天行机器人API实现微信自动聊天机器人(自动敷衍机器人)
  20. 学习JS的这些日子——十二月总结

热门文章

  1. boost::hana::mult用法的测试程序
  2. 三种工作室之间有哪些联系?
  3. Blender 新手入门练习1
  4. 午无线电视显示服务器异常咋回事,长虹电视网络设置及异常解释【教程】
  5. 巴菲特经常向年轻人讲述的一个关于精灵的寓言--《The Snow Ball》
  6. SAP Contract合同类型的使用
  7. XP 文件引用了一个不可用的位置
  8. python 人体检测_Python人体肤色检测
  9. 换系统影响计算机名吗,鲁大师卸载会影响系统么
  10. 在Ubuntu18中安装Xen