图形化

饼状图:将数据划分为明显的几个组,对基本比例进行比较时有效,但比例接近时不宜使用。

条形图:精确显示频数,长度表示数值;当为类别型数据时使用;描述名字较长时,可以用横向条形图;多个条件时,可以用分段条形图或堆积条形图。

直方图:面积表示频数,长方形之间没哟间隔;当为数值型数据时使用。

折线图:显示趋势,添加多个对比组容易,只用于数值型数据;相比条形图,没那么精确直观。

平均数

数据偏斜:异常值位于右边,叫向右偏斜,尾巴在右边。

均值:当有异常值时,会使典型值不处于数据集中区。右偏时均值变高,位于中位数右边。均值对于抽样数据更稳定。

中位数:当个数为偶数时,会出现上面的问题。对称型数据,中位数和均值相等。概率密度函数等于0.5时对应的X为中位数。

众数:当众数很多时,失效。概率密度函数的最高点对应的X为众数。

方差、标准差、标准分(均值和方差不同时比较两个数据集)

去除异常值:四分位距

概率分布

几何分布:为成功一次需要多少次试验的概率。
二项分布:在n次试验的成功次数的概率。
泊松分布:给定区间事件发生次数的概率。
泊松分布近似二项分布的条件:n很大>5,p很小<0.1,λ=np(当n很大时二项分布很难计算,因此需要近似)。
以上都是离散数据的概率分布。
正太分布近似二项分布的条件:np>5,npq>5,同时需要连续性修正,即正太取X<n-0.5代替二项X<n。
正太分布近似泊松分布的条件:λ>15。

抽样统计

计算方差时除n是估计样本数据的样本方差,除n-1是用样本数据估计总体方差。因为总体方差比样本方差大。
比例的抽样分布:用该分布求出某一特定样本的比例的发生概率。
均值的抽样分布:计算样本均值的概率。
小样本估计总体方差用t分布,大样本用正太分布。

假设检验

原假设、备择假设(原假设不正确时的假设)。
X2分布用于检验观测频数和期望频数的差异程度(1检验给定数据与指定分布的吻合程度,2两个变量的独立性)。

《深入浅出统计学》总结相关推荐

  1. STL源码剖析学习七:stack和queue

    STL源码剖析学习七:stack和queue stack是一种先进后出的数据结构,只有一个出口. 允许新增.删除.获取最顶端的元素,没有任何办法可以存取其他元素,不允许有遍历行为. 缺省情况下用deq ...

  2. 《STL源码剖析》学习-- 1.9-- 可能令你困惑的C++语法1

    最近在看侯捷的<STL源码剖析>,虽然感觉自己c++看得比较深一点,还是感觉还多东西不是那么明白,这里将一些细小的东西或者概念记录一下. 有些东西是根据<C++编程思想>理解的 ...

  3. 《STL源码剖析》学习--6章--_rotate算法分析

     最近在看侯捷的<STL源码剖析>,其中有许多不太明白之处,后经分析或查找资料有了些理解,现记录一下. <STL源码剖析>学习--6章--random access ite ...

  4. 《STL源码剖析》学习--6章--power算法分析

    最近在看侯捷的<STL源码剖析>,其中有许多不太明白之处,后经分析或查找资料有了些理解,现记录一下. 6章--power算法分析 书本中的算法如下所示: template <clas ...

  5. STL源码剖析——P142关于list::sort函数

    在list容器中,由于容器自身组织数据的特殊性,所以list提供了自己的排序函数list::sort, 并且实现得相当巧妙,不过<STL源码剖析>的原文中,我有些许疑问,对于该排序算法,侯 ...

  6. STL源码剖析---红黑树原理详解下

    转载请标明出处,原文地址:http://blog.csdn.net/hackbuteer1/article/details/7760584       算法导论书上给出的红黑树的性质如下,跟STL源码 ...

  7. STL源码剖析面试问题

    当vector的内存用完了,它是如何动态扩展内存的?它是怎么释放内存的?用clear可以释放掉内存吗?是不是线程安全的? vector内存用完了,会以当前size大小重新申请2* size的内存,然后 ...

  8. STL源码剖析学习二:空间配置器(allocator)

    STL源码剖析学习二:空间配置器(allocator) 标准接口: vlaue_type pointer const_pointer reference const_reference size_ty ...

  9. STL源码剖析 数值算法 copy 算法

    copy复制操作,其操作通过使用assignment operator .针对使用trivial assignment operator的元素型别可以直接使用内存直接复制行为(使用C函数 memove ...

  10. STL源码剖析 算法开篇

    STL源码剖析 算法章节 算法总览_CHYabc123456hh的博客-CSDN博客 质变算法 质变算法 - 会改变操作对象的数值,比如互换.替换.填写.删除.排列组合.分隔.随机重排.排序等 #in ...

最新文章

  1. linux vi 清除所有,Vi命令:如何删除全部内容
  2. CF375D Tree and Queries(dsu on tree)
  3. 计算机软件打开为什么跑一边,为什么打开Excel后开始菜单就跑掉了?
  4. 程序员的成长过程 | 每日趣闻
  5. 基于SSM实现图书管理系统
  6. CrowdHuman 测试
  7. Linux运维基础(硬件和操作系统)
  8. objective-c 中代码块(blocks)
  9. 合并数据 - 方法总结(concat、append、merge、join、combine_first)- Python代码
  10. Kafka分区原理图
  11. poj 3461 - Oulipo
  12. winform响应时间最长是多少分钟_东营岩石流变仪多少钱 电液伺服加载系统_朝阳试验仪器东营岩石流变仪多少钱...
  13. python分行政区域汇总_python:编写行政区域三级菜单(day 1)
  14. SOP、DIP、PLCC、TQFP、PQFP、TSOP、BGA封装解释
  15. db2 导出 oracle,db2导出数据库数据库
  16. 我的世界刷猪人塔java版_我的世界僵尸猪人刷怪塔制作思路 猪人塔介绍
  17. 数据库 “投毒”修复方案
  18. 关于华硕电脑进入bios
  19. 大数据在金融行业的应用
  20. 商务汇报PPT制作的七堂课-第五课:图片排版

热门文章

  1. 多商户商城系统如何对接电商收付通?
  2. 第22节 软件工程知识
  3. 公众号网页能调用银联支付么_支付宝新一代刷脸支付硬件发布,自带“轮子”,三天就能开发小程序...
  4. python参考手册 第二章
  5. [MySQL]SQL优化工具SQLAdvisor
  6. 计算机毕业论文答辩申请书,论文答辩申请书范文6篇
  7. 工商银行 Serverless 函数计算落地实践
  8. 2018美赛D翻译从汽油驾驶到 E 驾驶( E 指电,而不是空)
  9. 安卓调用TSC打印机打印图片
  10. java udp 断开_java – 如何中断阻塞调用UDP socket的receive()[复制]