在这个世界上有无限多的数据,而每种数据都有属于自己的属性。那么做数据挖掘数据分析的时候,要对杂乱无章数据由一定的敏感度,学会分析数据属于哪一种类型也是一种技能。多留意身边的一些数据,试试给他分个类型也是挺好玩的一件事。

如果从宏观角度分析,数据类型分为 定性定量 两种。

定性:变量是品质特征,如性别分男和女,是一种 特质
定量:变量是数值,可以量化,如身高体重等。
定量又可以分为离散型和连续型,离散型一般为计数结果,如男朋友毁约的次数,连续型一般为测试结果,如女朋友身高体重的测量。

那么又是怎么去对这些数据类型进行 度量 ,也就是对数据类型划分一定的层次

一般可以将数据类型的度量分为四种: 定类,定序,定距,和定比, 这四种类型是从低到高的递进关系,高级的类型可以用低级类型的分析方法来分析,而反过来却不行,理解下面这些类型对于后面学习统计分析方法尤为重要。

1、定类变量

定类就是将给数据定义一个类别。这种数据类型将所研究的对象分类,也即只能决定研究对象是同类抑或不同类。例如把性别分成男女两类;把动物分成哺乳类和爬行类等等。

注意! 定类变量遵循两个原则:
(1)类与类之间互斥,不存在即是男又是女的东西(人妖特例不算)
(2)每个对象都必须要有类别,就像每个动物都有自己的界门纲目科属种

2、 定序变量

定序变量是将同一个类别下的对象分一个次序,即变量的值能把研究对象排列高低或大小,具有>与<的数学特质。它是比定类变量层次更高的变量,因此也具有定类变量的特质,即区分类别(=,≠)。

例如文化程度可以分为大学、高中、初中、小学、文盲;工厂规模可以分为大、中、小;年龄可以分为老、中、青。这些变量的值,既可以区分异同,也可以区别研究对象的高低或大小。

注意! 各个定序变量的值之间没有确切的间隔距离。比如大学究竟比高中高出多少,大学与高中之间的距离和初中与小学之间的距离是否相等,通常是没有确切的尺度来测量的。定序变量在各个案上所取的变量值只具有大于或小于的性质, 只能排列出它们的顺序, 而不能反映出大于或小于的数量或距离。

3、 定距变量

定距变量是区别 同一类别下 个案中 等级次序 及其 距离的变量 。它除了包括定序变量的特性外,还能确切测量同一类别各个案高低、大小次序之间的距离,因而 具有加与减的数学特质。 但是,定距变量 没有一个真正的零点。

例如,摄氏温度这一定距变量说明,摄氏40度比30度高10度,摄氏30度比20度又高10度,它们之间高出的距离相等,而摄氏零度并不是没有温度。又比如调查数个地区的工人占全部劳动人口的比率时,发现甲、乙,丙、丁、戊五个地区的比率分别是2%、10%、35%、20%、10%。甲区与丙区相差33%,丙区与丁区相差15%。这也是一个定距变量。

注意! 定距变量各类别之间的距离,只能加减而不能乘除或倍数的形式来说明它们之间的关系。

4.、定比变量

定比变量是区别同一类别个案中等级次序及其距离的变量。定比变量除了具有定距变量的特性外,还具有一个 真正的零点 ,因而它具有乘与除(×、÷)的数学特质。例如年龄和收入这两个变量,固然是定距变量,同时又是定比变量,因为其零点是绝对的,可以作乘除的运算。

如A月收入是60元,而B是30元,我们可以算出前者是后者的两倍。智力商数这个变量是定距变量,但不是定比变量,因为其0分只具有相对的意义,不是绝对的或固定的,不能说某人的智商是0分就是没有智力;同时,由于其零点是不固定的,即使A是140分而B是70分,我们也不能说前者的智力是后者的两倍,只能说两者相差70分。 因为0值是不固定的, 如果将其向上移高20分,则A的智商变为120分而B变成50分,两者的相差仍是70分,但A却是B的2.4倍,而不是原先的两倍了。摄氏温度这一变量也如此。

这里没注意了! 定比变量是最高测量层次的变量。

定类,定序,定距,定比四种数据类型相关推荐

  1. 定类,定序,定距,定比四种数据类型 1

    在这个世界上有无限多的数据,而每种数据都有属于自己的属性.那么做数据挖掘数据分析的时候,要对杂乱无章数据由一定的敏感度,学会分析数据属于哪一种类型也是一种技能.多留意身边的一些数据,试试给他分个类型也 ...

  2. 在Action类中获得HttpServletResponse对象的四种方法

    Struts2:在Action类中获得HttpServletResponse对象的四种方法 在struts1.x Action类的execute方法中,有四个参数,其中两个就是response和req ...

  3. 1.3 Python列表、字典、集合和JSON四种数据类型

    Applications of Deep Neural Networks with Keras 基于Keras的深度神经网络应用 著:Jeff Heaton 译:人工智能学术前沿 目录 1.Pytho ...

  4. 举例说明定类数据,定序数据,定距数据和定比数据的区别

    统计学中,统计数据主要可分为四种类型. 1.定类数据: 名义级数据,数据的最低级,表示个体在属性上的特征或类别上的不同变量,仅仅是一种标志,没有序次关系.例如, "性别",&quo ...

  5. Struts2教程6:在Action类中获得HttpServletResponse对象的四种方法

    在struts1.x Action类的execute方法中,有四个参数,其中两个就是response和request.而在Struts2中,并没有任何参数,因此,就不能简单地从execute方法获得H ...

  6. java类默认访问权限_Java的四种访问权限

    ❝ 所谓访问权限,指的就是本类中的成员变量.成员方法对其他类的可见性 ❞ 试想一想,当我们修改一个非常庞大的项目时,如果所有变量和方法都是公共权限,那么后端中任何类都有权限去修改它的变量和方法,很有可 ...

  7. 两边定宽,中间自适应布局的四种实现方法

    1. 浮动法 <!DOCTYPE html> <html lang="en"> <head> <meta charset="UT ...

  8. c语言中最常用的四种数据类型,计算机中有哪几种常见数据类型

    计算机中有哪几种常见数据类型 数据类型在数据结构中的定义是一个值的集合以及定义在这个值集上的一组操作.下面是YJBYS小编带来的计算机中有哪几种常见数据类型介绍,希望对你有帮助. 一.指令系统概述 指 ...

  9. C/C++语言中计算int,float,double,char四种数据类型所能表示的数据范围

    char        1字节    short       2字节    int         4字节    long        4字节    long long   8字节    float ...

最新文章

  1. shell查看并修复网络连接
  2. 从Google PR值审定标准来学习如何做推广
  3. go基本语法:channel未关闭遍历结束后会报错deadlock
  4. 学习视觉和语言的多粒度对齐?字节提出新多模态预训练方法 X-VLM:代码已开源!...
  5. java applog_java - 通过Logback登录到App Engine request_log - SO中文参考 - www.soinside.com
  6. openstack租户管理_几大OpenStack的精华问答 | OpenStack都有哪些基础服务?
  7. php 循环 post,如何在php中使用jQuery递归调用POST循环请求
  8. vuex state使用
  9. Keil3/4/5 For C51安装教程(附Baidu 云链接)
  10. 修改毕设,降低查重率方法
  11. Tomcat安装及配置教程
  12. phaser java_java并发编程:Phaser同步工具原理
  13. 尚硅谷的 ediary 笔记_【华硕灵耀X纵横(i71165G7/16GB/512GB/集显)评测】助力笔记本创新!英特尔Evo平台制定十大体验目标...
  14. 利用python-docx和docxcompose实现word合并,自动化办公
  15. keyshot渲染玻璃打光_keyshot8耳机渲染打光教程
  16. 全国计算机技术与软件专业技术资格(水平)考试【软件评测师】-考试内容总结(十二)软件评测基础知识...
  17. 孙子定理(中国剩余定理)
  18. 汽车整车生产厂MES解决方案
  19. opencv图像转换与保存
  20. 快速解决Ubuntu镜像在官网下载速度很慢的方法

热门文章

  1. 第九届“中兴·图灵杯”人工智能程序设计大赛圆满落幕
  2. 亲测!windows11耳机杂音问题解决方案!
  3. 计算机中的数制和编码教案,数制与编码教案
  4. java如何压缩解压图片_Java实现压缩文件与解压缩文件
  5. 干货 | PCB电路板短路了!试试这六种检查方法
  6. 字节跳动春招攻略:学长学姐笔经面经,还有出题人「锦囊」
  7. iar烧录程序步骤_STM8入门以及程序编译、烧录、IAR使用方法(扫盲篇)
  8. 计算机毕业设计SpringBoot选题推荐—校园在线拍卖系统
  9. win10 复制F12后的http请求入参的json
  10. 用计算机来弹洪荒之力,如果不会支撑,纵使有“洪荒之力”也弹不强