本案例是IBM SPSS数据分析与挖掘实战案例精粹----第七章的学习记录

案例背景或目标:激素水平是否在对照组和实验组之间存在差异

分析方法:Bootstrap抽样,秩和检验,秩变换方法,cox回归

字段包括:性别,年龄,萎缩程度,胃粘膜细胞肠化生程度

基本思路:控制变量法,首先排除性别,年龄,萎缩程度,胃粘膜细胞肠化生程度的影响;

探索性数据分析:观察样本量,样本的分布,是否存在偏态分不等;

样本分布:分析-表

    性别 萎缩 肠化 年龄分组
    轻度 中度 重度 轻度 中度 重度 青年组 中年组 老年组
    Count Count Count Count Count Count Count Count Count Count Count Count
组别 试验组 25 12 14 16 7 10 12 13 2 15 12 10
对照组 20 11 0 0 0 0 0 0 0 10 11 10

查看激素水平分布:图形--图表构建程序

激素水平呈明显的正偏态分布,必须考虑假设检验方法对数据的分布要求;

采用Bootstrap抽样进行分析:常用经典统计学的分析方法,无一例外的需要对变量的分布进行假定,然后才能进行相应的计算;ootstrap抽样的基本思想是在全部样本未知的情况下,借助部分样本的有放回多次抽样,构建某个估计的置信区间,抽象地说,通过样本得到的估计并没有榨干样本中的信息,bootstrap利用重采样,把剩余价值发挥在构建置信区间上。

bootstrap抽样方法:分析--比较均值--均值--因变量列表(激素水平),自变量列表(组别,性别,年龄),选项--中位数--加入“单元格统计量”,bootstrap子对话框中“执行bootstrap”

可以观察各个统计量95%区间差异,对某因素的影响进行分析;中位数并不重叠,可能存在统计学差异(初步分析);可以采用采用秩和检验进行更精确的分析:

对因变量变量变换后的建模分析:

常见的变量变换方法:1,对数转换;2,平方根转换;3,平方根正弦转换sin(开方);4:平方转化;5,倒数转换;6,Box-Cox变换;

对于正偏态分布,一般常用的是对数变换:分析----描述统计----P-P图(数据符合指定分布时,P-P图中各点近似呈一条直线。)

将字段进行转换后,使用:

1)分析----一般线性模型----单变量

2)将Injisu选入“因变量”列表框

3)将组别,性别选入“固定因子”列表框,年龄选入“协变量”列表框

4)“模型”子对话框,将组别,性别,年龄的主效应选入“模型”列表框

5)“选项”子对话框,选择“残差图”和“缺乏拟合优度检验”

6)确定。

上图,总模型p值为0.003,说明整个模型对injisu的预测是有统计学意义的(变量之间相关的),分项来看,只有组别具有统计学意义;

秩变换分析:

当变量转换无法解决问题时,可以使用秩变换:转换----个案排序-----将激素水平放入“变量”列表框;

将字段进行转换后,使用:

1)分析----一般线性模型----单变量

2)将Rjisu选入“因变量”列表框

3)将组别,性别选入“固定因子”列表框,年龄选入“协变量”列表框

4)“模型”子对话框,将组别,性别,年龄的主效应选入“模型”列表框

5)“选项”子对话框,选择“残差图”和“缺乏拟合优度检验”

6)确定。

利用Cox模型进行分析:秩变换分析会损失一些信息,除了非参数方法外,还可以利用生存分析中的COX回归模型进行分析

总结:性别,年龄对激素水平未发现有影响,试验组和对照组之间的激素水平存在明显差异;对于同一个统计问题,可以使用多种模型进行解决,没有正确的模型,只有更加适合的模型;当结论不一样时,应根据模型的特点以及真实情况,判断那种情况更接近真实;也可以使用投票策略进行确定(类似与随机森林,选择多数模型结果)

spss实战案例----分析多个变量与因变量之间是否存在关系,方差分析相关推荐

  1. Salesforce学习之路-developer篇(五)一文读懂Aura原理及实战案例分析

    很喜欢曾经看到的一句话:以输出倒逼输入.以输出的形式强制自己学习,确实是高效的学习方式,真的很棒.以下仅为个人学习理解,如有错误,欢迎指出,共同学习. 1. 什么是Lightning Componen ...

  2. 75. CPU 100%运行实战案例分析

    75. CPU 100%运行实战案例分析 生产库问题现象: 1),每次tomcat启动后第8天左右就会出现CPU 100%运行的情况: 2),jmap -heap pid命令查看老年代已使用99%: ...

  3. spss方差分析_【D】SPSS统计案例分析:多因素方差分析

    多因素方差分析,用于研究一个因变量是否受到多个自变量(也称为因素)的影响,它检验多个因素取值水平的不同组合之间,因变量的均值之间是否存在显著的差异.多因素方差分析既可以分析单个因素的作用(主效应),也 ...

  4. 架构师的 36 项修炼第10讲:架构实战案例分析

    本课时的主题是架构案例分享,通过案例分析来加深对前面所学内容的理解.下面将分析三种不同的系统架构案例. 分析初创互联网公司的架构演化案例,看一个小的系统架构是如何演化成一个较为成熟的.能够承受百万级订 ...

  5. 面试必拿offer系列之:通过实战案例分析面试短板与亮点

    问题导读 1.本文列举了哪些短板? 2.我们认为如何查找自己的短板? 3.本文列举了哪些亮点? 思考: 我们该如何培养和找到自己的亮点? About云在面试指导方面积累了四到五年的经验,在2017年成 ...

  6. TS核心知识点总结及项目实战案例分析

    前言 最近工作一直很忙,复盘周期也有所拉长,不过还是会坚持每周复盘.今天笔者将复盘一下typescript在前端项目中的应用,至于为什么要学习typescript,我想大家也不言自明,目前主流框架vu ...

  7. Android性能优化——腾讯、字节、阿里、百度、网易等互联网公司项目实战+案例分析(附PDF)

    前言 当我们还在用按键.滑盖.翻盖手机的时候,全触屏手机来了; 当我们觉得二维码这项发明没有意义的时候,支付宝和微信等狠狠地给了我们响亮的耳光; 当我们以为扫码支付只有支付宝的时候,微信支付来了; 当 ...

  8. ITIL基础概述与实战案例分析(下)

    上一篇文章主要给大家介绍了"基于ITIL体系的IT部门建设",下面举几个例子,来说明ITIL实施后的效果. ● 基于ITIL体系的IT项目管理 任何项目的上线都会启动对项目运维的环 ...

  9. tableau实战案例-分析120个国家和地区的自杀率情况

    做数据分析,避免不了的要做可视化展示,这次就讲解一下如何通过tableau制作一份可视化图表,来分析一些问题. 需要的工具:excel.tableau public(就是免费版) 需要的技能:数据清洗 ...

最新文章

  1. mysql求每个订单的平均价_MySQL – 选择所有客户和每个客户的总订单和总价值
  2. 【SSM框架系列】Mybatis基本介绍
  3. 诺基亚5800WIFI设置教程
  4. 【数据结构与算法】之深入解析“TinyURL加密与解密”的求解思路与算法示例
  5. 迅雷启动不了,提示Atl71.dll文件丢失
  6. 职高学的计算机单招考试能换专业吗,高职单招可以随便选专业吗
  7. iOS GorupBy
  8. 博弈——威佐夫博弈(hdu1527,2177)
  9. aspx 页面,master页面与ascx用户控件传值的问题
  10. QT--QDockWidget 停靠窗口
  11. 2.3 logistic 回归损失函数
  12. 如何批量修改AD用户的Email属性
  13. 详解tensorflow数据读取-tf.train.string_input_producer和tf.train.start_queue_runners
  14. Codeforces Round #342 (Div. 2) D. Finals in arithmetic(想法题/构造题)
  15. leetcode sql
  16. uc影音java_uc影,
  17. 机器学习基础--各种学习方式(18)--核方法和多核学习
  18. Apache Flink®极简教程: 架构及原理 Stateful Computations over Data Streams
  19. PTA 7-28猴子选大王(约瑟夫问题)
  20. 哪些产品需要过3C认证?3C认证具体清单

热门文章

  1. PREP 语法笔记 2
  2. 就在今天!当当科技品类日满100减50
  3. mysql学生表选课表课程表_mysql查询(学生表、课程表、选课表)
  4. 瓜子二手车实习笔试SQL
  5. 机票预定系统可行性分析
  6. SQL Server 如果表存在执行删除
  7. 水平集(Level Set)的基本方法
  8. 小信号放大电路的频率特性
  9. 最长连续子序列偏移_在新的模压成型工艺中结合热塑性连续带材与D-LFT(第一部分)...
  10. biosrecovery什么意思_BIOS是什么意思``