HLM模型(hierarchical linear model,分层线性模型)有着多种稀少,可称作多水平模型,层次线性模型,或者混合效应模型,随机效应模型等。普通的线性回归模型研究X对于Y的影响,而HLM模型也研究X对于Y的影响,但是其考虑了group的聚集性因素(即考虑组内相关不独立问题)。

比如研究‘入学成绩X’对于‘中考成绩Y’的影响,个体是学生,学生隶属于学校group,并且样本数据来源于几个学校。那么不同学校(即group层面)之间的情况时‘入学成绩X’对于‘中考成绩Y’的影响时很可能不一样(比如好学校时可能影响幅度更高),如果希望将学校因素考虑进入,此时学校就是一个聚集性因素group,诸如此类研究时即可使用HLM模型。

HLM模型时涉及到两个重要的专业术语,分别是‘固定效应’和‘随机效应’,其说明如下表:

固定效应是指做HLM模型时,不涉及group干扰时的影响关系研究;随机效应可指在group层面时的影响关系情况,更进一步说明例子如下表:

如果完全不考虑group,即不考虑‘聚集性’问题,那么直接使用线性回归即可,并不需要使用HLM模型,HLM模型就是处理‘聚集性’问题的一种进阶方法;如果说使用HLM模型,并且在分析时只考虑个体效应不需要考虑group层面的效应,即只有固定效应项并无随机效应项;如果说使用HLM模型,并且在分析时考虑个体效应的同时还考虑group层面的效应,即包括固定效应项和随机效应项。

案例:

1, 背景

当前有一项研究,研究样本为65所学校共计4059名学生,研究内容为学生入学成绩对于最终成绩的影响情况,由于学生样本来源于65所不同的学校,而且不同学校层次有着较大区别,因此需要将学校(即group项)的聚集性纳入考虑范畴中。研究数据中涉及的字段如下说明:

2,理论

HLM模型研究是对传统回归模型的进一步精细分析,研究者可深入探讨数据的变异是否在高层次(group)中存在着聚集性。一般分析时分为两个步骤如下说明:

第一步:首先只考虑固定效应,即不纳入随机效应;然后通过结果中的ICC值判断【group层面】因变量的变异幅度(ICC值越大意味着【group层面】因变量的变异幅度越大,一般ICC值较小比如小于0.1时,意味着【group层面】因变量的变异力度较低,意味着聚集性较弱,此时可考虑直接放弃HLM模型改用常见的回归模型即可);

第二步:如果说ICC值较大(比如大于0.1时),此时可进一步探究‘随机效应’对【group层面】带来的变异情况,加入group层次水平的研究项,深入探究它们对于【group层面】变异的解释情况。比如第一步中得到的ICC值为0.2,第二步之后 得到的ICC值为0.1,减少为0.2-0.1=0.1,也即说明新加入‘随机效应’项会对【group层面】产生0.1(10%)的变异解释力度。

特别提示:

  • HLM模型时,研究思路并不完全固定,完全由研究者的研究目的而定;
  • group的数据格式需要特别注意,比如本案例中某个学校(id=1)有73个个体学生,那么id=1就要对应重复73次。

3, 操作

本例子中操作上第一步先不放入‘随机效应’项,即只放入如下图所示:

在第一次分析之后,发现ICC值为0.144较大,即意味着【group层面】即学校中考成绩的变异为14.4%。因此考虑纳入‘随机效应’项,将‘入学成绩’项纳入模型中,以深入探究‘入学成绩’对于【group层面】‘中考成绩’的解释力度(即入学成绩会对中考成绩有影响,但是在不同学校group间是否有差异性)。

4, SPSSAU输出结果

SPSSAU共输出4个表格,分别‘模型基本情况’,‘固定效应参数估计’,‘随机效应协方差估计结果’,‘随机效应参数估计的相关矩阵’,分别说明如下:

5,文字分析

本案例共进行了两次。第一次时不纳入‘随机效应’项,得到结果分别如下:

上表格展示出本次研究的总样本数量是4059个,而且有65组,即group项有65个不同的数字(即65所学校),其中某学校最少只有2个学生个体样本,某学校最多有198个学生个体样本,平均来看每所学校为62.4个学生个体样本。以及HLM模型使用REML似然法估计,log似然值为-4681.13。

‘固定效应参数估计’表格展示固定效应情况,即‘入学成绩’对于‘中考成绩’的影响,上表可知:回归系数值为0.563>0,并且此路径呈现出0.01水平的显著性(z=45.106,p=0.000<0.01),因而说明入学成绩会对中考成绩产生显著的正向影响关系,即学生入学成绩越高,那么学生中考成绩也会越高。

由于第一次分析结果中并没有纳入‘随机效应’分析项,因此‘随机效应协方差估计结果’只会有截距和残差这两项,通过此两项可计算得到ICC值,计算公式为:组内相关系数ICC=截距项方差 / (截距项方差+残差项方差),即组间方差 /(组间方差 + 组内方差)。上表格显示ICC为0.144(此值相对较大),意味着【group层面】中考成绩的变异为14.40%。

与此同时,截距的回归系数值(variance或sd值均可称回归系数值)为0.094且呈现出显著性,意味着【group层面】之间的中考成绩有着明显的差异性。由于ICC值较大和【group层面】之间有着差异性,因此接下来再进一步纳入‘随机效应项’进行深入考虑,考虑‘随机效应项’对于【group层面】上的中考成绩变异的解释情况。

接着将‘入学成绩’这个学校水平上的数据作为‘随机效应项’纳入模型中,因而第2次分析的操作如下图:

第2次分析的结果分别如下面4个表格所示:

此表格信息并没有变化,不再赘述。

‘固定效应参数估计’表格展示固定效应情况,即‘入学成绩’对于‘中考成绩’的影响,上表可知:回归系数值为0.557>0,并且此路径呈现出0.01水平的显著性(z=27.588,p=0.000<0.01),因而说明入学成绩会对中考成绩产生显著的正向影响关系,即学生入学成绩越高,那么学生中考成绩也会越高。

特别提示:

  • 如果说进行过多次HLM模型分析,一般固定效应的分析只以最后一次结果为准即可。

在纳入‘入学成绩’这一‘随机效应’项之后,从上表可以看出:ICC值由第1次分析时的0.144上升到0.145,即增加幅度为0.001,也即说明‘入学成绩’可以提高【group层面】即学校层面‘中考成绩’的变异幅度为0.1%,此比例相对非常低可以基本可以忽略。

截距项呈现出0.01水平的显著性(z=3.625,p=0.000<0.01),即意味着不同【group层面】即学校层面之间的中考成绩有着差异性。与此同时从上表格看到:‘入学成绩’这一‘随机效应’项呈现出显著性(z=2.356,p=0.018<0.05),即意味着‘入学成绩’对于中考成绩的影响时,不同【group层面】即学校层面时有着差异性。

即最终得到结论:【group层面】即学校层面之间的中考成绩确实有着差异性(z=2.356,p=0.018<0.05),而且‘入学成绩’对于‘中考成绩’的影响时(z=2.356,p=0.018<0.05),会有着【group层面】即学校之间的差异性。

特别提示:

如果希望研究某随机效应项的加入,带来【group层面】(本案例为学校)中考成绩的解释力度变化,那么可使用计算公式为:

(Coef_intercept1 – Coef_intercept2)/ Coef_intercept1

【Coef_intercept表示第n次‘随机效应协方差估计结果’表格中‘截距’项的回归系数】,本案例中第1次分析得到的值为0.094,第2次为0.092,即为(0.094-0.092)/0.094=2.12%,即‘入学成绩’可以解释【group层面】即学校层级的平均成绩差异2.12%的原因。

‘随机效应参数估计的相关矩阵’表格展示随机效应项间的相关关系情况,比如上表格中0.425指随机效应截距项与‘入学成绩’间的相关情况,可理解为【group层面】学校间成绩差异与‘入学成绩’间的相关关系情况。该值较大,因此并不需要设置‘随机效应协方差为0’,如果该值较小比如小于0.2,可考虑设置模型中‘随机效应协方差为0’打勾即假定没有协方差关系。

6,剖析

涉及以下几个关键点,分别如下:

  • HLM模型分析思路如何?

HLM分析思路上并没有固定标准,通常是第1步不纳入‘随机效应项’,结合ICC值和随机效应表格中的截距项显著性,判断【group层面】的变异是否存在,如果存在则纳入‘随机效应项’后深入挖掘‘随机效应项’带来【group层面】的变异情况等;

7,疑难解惑

① HLM模型的数据格式是什么样的?

HLM模型的数据格式可点击查看

② HLM模型中ICC值的意义是?

HLM模型时,ICC的计算公式为:组内相关系数ICC=截距项方差 / (截距项方差+残差项方差),即组间方差 /(组间方差 + 组内方差),该指标值代表着【group层面】差异幅度。

③ 涉及几个名词的意义说明?

在HLM效应分析时,涉及到专业名词包括固定效应,随机效应等,说明如下表格:

④ 标准误计算说明:z或t检验?

HLM模型时标准误的计算时,不同软件的计算方式并不同,并且可能使用t检验或者z检验,SPSSAU当前使用z检验。

HLM(分层线性模型)处理“聚集性”问题!相关推荐

  1. 现代分层、聚集聚类算法_分层聚类:聚集性和分裂性-解释

    现代分层.聚集聚类算法 Hierarchical clustering is a method of cluster analysis that is used to cluster similar ...

  2. 聚集索引和非聚集索引的区别_武汉无疫情小区居民可在小区内非聚集性个人活动...

    3月18日,武汉市新冠肺炎疫情防控指挥部社区疫情防控组发布<关于无疫情小区.村(队)调整管控措施的意见>(下简称<意见>)指出,全市认定的无疫情小区.村(队)可对管控措施作有序 ...

  3. 机器学习线性回归学习心得_机器学习中的线性回归

    机器学习线性回归学习心得 机器学习中的线性回归 (Linear Regression in Machine Learning) There are two types of supervised ma ...

  4. 安全警报 该站点安全证书_深度学习如何通过实时犯罪警报确保您的安全

    安全警报 该站点安全证书 Citizen scans thousands of public first responder radio frequencies 24 hours a day in m ...

  5. bert 无标记文本 调优_使用BERT准确标记主观问答内容

    bert 无标记文本 调优 介绍 (Introduction) Kaggle released Q&A understanding competition at the beginning o ...

  6. ai与虚拟现实_将AI推向现实世界

    ai与虚拟现实 If you fit one of these profiles, this article is for you: 如果您适合这些配置文件之一,那么本文适合您: ● You are ...

  7. 嵌入式和非嵌入式_我如何向非技术同事解释词嵌入

    嵌入式和非嵌入式 数据科学 (Data Science) Word embeddings. 词嵌入. What are they? What do they look like? How are th ...

  8. 大脑比机器智能_机器大脑的第一步

    大脑比机器智能 The race to Artificial Intelligence is a grueling, sweaty marathon that human beings have be ...

  9. 如何成为数据科学家_成为数据科学家的5大理由

    如何成为数据科学家 目录 (Table of Contents) Introduction介绍 Variety of Skills各种技能 Uniqueness独特性 Impact影响力 Remote ...

最新文章

  1. 互联网如何“升级”制造业?《“人工智能+制造”产业发展研究报告》发布
  2. Leetcode 166. 分数到小数 解题思路及C++实现
  3. JSON与JAVA数据的相互转换(基本应用)
  4. 详解 ASP.NET异步
  5. android10如何设置打开方式,Android启动方式
  6. idea中git分支的使用
  7. Exchange 2007服务器启动后,Information Store和System Attendant服务不能自动启动
  8. Spring Data MongoDB中的审核实体
  9. git 查看修改用户名
  10. X Window Messing With The Mouse Cursor
  11. 自己写Cache数据库之设计之初——想办法让16颗CPU扛住3w/s的压力?
  12. 安装debian 9.1后,中文环境下将home目录下文件夹改为对应的英文
  13. 信息隐藏预测算法之MED
  14. xp计算机怎么共享,XP系统两台电脑共享文件办法
  15. 连接共享服务器显示拒绝访问权限,无权限访问共享打印机,windows无法连接到打印机拒绝访问 怎么办?...
  16. 长风破浪正其时,Python天堑变通途(3)(令人智熄的分支循环,优先级问题)
  17. 5. 穿过拥挤的人潮,Spring已为你制作好高级赛道
  18. 华为手机怎么用云歌_华为手机语音助手怎么使用 看完你就知道了
  19. 达内学习的java类库01
  20. 新物种打造爆品,总共分几步?DeepTalk vol.1

热门文章

  1. StarUML使用教程一览
  2. 使用微软DNS服务器解决Hotmail、微软账户登录页面无法访问的问题
  3. Doris集群环境搭建
  4. 微信小程序:Picker-View与Picker-View-column的使用
  5. 说一说递归里的return返回!!!
  6. 【编译原理】词法分析器语法分析器
  7. HiFT: Hierarchical Feature Transformer for Aerial Tracking分层特征Transformer的无人机跟踪
  8. navicat怎么备份数据和同步两个数据库
  9. 【Vue.js】Vue 学习笔记
  10. 火狐浏览器书签工具栏图标_在Firefox书签工具栏中浓缩书签