点亮小星星科研路上我们一起前行!
当数据存在嵌套结构,或者多个水平如学校-班级-个人;企业-团队-个体;个体-多个时间点。通常的single level 分析,因违反观察及误差的独立性假定,更容易犯一类错误。我们需要multilevel。
拿一个网上的段子来说,同样是九年义务教育,凭什么别人就那么优秀?
以优秀程度来做结果变量,这种差异显然每个人和每个人是不一样(低水平),也可能一部分是不同班级之间有差异,不同学校之间有差异。所以,多水平模型的一个基本假定是,高水平差异能够解释结果变量的一部分。
那么,究竟是不是这样呢?
这时候就有一个指标ICC,来衡量:Intraclass correlation(ICC)
所以通常都会先计算ICC,高水平变异/(高水平变异+低水平变异)。如果能确实显著解释部分变异,就有必要运用多水平模型。
根据Hox, Moerbeek, & Van de Schoot, 对于多水平分析方法的介绍,通常有两种分析策略,一种是top-down (一次放入所有变量,然后逐步删减,费时费力不推荐),另一种是Bottom-up (先从简单模型到复杂)。这里介绍bottom-up 方法。
多水平模型分析策略(步骤)
Step 1:构建intercept only model常数项模型
Step 2:添加低水平预测变量
Step 3:添加高水平预测变量
Step 4:加入随机效应
Step 5:加入cross-level interaction
Ok,理论知识就到这里,如果想要深入了解推荐下面这本书。Hox, J. J.,Moerbeek, M., & Van de Schoot, R. ().Multilevel analysis:Techniques and applications. Routledge.谷歌引用过万,出到了第三版。
下文将介绍如何用R (详细,从代码到做图,结果解读),Mplus (简介), HLM(简介)。均提供代码和数据,获得方式见文末。
数据说明:100个班级,2000名儿童。变量包括:低水平:儿童的受欢迎程度(popular),性别(sex), 儿童的外向性(extrav);高水平:教师的教育经历(texp)。
Step 1:安装程序包及导入数据
Step2 :analyzing data
安装好程序包,导入数据,在正式分析之前,我们可以做图直观的看看不同班级的儿童外向性与受欢迎程度的关系。
GGPLOT
显然,不同班级儿童的外向性跟受欢迎程度关系是不同的,但整体显示出正相关趋势。
或者你还想要看看,上述关系是否存在性别差异。
Plot with different gender
可以看出,男女之间是存在差异的,但是斜率slopes并没有显著差异。下面正式进行多水平回归分析。
2.1 Test model
根据上文所述的bottom-up逐渐构建模型,首先从基础模型开始。
2.1.1 Intercept only model
以受欢迎程度为因变量,不纳入任何预测变量。
可以看出,高水平变异为0.7021, 低水平的变异为1.2218.
我们可以计算ICC = 0.7021/0.7021+1.2218=0.7021/1.9239= 0.364935
或者在R里,可以直接引用一个包计算ICC
结论:班级水平的变异显著大于0,因此我们需要进行multilevel分析。
2.1.2 Add level 1 predictors model
第二步,我们把性别和外向性纳入,作为低水平的预测变量。
结果解读:
常数项:对于男孩来说,当外向性为0,时候,其受欢迎程度为2.14
性别:0 = Boys,1 = girls; 女孩子的受欢迎程度通常要比男孩高1.253,差异显著。
外向性:外向性和受欢迎程度显著的相关,当外向性增加1个unit, 受欢迎程度分数增加0.416.
2.1.3 Level 1& level 2 predictors
第三步纳入班级水平预测变量:教师经验。
结果解读:
教师经验和学生受欢迎程度显著正相关:教师经验增加一个unit, 学生的受欢迎程度增加0.088
2.1.4 Add slopes
结果解读:
性别random effect不显著,对于受欢迎程度的影响并不存在显著的班级差异。
而外向性显著,说明不同班级之间,学生的外向程度对于受欢迎程度的影响存在显著差异。
既然性别不显著,我们删去其ramdom effect
Omitting sexslope
2.1.5 two level predictros & slopes & crosslevel interaction
纳入跨水平交互作用。因为在上面发现不同班级之间,学生的外向程度对于受欢迎程度的影响存在显著差异。二者可能存在交互作用。
结果发现,二者交互作用显著。
Plot the interaction effect
结果解读:
外向性程度增加,学生的受欢迎程度也直接,而这一关系在经验丰富的教师的班级里更为显著。
最后一步,检验模型分析的一些基本假定,比如方差齐性、正态性检验。R里面也是很容易实现。
2.2 Residualtests
方差齐性
还是同样的模型,不过Mplus要写5-6个不同的mplus 文件。
这里简单介绍一下。只用了一个模型intercept only model;
结果
可以看出ICC与R 计算结果是基本一致的。
MPLUS 不同模型需要单独写代码,其它都还是比较友好的,结果解读也都大同小异。而且Mplus 可以直接得出ICC。Mplus其它模型代码,见文末的数据代码文件。
HLM是专门为多水平开发的,已经有几十年了,不需要自己写代码,类似于SPSS完全就是鼠标点点点,另外,公式也比较直观易懂。这是其优势。不好的地方同样在于点点点比较麻烦,相比较R。
同样,回复文末关键词,附有一个超详细HLM的教程。
总之,这三个软件至少对于多水平回归分析,结果差不多。至于选择哪种,看个人偏好。但是对于一些复杂的多水平结构方程模型,及利用贝叶斯,HLM是无法实现的。
注:本文所有内容数据,都基于以下书本。
Hox, Moerbeek,& Van de Schoot, ).第二作者也是Utrecht summerschool multilevel 的授课教师,包括intro+advanced (450+600欧)。内容基本上都是围绕这本书籍。所有的数据都在网站上可以下载。就是只公开的是只有基础水平的部分。
这篇文章只是简单介绍了多水平数据的回归分析,至于多水平路径分析,以后会在公众号更新。
后台回复【0720多水平】即可获取本期数据和相关代码哟!
本文作者:李培凯
图文编辑:陈 阳
热门推荐:
多水平数据ICC,CFA multilevel 信度在Mplus中的实现
使用R语言进行混合线性模型(mixed linear model) 分析代码及详解
Mplus:随机截距的交叉滞后模型
...
更多热门文章等你来发现
让世界听到我们的声音
让行路的你我不再孤独
让后来者不再无迹可寻
一个华人心理&管理学研究者的聚集地
如果觉得《mplus 软件_多水平数据分析:R Mplus和 HLM 应用对比》对你有帮助,请点赞、收藏,并留下你的观点哦!