第11课会讨论关于数据的问题; 样本要有多大才理想?
通常样本越多越好 但从相关矩阵的稳定角度考虑, 样本有200人或以上,
矩阵就比较稳定 只有20-30人,相关矩阵不太稳定, 不适合进行结构模型分析 多组结构模型内, 要留意每组内都要满足刚才的条件 每组内要有200个样本以上才能比较 因为每组的相关矩阵都要稳定 不能所有组的总样本数目为200个, 再把它们分为5组进行多组比较 每组40个样本进行的多组比较是不稳定的 必须每组都有至少200个样本; 因此样本越多越好 题目方面,通常每个因子都要有几题; 只有两题并不足够,
最好有三题或以上 要是研究工具是自己设计的, 最理想是有5-6题 做过初步分析后, 知道哪些题设计得不适合,
就可以删去它们 余下还有3-5题较理想 通常我们不会把几十题题目合并为一个因子 我们会把它们分为为几个细份, 每细份作为一个观察指标,
最后作因素分析 对于自己设计的工具, 就需要多一点题目 因为最后会删去一些题目, 所以需要有3-4或5-6题 要留意的是我们必须检查, 最后余下的题目是否真的能够反映因子 例如我们设计了一些研究四则运算的题目 当中包括了四个因子:加、减、乘、除 要是删去了乘除的题目 只留下加减的题目,这样跟原来的因子内容可能是完全不同了 我们的研究就变了质,不再是四则运算 所以得留意删去题目后, 因子的内容是否跟因子所代表的东西是一致的 通常结构模型分析是根据一些等比(ratio)或等距(interval)的数据 这些数据所产生的Pearson correlation可以作为结构模型内的maximum likelihood分析之用 要是数据内包括一些等级(顺序)量表(ordinal scale) 理论上就得产生另一类相关矩阵,如polyserial(多序类)的相关矩阵 再把它和一个asymptotical covariance matrix(ACM,渐近方差矩阵)合用 就是两个矩阵合用(ACM和polyserial多序类矩阵)来进行分析 但很多研究证明, 如果样本数目不多,
这方法可能使结果更加不合理 所以我们尽量避免用等级量表, 因为一般统计方法不适用于等级量表 要是不能避免 就要用恰当的方法,现在越来越多方法可以处理 如果要用maximum likelihood,最好就要避免等级量表 假如必须用等级量表, 例如学生成绩的排名次序 要是必须用ACM, 要求有5000-10000个样本,
才能估计出一个稳定的参数结果 要是只有几百个样本, 而用上ACM这方法,
结果会非常不合理 要是研究只有几百人, 而数据是等级量表,
唯有用maximum likelihood 这可能比ACM更可以得出较有参考价值的答案 以往做结构方程时, 通常用相关矩阵或协方差矩阵 因为这两个矩阵得出的参数都是相同, 所以不太需要考虑使用的特定条件 大约于1989年,Cudeck & Browne发表了一些论文 列出了一个包含很多行内有影响的人的名单 指出他们分析数据时用错了相关矩阵 本来应该用协方差矩阵, 却错用了相关矩阵 被点名批评/被指出的人都很高兴, 因为被指出的都是当时很出名的人 要是自己的名字在名单内, 就代表自己很出名 这亦可能是唯一一次大家很希望自己被他人在论文中点名批评 究竟在甚么情况下不能用相关矩阵? 如果矩阵的两个因子负荷要相等, 或在多组内增加限制,
就不能用相关矩阵 最简单的解决方法是, 用相关矩阵和协方差矩阵来进行分析 要是两个方法结果不一 这可能代表研究必须由协方差矩阵来进行分析, 用相关矩阵可能是错误的 结构模型的其中一个好处, 就是可以考虑模型内的测量误差 以往做回归分析、相关分析, 虽然都知道测量误差的存在,
但没有好好地处理 但在结构模型当中, 我们洽当地处理测量误差 研究排除测量误差后的真正关系, 采用结构模型分析处理 要是忽略了测量误差, 引起的错误能有多大?
可以参考一些数学的方程 举例有一些观测分数如中、英、数的分数 我们得到一些观测变量, 这些变量有个方差 例如18分,26分,70分,85分, 看见学生的分数不同,
就是变量X 变量的不同,我们计算到standard deviation standard deviation的平方是方差(variance) , 就是观察变量的变异量 为甚么学生会有不同的分数, 因为他们的能力不同,能力就是这儿的KSI 就是真分数的不同, 我们看到的这些差异由两个原因引起 第一个就真能力的变异量, true score的vairance所引起的;
另一个是误差的变异量所引起的 换句话说,真正的分数的变异量有两部分组成 是由真分数的变异和误差的方差两个部分引起 它们的总和就是我们观察到的总变异量 从这个方程中得知 除非误测的变异量刚好等于0, 观察得出的变异量不等于真分数的变异量 另外一个角度思考, 真分数的变异量如果被高估 因为它的部份是误差的变异量, 我们把它都当成真分数的变异量 这个错误估计会引起甚么? 可以参考一些数学结果 简单来说,真分数的相关 这两个相关等于"观察相关/信度的平方,然后再开方"; rxx和ryy是分数的信度 例如外面看见两个分的相关是0.5 而真分数的相关就是0.71, 观察到的是0.5,
其实真正的能力的相关是0.71 这就是说,真分数比看见的大得多 在较复杂的模型内就较难估计真正的变量关系 那时必须用上结构模型方程来计算 大多数时候我们都计算因子内的关系; 如果因子只有一个题目怎么办? 以往一个因子里有几个题目时 我们就把它们之间的共同部份抽出来, 变成一个因子 要是因子只有一个题目就麻烦一点 以往抽出了因子的共同部份后, 剩下的部份会放在TD 如今只有一题, 就不能同时估计LX和TD 以往能够估计LX和TD, 因为有几个题目,
就能知道有多少共同部份可以放到LX 如今只有一题就不知道有多少放在因子,有多少放在误差 要是有一个相关矩阵就得用信度来估计LX和TD 例如我们的工具是一个能力测验, 我们估计其信度是0.85 这信度是基于过往相关的研究得出的 然后再做一个敏感度的检查(sensitivity test) 就是从信度0.7或0.8一个可能的值开始一直到0.9的范围检查 放入不同的信度数值(0.7-0.9)去分析 最后参考分析,看看重要结果有否改动太多 就是不论用哪一个数值(0.7,0.8,0.9) , 得出的分析,主要参数也不会改动太多 这代表纵然用错了数值(0.8是错、0.7是正确的) 经检查后,在这可能范围内, 所有参数的变量还是稳定的,
不会有太大改变 这说明在某范围的信度内, 结果内的参数都不会有很大的影响(改变) 这就是最理想的情况 如今我们的信度是0.85, 误差就是0.15;
我们把误差放在TD 4,4,
并把TD 4,4固定为0.15 真分数部份是0.85的开方=0.922 我们把它放到LX 4,3; 这LX就是透过对信度的估计而计算出来的 只要信度是0.85,TD就是0.15 切记我们可以尝试不同的信度 再检查结果内的主要参数(如因子相关)有否改变太多 例如如果把0.85改为0.80会使结果带来太多改变, 我们就会担心信度的数值 因为放不同的信度, 都会影响到整个结果 要是不同的信度都不会带来甚么影响, 就可以肯定那结果是很稳定的结果 这就代表不论放甚么信度数值, 都得出一个稳定的结果 处理这个问题的方法是 先估计信度的可能数值 设置一个合理的信度,设定相应的TD, 看看不同信度值是否能使结果仍然稳定 计算得出的LX亦不会有太大改动 甚么时候要计算correlated uniqueness(误差相关) 大多数时候,模型的修正指数都会告诉我们, 要是放宽某些误差(独特性)相关 例如第一和第四题的TD/TE 如果放宽它们, 可能改善整个模型的吻合度,
会改善拟合优度指数 我们应该容许它们自由估计吗? 随便容许误差相关自由估计,
是一个错误的方法 只有在特殊情况下才可以这样做 例如一年级检学生中、英、数的能力, 二、三、四、五年级有相同科目 但因为每年都检查这三科的成绩 如果在一年级当中,三科都抽出一个共同能力 可能有些误差是中文的独特性, 剩了下来放到uniqueness当中 而一年级和二年级的(对应相同科目)误差也可能有一点相关 容许这些误差有相关, 是个合理的做法 但如果在其他模型内, 随意容许误差之间有相关,
是一个错误的方法 现在介绍equivalent models(等同模型): 有一些模型外表看上来是不同的 例如萤幕中两个图 一个容许因子之间有相关, 另一个只有一个因子影响另一个因子 在其他情况的差异可能比这个更大 但有一个现象 模型A、B看起来很不同, 但它们的拟合优指数(及一些参数)都是一样 我们发现,有些模型,不论套进甚么数据 A模型产生的再生协方差矩阵, 和B模型所产生的都是相同 而是它俩的再生矩阵相同, 它俩的所有拟合优度指数都相同 换句说话 2个或多个模型外表看起来不同
而且部份参数也不同 比如它们的路径强弱不同 但奇怪的是,这些看起来样子不同的模型,在当分别套入数据后 它们的拟合优度指数是相同, 自由度都相同;
这是一个巧合吗? 但如果再套入另一套数据到两个模型, 得出的再生矩阵和吻合指数都相同 再套进第三套数据, 得出的又是相同 这说明,这两个模型, 不论套入甚么数据,
它的吻合指数也是相同 它的再生协方差矩阵也是相同 所以,在这样情况下,称这两个模型是等同模型 在数学上有很多等同模型, 就像y = x + 2其实跟y – x = 2是一样的 它们看起来不同, 但在数学上却是一样,
等同模型就是这原理 怎样才知道模型是等同? 能否凭肉眼分辨?
一般来说都不可能 但饱和模型则可能较易留意, 因为它们的结构是饱和的 例如在三个因子内, 每两个因子之间的关系都存在路径 例如是一个相关,一个路径的关系 要是在四个因子内, 每两个因子之间都有路径 旁边的有,对角线的都有一些关系 即每两两因子之间都有路径(一些是相关、一些是单向路径)存在 它们都是等同的五个因子也一样 要是它们之间每两个因子都有路径, 它就是个饱和模型 在这些模型内 随便把一条路径变为一个相关 或是把箭咀的方向调过头来, 又或是把它变为一个残差的相关 就是PS部份,残差部份的相关, 这些都是两个或以上等同的模型 不论如何改变箭咀的方向, 把它从单方向的箭咀变成一个相关 算出来的数值不同, 但在数学上仍然是等同的 只有在饱和的模型当中, 才较易看得出哪个模型是等同的 在一般情况下比较难以知道模型是否等同 最简单的做法就是把不同的数据套进模型 如果它们的拟合优度指数永远相等, 它们就是等同模型 结构方程能否证明因果的关系? 除非透过实验设计来验证因果关系, 否则就算是用结构模型也不能验证 如果是非实验设计, 结构方程模型可以帮我们做些什么? 第一,如果实纵贯性研究,一些追踪性研究 就是研究有很多时段,第一时段第二时段等等, 每次都收集很多变量 在这些纵贯性研究内, 我们用了很多指标 好处就是可以算出指标之间的相关, 并把它组成一个因子 那就可以删去误差的部份, 控制它的误差,
以得出真分数真能力之间的关系 第三点要注意的是, 样本需要比较大,
这样得出的关系就有代表性 最后就是要考虑不同模型表达的意义 有需要时就要考虑应该如何处理误差 在这些情况下, 虽然研究是非实验研究 但也可能可以协助表达因果之间(如跨年cross-lag效应)的关系 最常犯的错误就是在高阶因子模型中 将一些外表看来同类的关系都把它们归纳成一个高阶因子 例如性格因子,个人是否外向、是否愿意冒险、随和性 这些都是跟性格有关的一阶因子 至于能否抽出一个二阶性格因子? 这是不能够的 我们应考虑一阶因子的这些分数所加起来的结果是否有意义 如果有意义就可以抽出二阶因子, 不然就不能够 例如所有一阶因子都跟学校有关 第一个是学校学生数目, 第二个是学校距离中心多远,
第三个是学校大门的方向 第四个是学校有多少棵树, 第五个是学校门牌的颜色 所有一阶因子都跟学校有关的因子 如今想抽出一个二阶因子, 这是不可能的 因为这些有关学校的因子, 加起来都没有意义 再抽出一个二阶因子亦是没有意义的 可以做的就是尝试逐一因子分析, 试一试它们能否抽为一个因子 例如一阶因子是学生的能力 第一个是中文分数, 第二个是英文分数,
第三个是数学分数 第四个是化学分数, 第五个是生物分数 因为每个都代表学生的能力, 加起来可能是学生的总能力指标 把它们抽出成为一个总能力因子, 可能是可取的 因此要考虑的是因子能否加起来, 加起来后是否有意义 要是有意义,变为一个高阶因子就有代表性 要是不可能加起来,就不应该抽出成为一个高阶因子