估计一份测验分数的信度时,应先检视此测验的向度。倘若该测验为多向度结构的测验,则应使用多向度测验信度估计法,其中以分层 α、Revelle的 β、多向度 ω、阶层 ω 等方法为常见的多向度测验信度估计法。Green和Yang(2009)曾建议应使用多向度 ω 作为估计测验信度的方法。McDonald(1970)则提出当测验结构具有阶层时,应考虑普通因素(general factor)的估计,提出阶层 ω 以估计普通因素的信度。此种想法在理论与逻辑上较为合理,同时一般因素应是研究者所最关注的部分。然而多数情况中研究者并未仔细区分各种多向度估计法之间的差异(Zinberg Relleve Yovel & Li 2005),因此本研究以同时比较4种多向度测验信度估计法于各研究情境中的表现差异来区分各方法的特性。过去研究也较少探讨估计法的运算实质意义与逻辑合理性,且选用的研究模型多是高阶因素分析模型,然而Reise(2012)认为双因素模型(bi-factor model)更能表征构念的多向度性质,故本研究以双因素模型做为研究模型。本研究操弄普通因素负荷量、子因素负荷量、子因素数目、样本数产生模拟资料进行各估计法的比较。研究结果显示多向度 ω 、分层 α 、β 估计表现稳定度最高,于小样本情境亦是如此。但本研究最为关注的阶层 ω 在普通因素负荷量高且子因素数目多并因素负荷量高时,估计稳定性高但偏误大;普通因素负荷量低且子因素数目多并因素负荷量低时,也出现一样的估计情形,和其他方法的真值差异也大。故上述两种情境中并不建议只用阶层 ω 作为信度单一指标,应搭配其他方法一同考量测验的信度。而当普通因素负荷量高且子因素数目少并因素负荷量低时,阶层 ω 作为信度指标并无重大的理论与逻辑瑕疵,其估计情况算除在小样本下较不稳定外,其余估计稳定性高,相对偏误较小,和各估计方法的真值差异较小,此时可单用阶层 ω 的作为信度指标,且测验结构也较合理。 关键字:多向度测验信度、双因素模型、阶层ω、多向度ω、分层α、Revelle的β