Skip to main content

Mehrebenenanalyse oder Varianzanalyse?

Ein simulationsbasierter Vergleich von Verfahren zur Auswertung pädagogisch-psychologischer Experimente

Published Online:https://doi.org/10.1026/0049-8637/a000136

Zusammenfassung. Wer Experimente in Schulklassen durchführt, hat mit hierarchisch strukturierten Daten zu tun, was Mehrebenenanalysen nahelegt. Meist sind solche Experimente so aufwändig, dass die für hierarchisch lineare Modelle üblichen Stichprobengrößen nicht zu erreichen sind. Wenn man an Vorhersagen auf Klassenebene nicht interessiert ist, bieten sich alternativ Varianzanalysen an, die die Klasse als Faktor einbeziehen. In einer Simulationsstudie wurden die Äquivalenz, die Reaktion auf variierte Rahmenbedingungen und die Genauigkeit der Parameterschätzungen der beiden Verfahren geprüft. Dazu wurden acht mal 1000 Datensätze simuliert, die sich systematisch in der Anzahl der Klassen, der Balance der Klassengrößen und der Intraklassenkorrelation unterschieden. Die Datensätze wurden mit hierarchischen Regressionsanalysen nach dem random-intercept Modell und mit Varianzanalysen ausgewertet und die Ergebnisse verglichen. Es zeigte sich, dass die Teststärke der beiden Methoden praktisch gleich ist, dass die Rahmenbedingungen sich nur schwach auswirken und dass die hierarchische Regressionsanalyse die Modellparameter bei Datensätzen einer Größe von zehn Klassen befriedigend reproduziert.


Multilevel Analysis or Analysis of Variance? A Simulation Based Comparison of Methods for Analyzing Experiments in School Settings

Abstract. When conducting experiments in schools, one has to deal with hierarchically nested data, suggesting the use of multilevel analyses. Often, such experiments are costly, so that the usual sample sizes for hierarchical linear modeling cannot be accomplished. If one is not interested in predictions on the class level, the data might alternatively be analyzed with ANOVA, including class as a factor. In a simulation study, we investigated the equivalence of these methods with respect to statistical power, sensitivity to varied basic conditions, and accuracy of parameter estimation. In all, 8,000 datasets, varying systematically in the number of classes, balance of class sizes, and intraclass correlation, were simulated. The datasets were analyzed using a hierarchical random intercept model and with ANOVA. We found that both methods were equal in power and the effects of varying basic conditions were weak. Hierarchical linear models of datasets consisting of 10 classes reproduced the simulated population parameters well.

Literatur