Skip to main content
Originalarbeit

In norming we trust

Verfahren zur statistischen Modellierung kontinuierlicher Testnormen auf dem Prüfstand

Published Online:https://doi.org/10.1026/0012-1924/a000263

Zusammenfassung. Ziel der Untersuchung war ein systematischer Vergleich verschiedener Verfahren zur Normdatenmodellierung. Der auf Taylor-Polynomen basierende semi-parametrische Normierungsansatz (SPCN) mittels cNORM (Lenhard, Lenhard & Gary, 2018) wurde parametrischen Anpassungen basierend auf Generalized Additive Models for Location, Scale and Shape (GAMLSS; Stasinopoulos et al., 2018) gegenübergestellt und die Normierungsgüte in Abhängigkeit der Faktoren Normstichprobengröße (n = 525, 700, 1 050, 1 750), Itemanzahl (i = 10, 20, 40) sowie Itemschwierigkeit analysiert. Die Modellierung erfolgte kreuzvalidiert auf der Basis simulierter Rohdaten von Normierungs- und Validierungsstichproben: Mittels der verschiedenen Verfahren wurden auf der Basis der Normierungsstichprobe statistische Modelle berechnet und auf die Validierungsstichprobe übertragen, um die jeweils vorhergesagten mit den tatsächlichen Normwerten zu vergleichen. Der semi-parametrische Ansatz lieferte in den meisten Fällen den geringsten Normierungsfehler und damit das beste Normierungsergebnis. Die deutlichsten Unterschiede fanden sich bei leichten bzw. schweren Testskalen in Verbindung mit einer kleinen Itemanzahl. Der Einfluss der Normstichprobengröße war bei allen Methoden vergleichbar.


In Norming We Trust. Continuous Norming Methods Put to the Test

Abstract. While the majority of standardized psychometric tests draw on standard scores for evaluating individual test results, statistical modeling of norm data is increasingly used in order to derive continuous test norms. The aim of the current study was to systematically compare different continuous norming approaches, namely, the semi-parametric approach (SPCN) with cNORM (Lenhard et al., 2018) with three different parametric procedures based on generalized additive models for location, scale and shape (GAMLSS; Stasinopoulos et al., 2018). The quality of the results was analyzed in terms of norm sample size (n = 525, 700, 1,050, 1,750), number of items per scale (i = 10, 20, 40), and item difficulty. We cross-validated the procedures by drawing norming and validation samples based on the same population model, simulated raw score distributions, computed the continuous norming models, and applied these to the validation sample to compare actual with predicted standard scores. SPCN showed the smallest deviations in terms of RMSE in most of the cases, especially in combinations of small item numbers with easy and difficult scales. All approaches needed far less [author: far smaller?] sample sizes compared with conventional norming and were influenced by the number of cases per norm sample.

Literatur