Skip to main content
Published Online:

Zusammenfassung. Die Bedeutung des Rasch-Modells für die Testkonstruktion steht zwar außer Frage, trotzdem ist auf gewisse Probleme bei der Analyse eines Itempools nach dem Rasch-Modell hinzuweisen. Zum ersten kann es Itempools geben, die dem Rasch-Modell widersprechen und trotzdem testtheoretisch brauchbar sind: Es können die Items annähernd einer sog. Guttman-Skala folgen oder sie entsprechen dem 2- bzw. 3-PL Modell von Birnbaum. Zum zweiten geht es im Zusammenhang mit Modelltests um die “α-Überhöhung“ bzw. das Konzept der Effektgrößen: Entweder werden zu viele Modelltests durchgeführt oder es werden Modelltests bestimmt, die hinsichtlich des Effekts zwar signifikant, aber inhaltlich irrelevant sind. In Ermangelung eines methodisch fundierten Regelwerks, welche Modelltests standardmäßig im Sinne eines state of the art durchzuführen sind, um gegebenenfalls den Grad der Bewährung des Rasch-Modells für einen bestimmten Itempool als ausreichend qualifizieren zu können, wird hier ein Vorschlag gemacht.

Some problems in calibrating an item pool according to the Rasch model

Abstract. The importance of the Rasch model for psychological test calibration is beyond question, however, there are still a few problems to point out. Firstly, an item pool can be of practical use and psychometrically valid even when it contradicts the Rasch model: The items may fit either a Guttman scale or the 2- and 3-PL model. Secondly, a too high type-I risk may result as a consequence of multiple model checks or the practical irrelevance of the model. Since no standardised rules exist as to which kinds of model checks have to be applied in order to sufficiently establish Popper’s “degree of corroboration/confirmation” with respect to the Rasch model, a suggestion is given in this paper.
