Was ist aus dem Rasch-Modell geworden?
Abstract
Zusammenfassung. Das Rasch-Modell hat sich als Herausforderung an die klassische Testtheorie bei der Konstruktion und Entwicklung von Testinstrumenten nicht durchgesetzt, was wiederum der Meßtheorie von Rasch in der universitären Lehre einen nachrangigen Platz zuweist. In dem Beitrag wird argumentiert, daß das Rasch-Modell aus modelltheoretischer Perspektive heraus gar nicht als Konkurrent, sondern als komplementäres Modell zur klassischen Testtheorie zu verstehen ist. Die eigentlich neuen Impulse für eine Fortsetzung der Diskussion um die Rasch-Meßtheorie ergeben sich jedoch aus den Weiterentwicklungen, die dieses Gebiet aufzuweisen hat. Es werden fünf Richtungen der Verallgemeinerung des Rasch-Modells dargestellt, woraus ersichtlich wird, daß eine umfangreiche Familie von Modellen entstanden ist, die sich auf komplexere Datenstrukturen bezieht und auch komplexere Annahmen über die Antwortprozesse zu modellieren gestattet. Die kritischen Punkte der Rasch-Meßtheorie sind weniger in klassischen Vorbehalten gegenüber diesem Ansatz zu sehen, sondern ergeben sich aus epistemologischen Problemen der Modellgeltungstestung. Diese Probleme sind jedoch nicht spezifisch für die Rasch-Meßtheorie, sondern betreffen den Großteil der modernen statistischen Modellbildung.
Abstract. In the seventies, the Rasch model was considered a challenge for classical test theory. In German speaking countries, however, this innovation has not had a serious impact on test construction and development practice, and related to this, Rasch methodology has low priority in university curriculum. It is argued that the Rasch model, from a model based perspective, has not a competetive but a complementary relation to classical test theory. New arguments in this debate arise from the great variety of extensions and generalisations the Rasch model has undergone in the past twenty years. Five directions of generalizing the Rasch model are presented illustrating that a large family of models has been developed that can handle more complex structures of data and that can model more complex assumptions about the response process. Critical issues of Rasch methodology relate less to traditional preconceptions about the simple Rasch model than to epistemological questions of testing the model fit. These problems, however, are not specific for Rasch methodology but pertain to modern statistical modelling in general.
Literatur
Adams, R. J. Wilson, M. Wang, W. (1997). The Multidimensional Random Coefficients Multinomial Logit Model. Applied Psychological Measurement, 21, 1 1– 23Andersen, E. B. (1973). A goodness of fit test for the Rasch model. Psychometrika, 38, 1 123– 140Andersen, E. B. (1977). Sufficient statistics and latent trait models. Psychometrika, 42, 1 69– 81Andrich, D. (1978). A rating formulation for ordered response categories. Psychometrika, 43, 4 561– 573Andrich, D. (1982). An extension of the Rasch model for ratings providing both location and dispersion parameters. Psychometrika, 47, 1 105– 113Andrich, D. (1988). Rasch models for measurement . London: SageAndrich, D. (1991). Review of Latent Trait and Latent Class Models by R. Langeheine & J. Rost. New York and London: 1988, xv + 311 pp.. Psychometrika, 56, 1 155– 168Andrich, D. (1995a). Models for measurement, precision, and the nondichotomization of graded responses. Psychometrika, 60, 1 7– 26Andrich, D. (1995b). Further remarks on nondichotomization of graded responses. Psychometrika, 60, 1 37– 46Andrich, D. (1995c). Hyperbolic Cosine Latent Trait Models for Unfolding Direct Responses and Pairwise Preferences. Applied Psychological Measurement, 19, 3 269– 290Andrich, D. (1996). A hyperbolic cosine latent trait model for unfolding polytomous responses: Reconciling Thurstone and Likert methodologies. British Journal of Mathematical and Statistical Psychology, 49, 347– 365Bartholomew, D. J. (1987). Latent variable models and factor analysis . London: Charles Griffin & Company LTDBem, D. Allen, A. (1974). On predicting some of the people some of the time: The search for cross situational consistency in behavior. Psychological Review, 81, 506– 520Borg, I. (1996). Facettentheorie. In E. Erdfelder, R. Mausfeld, T. Meiser & G. Rudinger (Hrsg.), Handbuch Quantitative Methoden. Weinheim: BeltzBuchner, A. Erdfelder, E. Faul, F. (1996). Teststärkeanalysen. In E. Erdfelder, R. Mausfeld, Th. Meiser & G. Rudinger (Hrsg.), Handbuch quantitative Methoden. Psychologische Verlagsunion, 123-136Carstensen, C. Rost, J. (1998). MULTIRA: Ein Programmsystem für mehrdimensionale Rasch-Modelle . Kiel: IPNDavier, M. v. (1997). Methoden zur Prüfung probabilistischer Testmodelle . (IPN-Schriftenreihe). Kiel: IPNDavier, M. v. (1998). WINMERA: A WINDOWS program fpr mixed Rasch models . Kiel: IPNDavier, M. v. Rost, J. (1997). Self-Monitoring - A Class Variable?. In J. Rost & R. Langeheine (Eds.), Applications of Latent Trait and Latent Class Models in the Social Sciences. Münster: WaxmannFischer, G. H. (1972). A measurement model for the effect of mass-media. Acta Psychologica, 36, 207– 220Fischer, G. H. (1973). The linear logistic test model as an instrument in educational research. Acta Psychologica, 37, 359– 374Fischer, G. H. (1974). Einführung in die Theorie psychologischer Tests . Bern: HuberFischer, G. H. (1976). Some probabilistic models for measuring change. In D. N. M. de Gruijter & L. van der Kamp (Eds.), Advances in psychological and educational measurement (pp. 97-110). New York: WileyFischer, G. H. Molenaar, I. W. (1995). Rasch models - Foundations, recent developments, and applications . New York: SpringerFischer, G. H. Spada, H. (1973). Die psychometrischen Grundlagen des Rorschachtests und der Holtzman Inkblot Technique . Bern: HuberFormann, A. K. (1981). Über die Verwendung von Items als Teilungskriterium für Modellkontrollen im Modell von Rasch. Zeitschrift für Experimentelle und Angewandte Psychologie, 28, 4 541– 560Formann, A. K. Rop, I. (1987). On the inhomogenity of a test compounded of two Rasch homogenous subscales. Psychometrika, 52, 263– 267Gangestad, S. Snyder, M. (1985). “To carve nature at its joints”: On the existence of discrete classes in Personality. Psychological Review, 92, 3 317– 349Glas, C. A. W. Verhelst, N. D. (1995). Testing the Rasch Model. In G. H. Fischer & I. W. Molenaar (Hrsg.), Rasch Models: Foundations, Recent Developments, and Applications (pp. 69-95). New York: SpringerGoodman, L. A. (1975). A new model for scaling response patterns: An application of the quasi-independence concept. Journal of the American Statistical Association, 70, 755– 768Gustafsson, J. E. (1980). Testing and obtaining fit of data to the Rasch model. British Journal of Mathematical and Statistical Psychology, 33, 205– 233Guthke, J. Wiedl, K. H. (1996). Dynamisches Testen: Zur Psychodiagnostik der intraindividuellen Variabilität . Göttingen: HogrefeHilke, R. (1980). Grundlagen normorientierter und kriteriumorientierter Tests . Bern: HuberHosenfeld, L. Strauß, B. Köller, O. (1997). Geschlechtsdifferenzen bei Raumvorstellungsaufgaben - Eine Frage der Strategie?. Zeitschrift für Pädagogische Psychologie, 11, 2 85– 94Jansen, P. G. W. Roskam, E. E. (1986). Latent trait models and dichotomization of graded responses. Psychometrika, 51, 69– 92Kelderman, H. Rijkes, C. P. M. (1994). Loglinear multidimensional IRT models for polytomously scored items. Psychometrika, 59, 149– 176Kempf, W. F. (1974). Dynamische Modelle zur Messung sozialer Verhaltensdispositionen. In W. F. Kempf (Hrsg.), Probabilistische Modelle in der Sozialpsychologie (S. 13-55). Bern: HuberKlauer, K. C. Sydow, H. (1992). Interindividuelle Unterschiede in der Lernfähigkeit: Zur Analyse von Lernprozessen bei Kurzzeitlerntests. Zeitschrift für Differentielle und Diagnostische Psychologie, 3, 175– 190Klauer, K. J. (1972). Zur Theorie und Praxis des binomilen Modells lehrzielorientierter Tests. In K. J. Klauer, R. Frikke, M. Herbig, H. Rupprecht & F. Schott (Hrsg.), Lehrzielorientierte Tests. Düsseldorf: SchwannKöller, O. Rost, J. Köller, M. (1994). Individuelle Unterschiede beim Lösen von Raumvorstellungsaufgaben aus dem IST-70 bzw. IST-70 Untertest “Würfelaufgaben”. Zeitschrift für Psychologie, 202, 65– 85Linacre, J. M. (1989). Many-faceted Rasch measurement . Chicago: MESA PressLunz, M. E. Wright, B. D (1997). Latent Trait Models for Performance Examinations. In J. Rost & R. Langeheine (Eds.), Applications of Latent Trait and Latent Class Models in the Social Sciences. Münster: WaxmannMasters, G.N. (1982). A Rasch model for partial credit scoring. Psychometrika, 47, 149– 174Meiser, T. (1996). Loglinear Rasch Models for the Analysis of Stability and change. Psychometrike, 61, 4 629– 645Meiser, T. Rudinger, G. (1997). Modeling Stability and Regularity of Change: Latent Structure Analysis of Longitudinal Discrete Data. In J. Rost & R. Langeheine (Eds.), Applications of Latent Trait and Latent Class Models in the Social Sciences. Münster: WaxmannMicko, H.-C. (1970). Eine Verallgemeinerung des Meßmodells von Rasch mit einer Anwendung auf die Psychophysik der Reaktionen. Psychologische Beiträge, 12, 4– 22Molenaar, I.W. (1983). Some improved diagnostics for failure of the Rasch model. Psychometrika, 48, 1 49– 72Molenaar, I. W. (1997). Lenient or Strict Application of IRT with an Eye on Practical Consequences. In J. Rost & R. Langeheine (Eds.), Applications of Latent Trait and Latent Class Models in the Social Sciences. Münster: WaxmannMoosbrugger, H. Schermelleh-Engel, K. Klein, A. (1997). Methodological Problems of Estimating Latent Interaction Effects. Methods of Psychological Research - online, MPR 1997 Vol.2 No.2, http://www.hsp.de/mprMüller, H. (1987). A Rasch model for continuous ratings. Psychometrika, 52, 2 165– 81Muraki, E. Carlson, J. E. (1995). Full-Information Factor Analysis for polytomous Item Responses. Applied Psychological Measurement, 19, 1 73– 90Muraki, E. Engelhard, G. (1985). Full-Information Factor Analysis: Applications of EAP Scores. Applied Psychological Measurement, 9, 4 417– 430Pearson, K. (1894). Contributions to the Mathematical Theory of Evolution. Philosophical Transactions of the Royal Society of London, A, 185, 71– 110Rasch, G. (1960). Probabilistic models for some intelligence and attainment tests . Copenhagen: Nielsen & Lydiche (2nd Edition, Chicago, University of Chicago Press, 1980)Rasch, G. (1961). On general laws and the meaning of measurement in psychology . Berkeley: University of California PressRead, T. R. C. Cressie, N. A. C. (1988). Goodness-of-fit statistics for discrete multivariate data . New York: SpringerReckase, M. D. (1997). The Past and Future of Multidimensional Item Response Theory. Applied Psychological Measurement, 21, 1 25– 36Roskam, E. E. (1995). Graded responses and joining categories: A rejoinder to Andrich's “Models for measurement, precision, and nondichotomization of graded responses”. Psychometrika, 60, 1 27– 35Roskam, E. E. Jansen, P. G. W. (1989). Conditions for Raschdichotomizability of the unidimensional polytomous Rasch model. Psychometrika, 54, 317– 333Rost, J. (1982). An Unconditional Likelihood Ratio for Testing Item Homogeneity in the Rasch Model. Education Research and Perspectives, 9, 1 7– 17Rost, J. (1988). Measuring attitudes with a threshold model drawing on a traditional scaling concept. Applied Psychological Measurement, 12, 4 397– 409Rost, J. (1990). Rasch models in latent classes: An integration of two approaches to item analysis. Applied Psychological Measurement, 14, 3 271– 282Rost, J. (1991). A logistic mixture distribution model for polychotomous item responses. The British Journal of Mathematical and Statistical Psychology, 44, 75– 92Rost, J. (1995). Die testdiagnostische Erfassung von Typen. In K. Pawlik (Hrsg.), Bericht über den 39. Kongreß der DGPs in Hamburg (S. 392-393). Göttingen: HogrefeRost, J. (1996). Lehrbuch Testtheorie, Testkonstruktion . Bern: HuberRost, J. Carstensen, C. (1997). Mehrdimensionale Testmodelle und ihre Anwendung in der Leistungsdiagnostik. Unveröffentlichter Projektantrag .Rost, J. Carstensen, C. Davier, M. v. (1997). Applying the Mixed Rasch Model to Personality Questionnaires. In J. Rost & R. Langeheine (Eds.), Applications of Latent Trait and Latent Class Models in the Social Sciences. Münster: WaxmannRost, J. Carstensen, C. Davier, M. v. (1999). Sind die Big Five Rasch-skalierbar?. Diagnostica, 45, 119– 126Rost, J. Davier, M. v. (1995). Mixture distribution Rasch models. In G. Fischer & I. Molenaar (Eds.), Rasch models: Foundations, recent developments, and applications. Berlin: SpringerRost, J. Georg, W. (1991). Alternative Skalierungsmöglichkeiten zur klassischen Testtheorie am Beispiel der Skala “Jugendzentrismus”. Zentral-Archiv-Information, 28,Rost, J. Langeheine, R. (1997). Applications of Latent Trait and Latent Class Models in the Social Sciences . Münster: WaxmannRost, J. Luo, G. (1997). An Application of a Rasch-Based Unfolding Model to a Questionnaire on Adolescent Centrism. In J. Rost & R. Langeheine (Eds.), Applications of Latent Trait and Latent Class Models in the Social Sciences. Münster: WaxmannRost, J. Spada, H. (1983). Die Quantifizierung von Lerneffekten anhand von Testdaten. Zeitschrift für Differentielle und Diagnostische Psychologie, 4, 29– 49Samejima, F. (1969). Estimation of latent ability using a response pattern of graded scores. Psychometrika Special monograph, Monograph Supplement No. 17Spiel, C. (1994). Latent Trait Models for Measuring Change. In Eye, A. v. & Clogg, C. C. (Eds.), Latent Variables Analysis: Applications for Developmental Research. London: SageStegelmann, W. (1983). Expanding the Rasch model to a general model having more than one dimension. Psychometrika, 48, 2 259– 267Stelzl, I. (1979). Ist der Modelltest des Rasch-Modells geeignet, Homogenitätshypothesen zu prüfen? Ein Bericht über Simulationsstudien mit inhomogenen Daten. Zeitschrift für Experimentelle und Angewandte Psychologie, 26, 4 652– 672Steyer, R. Eid, M. (1993). Messen und Testen . Berlin: Springervan den Wollenberg, A. L. (1982a). Two new statistics for the Rasch model. Psychometrika, 47, 123– 140Verhelst, N. D. Glas, C. A. W. (1993). A dynamic generalization of the Rasch model. Psychometrika, 58, 395– 415Verhelst, N. D. Verstralen, H. H. F. M. (1993). A stochastic unfolding model derived from the partial credit model. Kwantitatieve Methoden, 42, 73– 92Wilson, M. Wang, W. (1995). Complex Composites: Issues that Arise in Combining different Modes of Assessment. Applied Psychological Measurement, 19, 1 51– 71