Können neue Erfassungsmethoden alte Probleme der Wohlbefindensmessung lösen?
Item Response Theorie, Itembanking und Computeradaptives Testen am Beispiel der KIDSCREEN-Studie
Abstract
Zusammenfassung. Die meisten der derzeit verfügbaren Mehriteminstrumente zur Erfassung des Wohlbefindens und der gesundheitsbezogenen Lebensqualität sind sehr lang und umfangreich, während kürzere Verfahren oft Einbußen in der Messpräzision bedingen. Die Messungen der unterschiedlichen Verfahren sind darüber hinaus kaum vergleichbar. Diese Nachteile schränken die praktische Anwendbarkeit der Wohlbefindensmessung für wissenschaftliche sowie klinische Untersuchungen ein. Am Beispiel des internationalen KIDSCREEN Projektes wird aufgezeigt, wie moderne Verfahren der Item-Response Theorie (IRT), des Itembanking und des Computer Adaptiven Testens (CAT) zur Lösung der genannten Probleme beitragen können. Die 6 Items der IRT skalierten Skala Psychisches Wohlbefinden des KIDSCREEN-52 Lebensqualitätsinstruments konnten mit weiteren 20 Items von 5 anderen Lebensqualitätsinstrumenten auf eine gemeinsame Metrik kalibriert werden. Die entwickelte Itembank erhöht die Reliabilität der Messung von α = .81 auf α = .92, ermöglicht eine individuelle Diagnostik und die Vergleichbarkeit der Messergebnisse über die Instrumente. Die Itembank kann als Grundlage für einen Computer Adaptiven Test (CAT) psychischen Wohlbefindens verwendet werden.
Abstract. Most of today’s multi-item instruments for the assessment of well-being and health-related quality of life are rather long – whereas shorter instruments often lack measurement precision. Furthermore, the measurement results of the different tools are hardly comparable. These shortcomings hinder the practical application of well-being assessment for clinical and scientific purposes. Exemplified by the international KIDSCREEN project, it is shown how modern methods of item response theory (IRT), item banking, and computer adaptive test (CAT) could help solve these problems. The 6 items of the IRT scaled psychological well-being dimension of the KIDSCREEN-52 Quality of Life instrument and 20 additional items from 5 other quality of life instruments could be calibrated on a common metric. The developed item bank increased measurement precision from α = .81 to α = .92 over a wide range of measurements and enables individual diagnosis and the comparison of measurements results across instruments. The item bank can be used for individual diagnosis as part of a CAT.
Literatur
2003). Using item response theory to calibrate the Headache Impact Test (HIT) to the metric of traditional headache scales. Quality of Life Research, 12, 981–1002.
(2001). Applying the Rasch Model: Fundamental measurement in the human sciences. Mahwah, NJ: Erlbaum.
(1997). . Health Education Research, 12, 385–397.
(2000). Item response theory for psychologists. Mahwah, NJ: Lawrence Erlbaum Associates.
(2005). The promise of PROMIS: Using item response theory to improve assessment of patient-reported outcomes. Journal of Clinical and Experimental Rheumatology, 23, 33–37.
(1950). Theory of mental tests. New York: Wiley.
(2001). LISREL 8: Users’s reference guide. Lincolnwood: Scientific Software International, Inc.
. (1996). The CHQ user’s manual. Boston: The Health Institute, New Medical Center.
(1995). Individual-patient monitoring in clinical practice: Are available health status surveys adequate? Quality of Life Research, 4, 293–307.
(1994). Psychometric theory (3rd ed.). New York, NY: McCraw-Hill.
(2002). Adolescents quality of life, Part II: Initial validation of a new instrument. Journal of Adolescence, 25, 287–300.
(2000). Gesundheitsbezogene Lebensqualität – Konzepte und Maße. Entwicklungen und Stand im Überblick. Bundesgesundheitsblatt – Gesundheitsforschung – Gesundheitsschutz, 43, 165–189.
(2004). Generic health-related quality of life instruments in children and adolescents: A qualitative analysis of content. Journal of Adolescent Health, 34, 37–45.
(1960). Probabilistic models for some intelligence and attainment tests. Copenhagen: Institute for Educational Research.
(2003). Der KINDL-R Fragebogen zur Erfassung der gesundheitsbezogenen Lebensqualität bei Kindern und Jugendlichen – Revidierte Form. In , Diagnostische Verfahren zu Lebensqualität und Wohlbefinden (S. 184–188). Göttingen: Hogrefe.
(2006). Generic health-related quality of life assessment in children and adolescents: methodological considerations. Pharmacoeconomics, 24, 1199–1220.
(2007). The KIDSCREEN-52 Quality of Life measure for children and adolescents: Psychometric results from a cross-cultural survey in 13 European Countries. (2008). Value in Health, 11, 645–658.
(2008). Evaluation of a preliminary physical function item-bank supports the expected advantages of the Patient-Reported Outcomes Measurement Information System (PROMIS). Journal of Clinical Epidemiology, 61, 17–33.
(1995). The adolescent CHIP: A population-based measure of health. Medical Care, 33, 553–566.
(1999). The PedsQLTM: Measurement Model for the Pediatric Quality of Life Inventory. Medical Care, 37, 126–139.
(1998). Measuring health-related quality of life in children: The development of the TACQOL parent form. Quality of Life Research, 7, 457–465.
(2007). Development and evaluation of a computer adaptive test for ’anxiety’ (Anxiety-CAT). Quality of Life Research, 16, 143–155.
(2005). Item response theory and computerized adaptive testing: Implications for outcomes measurement in rehabilitation. Rehabilitation Psychology, 50, 71–78.
(