Vertiefende Analysen zu migrationsbedingten Leistungsdifferenzen in Leseaufgaben
Differentielles Itemfunktionieren für Kinder mit und ohne Migrationshintergrund auf Basis der Internationalen Grundschul-Lese-Untersuchung (IGLU)*
Abstract
Schulleistungsstudien zeigen für verschiedene Altersstufen und Kompetenzbereiche absolute Leistungsrückstände bei Kindern mit im Vergleich zu Kindern ohne Migrationshintergrund. Ausgehend von der Annahme, dass die betrachteten Schülergruppen in ihren Lesekompetenzen unterschiedliche Profile aufweisen, untersucht der vorliegende Beitrag anhand der Lesetestaufgaben von IGLU 2001 mit differentiellen Item-Analysen, ob bei Kontrolle von Fähigkeitsunterschieden subgruppenspezifische Differenzen in den Lösungswahrscheinlichkeiten bestimmter Itemgruppen bestehen. Die Befunde weisen auf relative Stärken und Schwächen beider Schülergruppen in Abhängigkeit vom Antwortformat der Aufgaben, nicht jedoch von der Textgattung hin. Die Ergebnisse werden mit Blick auf mögliche Handlungsansätze im schulischen Kontext diskutiert.
School achievement studies show achievement gaps between students with and without a migration background in various age groups and areas of competence. Moreover, differences in reading competency profiles between these subgroups are assumed. Based on the PIRLS reading items 2001, Differential Item Functioning analyses were conducted to investigate potential subgroup-specific differences regarding the probability of correctness for specific item sets. The findings indicate relative strengths and weaknesses depending on item format but not on text genre. The results are discussed with respect to potential consequences for educational processes.
Literatur
(1993). Perspectives on differential item functioning methodology. In P. W. Holland & H. Wainer (Eds.), Differential Item Functioning (pp. 3–23). Hillsdale: Lawrence Erlbaum Associates.
(2004). Zur Vergleichbarkeit bei Leseaufgaben unterschiedlichen Ursprungs. Zeitschrift für Pädagogische Psychologie , 18, 171–185.
(2008). Chi-square statistics with multiple imputation. Technical appendix . Los Angeles: Muthén & Muthén.
(2003). Erste Ergebnisse aus IGLU. Schülerleistungen am Ende der vierten Jahrgangsstufe im internationalen Vergleich. Münster: Waxmann.
(Hrsg.).(2012). IGLU 2011: Lesekompetenzen von Grundschulkindern in Deutschland im internationalen Vergleich. Münster: Waxmann.
(Hrsg.).(2000). Language, power and pedagogy: Bilingual children in the crossfire. Clevedon: Multilingual Matters LTD.
(2011). The estimation of item response models with the lmer function from the lme4 package in R. Journal of Statistical Software , 39, 1–28 .
et al.(2008). Sprache als Barriere für den schulischen Erfolg. Potentielle Schwierigkeiten beim Erwerb schulbezogener Sprache für Kinder mit Migrationshintergrund. Münster: Waxmann.
(2009). Texte, Gattungen, Textsorten und ihre Verwendung in Lesebüchern. Unveröffentlichte Dissertation. Justus-Liebig-Universität Gießen, Gießen.
(2010). Bildungssprache und Durchgängige Sprachbildung. In S. Fürstenau & M. Gomolla (Hrsg.), Migration und schulischer Wandel: Mehrsprachigkeit (S. 107–127). Wiesbaden: VS Verlag für Sozialwissenschaften.
(2013). Second language learners' performance in mathematics: Disentangling the effects of academic language features. Learning and Instruction , 28, 24–34.
(2011). Modellierung von Kompetenzen im Bereich ‹Sprache und Sprachgebrauch untersuchen› mit schwierigkeitsbestimmenden Aufgabenmerkmalen. Zeitschrift für Entwicklungspsychologie und Pädagogische Psychologie , 43, 186–199.
(2013, August). A central feature of bilingual language development: The receptive-expressive gap. Vortrag auf der Tagung der European Association of Learning and Instruction. München, Deutschland.
(2013). TAM: test analysis modules. R package version 0.7–35. Zugriff am 24.09.2013 von CRAN.R-project.org/package=TAM.
(2009). Accommodations for English language learners taking large-scale assessments: a meta-analysis on effectiveness and validity. Review of Educational Research , 79, 1168–1201.
(2010). PISA 2009. Bilanz nach einem Jahrzehnt. Münster: Waxmann.
et al. (Hrsg.).(2013). Examining differential item functioning trends for English language learners in a reading test: A meta-analytical approach. Manuscript submitted for publication.
(2009). Gender gap in comparative studies of reading comprehension: To what extent do the test characteristics make a difference? European Educational Research Journal , 8, 69–79.
(1995). DIF data on free-response SAT I mathematical items (ETS Rep. No. ETS-RR-95-22). Princeton, NJ: Educational Testing Service.
(2005, April). Exploring item characteristics associated with DIF in reading comprehension between English language learners (ELLs) and non-ELLs. Vortrag auf dem Annual Meeting der National Council on Measurement in Education. Montreal, Canada.
(2007). PIRLS 2006 technical report. Chestnut Hill, MA: International Study Center, Boston College.
(2009). Linguistic complexity, schematic representations, and differential item functioning for English language learners in math tests. Educational Assessment , 14, 160–179.
(1992). Estimating population characteristics from sparse matrix samples of item responses. Journal of Educational Measurement , 29, 133–161.
(1980). Social aspects of meaning in oral and written language. In D. R. Olson (Eds.), The social foundations of language and thought. Essays in honor of Jerome S. Bruner (pp. 90–108). New York: Norton & Company.
(2011). Mean effects of test accommodations for ELLs and non-ELLs: A meta-analysis of experimental studies. Educational Measurement: Issues and Practice , 30, 10–28.
(2013). R: A language and environment for statistical computing. Wien: R Foundation for Statistical Computing.
(2010). Multiple-choice versus open-ended response formats of reading test items: A two-dimensional IRT analysis. Psychological Test and Assessment Modeling , 52, 354–379.
(2002). Lesekompetenz: Prozessebenen und interindividuelle Unterschiede. In N. Groeben & B. Hurrelmann (Hrsg.), Lesekompetenz: Bedingungen, Dimensionen, Funktionen (S. 25–58). Weinheim: Juventa.
(2003). Construct equivalence of multiple-choice and constructed-response items: A random effects synthesis of correlations. Journal of Educational Measurement , 40, 163–184.
(1987). Multiple imputation for nonresponse in surveys . New York: Wiley.
(2012). The relation of home language and literacy to three-year-old children's emergent academic language in narrative and instruction genres. The Elementary School Journal , 112, 419–444.
(2004). The language of schooling. A functional linguistics perspective. Mahwah, NJ: Erlbaum.
(1990). Expert knowledge, general abilities and test processing. In W. Schneider & F. E. Weinert (Eds.), Interactions among aptitudes, strategies, and knowledge in cognitive performance (pp. 286–302). Berlin: Springer.
(2006). Was geschieht im Kopf des Lesers? Mentale Konstruktionsprozesse beim Textverstehen aus der Sicht der Psychologie und der kognitiven Linguistik. In H. Blühdorn, E. Breindl & U. H. Waßner (Hrsg.), Text-Verstehen: Grammatik und darüber hinaus (S. 222–238). Berlin: de Gruyter.
(2004). Lesen Mädchen anders? Vertiefende Analysen zu Geschlechtsdifferenzen auf Basis der Internationalen Grundschul-Lese-Untersuchung IGLU. Zeitschrift für Erziehungswissenschaft , 7, 219–234.
(2006). The impact of language characteristics in mathematics test items on the performance of English language learners and students with disabilities. Educational Assessment , 11, 105–126.
(1984). Does the testing method make a difference? The case of reading comprehension. Language Testing , 1, 147–170.
(2009). Schreiben von Kindern im diachronen Vergleich: Texte von Viertklässlern aus den Jahren 1972 und 2000. Münster: Waxmann.
(2011). Ethnic DIF in reading tests with mixed item formats. Educational Assessment , 16, 35–68.
(1993). On the equivalence of the traits assessed by multiple-choice and constructed response tests. In R. E. Bennett & W. C. Ward (Eds.), Construction versus choice in cognitive measurement: Issues in constructed-response, performance testing, and portfolio assessment (pp. 29–44). Hillsdale, NJ: Lawrence Erlbaum.
(2005). Linguistic sources of item bias for second generation immigrants in Dutch tests. Language Testing , 22, 211–234.
(2011). MICE: Multivariate imputation by chained equations in R. Journal of Statistical Software , 45, 1–67.
(1983). Strategies of discourse comprehension. New York: Springer.
(1997). Gender and fair assessment. Mahwah, NJ: Lawrence Erlbaum Associates.