Skip to main content
Free AccessNachrichten

TBS-DTK-Rezension

Wechsler Intelligence Scale for Children – Fifth Edition (WISC-V)

Published Online:https://doi.org/10.1026/0033-3042/a000580

Wechsler Intelligence Scale for Children – Fifth Edition (WISC-V)

Beschreibung des Tests und seiner diagnostischen Zielsetzung

Die deutschsprachige Adaptation der WISC-V ist ein Einzeltestverfahren zur Erfassung der kognitiven Fähigkeiten von Kindern und Jugendlichen im Alter von 6;0 bis 16;11 Jahren, das keine Parallelform aufweist und sehr gute Deutschkenntnisse der Testperson voraussetzt. Die Zielsetzung umfasst auch die individuelle Beurteilung von Hochbegabung, Intelligenzminderung und kognitiver Stärken und Schwächen.

Für die WISC-V wurde Material aus der Vorgängerversion WISC-IV übernommen, überarbeitet und ergänzt. Es liegen zehn primäre und fünf fakultativ einsetzbare sekundäre Untertests zur Bestimmung von fünf primären („Sprachverständnis“, „Visuell-Räumliche Verarbeitung“, „Fluides Schlussfolgern“, „Arbeitsgedächtnis“, „Verarbeitungsgeschwindigkeit“) und fünf sekundären („Quantitatives Schlussfolgern“, „Auditives Arbeitsgedächtnis“, „Nonverbaler Index“, „Allgemeiner Fähigkeitsindex“, „Kognitiver Leistungsindex“) Indexwerten (IW) vor. Zusätzlich ist die Berechnung eines Gesamt-IQ möglich. Durch Einsatz der zehn primären Untertests (ca. 56 bis 73 Minuten, bei Intelligenzminderung länger) lassen sich Gesamt-IQ, alle primären sowie drei sekundäre IW bestimmen. Für die alleinige Bestimmung des Gesamt-IQ genügen sieben der primären Untertests (ca. 39 bis 56 Minuten). Für bestimmte Untertests können zudem verschiedene Prozesswerte berechnet werden.

Bewertung des Informationsgehalts der Verfahrenshinweise

Die beiliegenden Manuale (Technisches Manual [TM], Durchführungs- und Auswertungsmanual [DAM]) sind sehr umfangreich und enthalten alle notwendigen Informationen zur Durchführung, Auswertung und Interpretation.

Theoretische Grundlagen als Ausgangspunkt der Testkonstruktion

Die WISC-V reiht sich in die Serie derjenigen Intelligenztests ein, die ursprünglich auf Basis des Intelligenzkonzepts von D. Wechsler entwickelt wurden. Während bereits in vorherigen Revisionen Annäherungen an das „Cattell-Horn-Carroll-Modell“ (CHC-Modell) erkennbar waren, bestand ein Ziel der aktuellen Revision in einer weiteren Überarbeitung der theoretischen Grundlagen. Theoretischer Eklektizismus und eine starke Betonung „klinischer Nützlichkeit“ waren dabei das Leitmotiv – und keine stringente Orientierung am CHC-Modell. Eine daraus resultierende substanzielle Änderung gegenüber der WISC-IV ist die Aufspaltung des ehemaligen IW „Wahrnehmungsgebundenes Logisches Denken“ in die beiden IW „Visuell-Räumliche Verarbeitung“ sowie „Fluides Schlussfolgern“. Zudem wurde die Erfassung des Arbeitsgedächtnisses auf visuelle Stimuli erweitert.

Die Korrespondenz zwischen den primären IW und den in etablierten Intelligenzstrukturmodellen (CHC-Modell) konzeptualisierten Fähigkeiten ist allerdings auch in der WISC-V nicht eindeutig. Zwar wird darauf hingewiesen, dass die mit den fünf primären IW erfassten Fähigkeiten „zu den wichtigsten Komponenten der Intelligenz zählen“ (TM, S. 38) und die hierarchische Struktur der Intelligenz mit allgemeiner Intelligenz auf höchster Ebene hinreichend gesichert sei, allerdings bleibt es bei allgemeinen, wenig konkreten Verweisen. Eine explizite theoretische Herleitung oder Fundierung der sekundären IW sowie der Prozesswerte fehlt. Auch hier steht allenfalls das oben genannte Leitmotiv Pate.

Objektivität

Es liegen sehr detaillierte und verständliche Informationen sowie (wortwörtlich vorzulesende) Instruktionen und präzise Handlungsanweisungen für die Durchführung vor. Letztere ist durch die vielen untertestspezifischen Vorgaben, insbesondere bei offenem Antwortformat, sowie das notwendige Protokollieren der Testpersonenantworten sehr komplex. Daher muss insbesondere bei den Aufgaben mit offenem Antwortformat trotz der detaillierten Vorgaben auch nach der empfohlenen umfangreichen Einarbeitung mit Einbußen bezüglich der Durchführungsobjektivität gerechnet werden. Die standardisierte Durchführung und Auswertung werden durch das DAM und den Protokollbogen aber hervorragend unterstützt und erleichtert.

Um den Erfordernissen der Praxis gerecht zu werden, ist das Ersetzen einzelner Untertests und Hochrechnen der Wertpunktsumme zu Recht sehr eingeschränkt und nur bei der Bestimmung des Gesamt-IQ möglich. Normen als Grundlage der Interpretationsobjektivität liegen vor. Die Verwendung von Konfidenzintervallen und kritischen Differenzen wird im DAM beispielhaft gezeigt.

Normierung

Die Erhebung der Normierungsdaten erfolgte in den Jahren 2015 und 2016. Die nach mehreren demografischen Merkmalen (Alter, Geschlecht, Bildung, Migrationshintergrund) geschichtete Stichprobe besteht aus N = 1.087 Kindern und Jugendlichen aus verschiedenen Regionen Deutschlands. Prozentuale Vergleiche der Normierungsstichprobe mit Daten der Bevölkerung aus 2014 hinsichtlich Alter, Geschlecht und Bildung lassen diesbezüglich keine Verzerrungen erkennen. Für die elf Altersgruppen von 6;0 – 6;11 bis 16;0 – 16;11 wurden Stichproben von jeweils n = 100 erreicht.

Tabellen zur Umrechnung der Rohwertsummen je Untertest in Wertpunkte werden für Vier-Monats-Intervalle angegeben. Die Modellierung der Normwerte mittels polynomialer Regression zur Glättung stichprobenspezifischer Unregelmäßigkeiten stellt hierbei einen sinnvollen Ansatz dar. Er wird aber nur lückenhaft beschrieben, sodass unklar ist, ob für dessen zuverlässige Anwendung die Stichprobengrößen ausreichend waren.

Zuverlässigkeit

Für Gesamt-IQ, alle IW, Prozesswerte sowie Untertests liegen Angaben zur internen Konsistenz (Normierungsstichprobe) und Retest-Reliabilität (N max. 94; Zeitintervall: 7 – 116 Tage, M = 26) vor. Nur für die Untertests der „Verarbeitungsgeschwindigkeit“ erfolgte ausschließlich eine Schätzung mit der Retest-Methode. Die gemittelten Koeffizienten der internen Konsistenz liegen über alle Altersgruppen hinweg für die primären IW bei .89 („Verarbeitungsgeschwindigkeit“) bis .93 („Fluides Schlussfolgern“), für die sekundären IW bei .93 bzw. .95 und für den Gesamt-IQ bei .96. Die entsprechenden Retest-Reliabilitäten liegen bei .72 bis .88 für die IW und bei .90 für den Gesamt-IQ. Die Reliabilitäten für die Untertests (Split-Half: .80 – .93; Retest: .73 – .92) und Prozesswerte (Split-Half: .77 – .86; Retest: .78 – .82) fallen vergleichsweise geringer aus. Es liegen weder Reliabilitätsschätzungen für alle laut diagnostischer Zielsetzung vorgesehenen Subgruppen noch für die vielen Diskrepanzvergleiche vor.

Gültigkeit

Unter Verwendung der Normierungsdaten aller 15 Untertests wurden zwölf Modelle mittels konfirmatorischer Faktorenanalyse exploriert, um die faktorielle Validität der primären IW und des Gesamt-IQ zu prüfen. Gewählt wurde eines von mehreren gleich gut fittenden fünffaktoriellen Modellen mit einem Faktor höherer Ordnung, wobei insgesamt vier der primären IW-Faktoren (außer „Verarbeitungsgeschwindigkeit“) eine sehr hohe bis perfekte Ladung auf dem g-Faktor aufweisen. Die geprüften Modelle mit vier Faktoren erster Ordnung weisen ebenfalls einen sehr guten Fit auf. Das gewählte Modell mit fünf Faktoren wurde zusätzlich in fünf Altersgruppen – aber nicht in allen relevanten Subgruppen – geschätzt, wobei eine Invarianzprüfung wünschenswert gewesen wäre. Eine faktorenanalytische Prüfung der sekundären IW fehlt.

Die konvergente Validität wurde durch Schätzung der Zusammenhänge zu WISC-IV, „Wechsler Preschool and Primary Scale of Intelligence III“, „Wechsler Adult Intelligence Scale IV“ und „Kaufman Assessment Battery for Children II“ (KABC-II) untersucht, wobei aufgrund der hohen Überlappungen der Wechsler-Skalen nur die Zusammenhänge zur KABC-II (N = 84) als mögliche Validitätsevidenz gewertet werden können. Die Zusammenhänge weisen „auf eine konvergente Validität der WISC-V hin“ (TM, S. 119), wobei auf Basis des CHC-Modells vereinzelt andere Korrelationsmuster zu erwarten gewesen wären. Diskriminante Validitätsevidenz fehlt. Für die kriteriumsbezogene Validität werden ausschließlich Vergleiche gepaarter Kontrollgruppen mit einer Gruppe Hochbegabter (N = 21) und einer Gruppe mit Intelligenzminderung (N = 25) berichtet, die erwartungskonforme Mittelwertsunterschiede liefern.

Weitere Gütekriterien

Die WISC-V wird bei – eventuell klinisch auffälligen – Kindern und Jugendlichen angewandt, sodass eine Anfälligkeit der Ergebnisse durch aktuelle Zustände der Testperson nicht ausgeschlossen werden kann. Ein valider Schluss auf die kognitiven Fähigkeiten ist nur möglich, wenn z. B. Motivation und Konzentration während der gesamten Testung aufrechterhalten bleiben. Um dies besser gewährleisten zu können, wurde im Rahmen der vorliegenden Revision durch vorgenommene Kürzungen (z. B. Aufgaben- / Untertestanzahl) die Testzeit verringert. Zudem kann es zu einer bewussten Verfälschung der Leistung nach unten kommen (Faking-bad). Faking-good ist ohne näheres Wissen über das Testmaterial nicht möglich. Untersuchungen zur IRT-Skalierung einzelner Untertests werden nicht berichtet.

Abschlussbewertung

Bei der WISC-V handelt es sich um eines der am häufigsten eingesetzten Testverfahren zur Erfassung der kognitiven Fähigkeiten bei Kindern und Jugendlichen, das deutliche Verbesserungen gegenüber der Vorgängerversion aufweist. Die WISC-V zeichnet sich durch umfangreiche Materialien und Manuale aus, die trotz der Komplexität des Verfahrens und der hohen Interaktion mit der Testperson eine weitestgehende Objektivität ermöglichen. Mit den primären IW und dem Gesamt-IQ ist eine überwiegend sehr präzise Schätzung der Ausprägung mehrerer intellektueller Fähigkeiten möglich. Eine explizite Verortung der Fähigkeiten im CHC-Modell mit entsprechender Validitätsevidenz wäre wünschenswert.

Die Ergebnisse der WISC-V-Indizes liefern damit z. B. wichtige Informationen für die Beantwortung pädagogischer und klinischer Fragestellungen. Allerdings erfolgt die Intelligenzbestimmung vergleichsweise bildungsabhängig, wofür vor allem die zum „Sprachverständnis“ gehörenden Untertests verantwortlich sind.

Positiv hervorzuheben sind Verbesserungen im Zusammenhang mit der präsentierten Validitätsevidenz, doch liegen hier weiterhin Einschränkungen vor. So werden mehrere sekundäre IW (und darauf aufbauende Analysen) angeboten, die weder theoretisch fundiert noch faktorenanalytisch begründet sind und deren Interpretation damit nicht hinreichend gesichert ist. Auf Basis der IW und der weniger reliablen Prozesswerte sowie Untertests werden zahlreiche Diskrepanzanalysen angeboten. Es besteht durch deren sehr einfache Durchführung die Gefahr, dass diese unüberlegt und ohne vorherige Hypothesen vollständig vorgenommen werden, was zu fehlerhaften Interpretationen im Hinblick auf mögliche Stärken und Schwächen führen kann.

Diese Testrezension wurde im Auftrag des Diagnostik- und Testkuratoriums der Föderation Deutscher Psychologenvereinigungen (DGPs und BDP) gemäß TBS-DTK (Diagnostik- und Testkuratorium, 2018) erstellt.

Diagnostik- und Testkuratorium (2018). TBS-DTK. Testbeurteilungssystem des Diagnostik- und Testkuratoriums der Föderation Deutscher Psychologenvereinigungen. Revidierte Fassung vom 3. Januar 2018. Report Psychologie, 43, 106 – 113.

Diagnostik- und Testkuratorium (2018). TBS-DTK. Testbeurteilungssystem des Diagnostik- und Testkuratoriums der Föderation Deutscher Psychologenvereinigungen. Revidierte Fassung vom 3. Januar 2018. Psychologische Rundschau, 69‍(2), 109 – 116.

Testinformationen

Wechsler, D. (2017). Wechsler Intelligence Scale for Children – Fifth Edition (WISC-V) (dt. Bearbeitung durch F. Petermann). Frankfurt am Main: Pearson.

Bezugsquelle:https://www.pearsonclinical.de

Gesamtsatz 1.508,00 €, 25 Aufgabenhefte 1 A oder 1B 134,50 €, 25 Aufgabenhefte 2 124,00 €, 25 Protokollbögen 150,50 € (Netto-Preise)

Bitte zitieren Sie diesen Artikel wie folgt: Pisters, M., Schulze, R. & Schmukle, S. C. (2022). TBS-DTK-Rezension: „Wechsler Intelligence Scale for Children – Fifth Edition (WISC-V)“, Psychologische Rundschau, 73, 95 – 97. https://doi.org/10.1026/0033-3042/a000580

Kontakt: Maike Pisters, Bergidsche Universität Wuppertal,