Skip to main content
Free AccessNachrichten

TBS-DTK-Rezension

Wechsler Adult Intelligence Scale – Fourth Edition (WAIS-IV)

Published Online:https://doi.org/10.1026/0033-3042/a000581

Wechsler Adult Intelligence Scale – Fourth Edition (WAIS-IV)

Allgemeine Informationen

Die WAIS-IV ist laut Verlagsangaben das weltweit am häufigsten eingesetzte Testverfahren zur Messung der kognitiven Fähigkeiten von Jugendlichen und Erwachsenen. Seitens der Testautoren wird die Intelligenztestbatterie u. a. für die Diagnostik von Lernstörungen und Hochbegabung empfohlen. Für die Durchführung werden im Einzelsetting zehn bis 15 Untertests in Interaktion mit der Testleitung bearbeitet, wobei die durchschnittliche Bearbeitungsdauer der Kernbatterie 65 bis 70 Minuten beträgt; Teilkomponenten können isoliert gemessen und ausgewertet werden.

Zu den zentralen Neuerungen gehört der konsequente Verzicht auf eine Auswertung nach Verbal- und Handlungs-IQ. Dies hat sich bereits in der Vorgängerversion abgezeichnet, in der erstmals die Differenzierung eines Gesamt-IQ in vier Indizes verwendet wurde („Sprachverständnis“ [SV], „Wahrnehmungsgebundenes Logisches Denken“ [WLD], „Arbeitsgedächtnis“ [AG], „Verarbeitungsgeschwindigkeit“ [VG]). Zusätzlich wurde der „Allgemeine Fähigkeitsindex“ (AFI) konstruiert, der aus den Indizes SV und WLD besteht und im höheren Alter eine bessere Differenzierbarkeit als der Gesamt-IQ gewährleisten soll. Für weitere Aussagen über das individuelle Leistungsprofil werden optionale Auswertungsstrategien auf Ebene von Indizes und Untertests angeboten (z. B. Diskrepanzvergleiche, Prozesswerte).

Theoretische Grundlagen als Ausgangspunkt der Testkonstruktion

Die Wechsler-Intelligenztests sind Verfahren mit langer Tradition und umfangreicher Begleitforschung. Den gegenteiligen Zielsetzungen einer Revision, den aktuellen Forschungsstand zu berücksichtigen und gleichzeitig den „Markenkern“ eines Tests zu bewahren, wurde bei der WAIS-IV dadurch begegnet, dass die bekannten Untertests größtenteils beibehalten wurden, jedoch deren „Verrechnung“ angepasst wurde. Die im Manual vorgeschlagene, faktoranalytisch gewonnene Aufteilung der Untertests in vier Intelligenzfaktoren orientiert sich nun an neueren Intelligenzstrukturmodellen, ohne diese jedoch konsequent umzusetzen. So werden beispielsweise im Index WLD sowohl Aufgaben zur visuellen Verarbeitung als auch zur fluiden Intelligenz zusammengefasst. Unter den möglichen faktoranalytischen Auswertungen erscheint eine von Benson et al. (2010) für das amerikanische Original vorgeschlagene, im Einklang mit dem prominenten „Cattell-Horn-Carroll-Modell“ (CHC-Modell) stehende, fünfdimensionale Lösung besonders vielversprechend. Dass im Manual der WAIS-IV entsprechende Auswertungen und Überlegungen fehlen, erschwert die Vergleichbarkeit mit anderen Intelligenztests.

Objektivität

Es liegen standardisierte, sehr detaillierte Instruktionen für die Durchführung, Auswertung und Interpretation der WAIS-IV vor, die zur Objektivität des Verfahrens beitragen. Die Durchführung erfordert eine gründliche Einarbeitung, etwa für Ad-hoc-Leistungsbewertungen im Testungsverlauf, sodass die Durchführungsobjektivität auch von Qualifikation und Erfahrung der Testleiterin bzw. des Testleiters abhängt. Die Beurteilung der verbalen Antworten gewährt trotz detaillierter Auswertungshinweise einen gewissen Spielraum, was zulasten der Auswertungsobjektivität gehen kann. Dem wird jedoch durch viele Beurteilungsbeispiele entgegengewirkt. Angaben zur Interrater-Übereinstimmung fehlen im Manual. Eine hohe Interpretationsobjektivität wird durch standardisierte Normwerte und Vorgaben für die inhaltliche Interpretation der Testergebnisse gewährleistet.

Normierung

Für die deutschsprachige Normierung wurde im Jahr 2012 eine für Einzeltestungen recht umfangreiche Eichstichprobe von N = 1.425 Personen zwischen 16 und 89 Jahren untersucht, die – nach Angabe der Testautoren – bzgl. Geschlecht, Schulabschluss, Migrationshintergrund und regionaler Verteilung repräsentativ für die deutsche Bevölkerung sein soll. Die nach Altersgruppen stratifizierten Vergleichsnormen (in unterschiedlich breiten Altersbändern) beruhen weitestgehend auf Stichproben zwischen 100 und 150 Personen. Die Normen für Personen über 75 Jahren liegen jedoch deutlich darunter, weshalb die Präzision hier eingeschränkt sein dürfte. Nach Geschlecht oder Bildungsabschluss getrennte Normen sind nicht vorhanden.

Zuverlässigkeit

Die internen Konsistenzen in der Gesamtnormstichprobe liegen im sehr guten Bereich für den Gesamt-IQ (Cronbachs α = .98), die Indizes (α = .90 – .97) und den AFI (α = .97) sowie weitestgehend im guten Bereich für die Untertests, wobei die Werte der drei geschwindigkeitsbasierten Untertests die Retest-Reliabilitäten einer Teilstichprobe (n = 166) darstellen (α bzw. rtt = .81 – .93; mit Ausnahme des optionalen Durchstreichtest, rtt = .78). Für die einzelnen oben genannten Altersgruppen liegen die Werte teilweise niedriger, insgesamt aber im akzeptablen bis sehr guten Bereich (Untertests: α = .71 – .95; Indizes: α = .86 – .97; IQ: α = .97 – .98; AFI: α = .96 – .98). Die Testwiederholungsmessung (n = 166) mit einem durchschnittlichen Zeitintervall von 34 Tagen zeigte eine sehr hohe Stabilität für Gesamt-IQ (rtt = .95) und Indizes (rtt = .84 – .93). Die in vier Altersgruppen getrennt berechneten Werte fallen ähnlich aus, basieren jedoch auf teils kleinen Stichproben, insbesondere für die älteste Gruppe der 70- bis 89-Jährigen (n = 24).

Für Indizes, Untertests und Prozesswerte lassen sich über Konfidenzintervalle und kritischen Differenzen zufallskritische Absicherungen der Testergebnisse in einem Stärken-Schwächen-Profil ermitteln. Zu kritisieren ist, dass für eine Bewertung der Differenzierungsfähigkeit in unterschiedlichen Bereichen des Leistungsspektrums ausführliche Informationen zu den Test- und Itemkennwerten aus der Normstichprobe fehlen (z. B. Itemschwierigkeiten, Verteilung der aggregierten Werte) und dass für die verschiedenen Auswertungsmöglichkeiten (Gesamt-IQ, Indizes, Prozesswerte sowie Untertest-Scores) keine klaren Indikationen existieren.

Gültigkeit

Für die deutsche Adaptation der WAIS-IV liegen bislang nur vereinzelt Validitätsbelege vor; belastbare Untersuchungen mit umfangreicheren deutschsprachigen klinischen Stichproben fehlen. Die umfangreicheren Befunde zur englischsprachigen Version sind insbesondere für die Untertests des Index „Sprachverständnis“ wegen der Kultur- und Sprachlastigkeit nicht übertragbar. Die von Expertinnen und Experten eingeschätzte Inhaltsvalidität des Verfahrens ist gegeben. Hinsichtlich der faktoriellen Validität bevorzugen die Autoren (wie im amerikanischen Original) ein Modell höherer Ordnung mit den vier Indizes als Faktoren erster Ordnung. Als Konstruktvaliditätsbeleg werden erwartungskonforme Zusammenhänge zwischen den Indizes und dem Gesamt-IQ der deutschsprachigen WAIS-IV auf der einen und Gedächtnisleistungen mittels „Wechsler Memory Scale-IV“ (WMS-IV; Petermann & Lepach, 2012) und dem Modul „Exekutive Funktionen“ der „Neuropsychological Assessment Battery“ (NAB; Petermann et al., 2016) auf der anderen Seite berichtet. Zum Nachweis der Kriteriumsvalidität listen die Autoren erwartungskonforme Mittelwertdifferenzen auf den Indexwerten zwischen einer Kontrollgruppe und je kleinen Stichproben von Menschen mit Hochbegabung (n = 19), Intelligenzminderung (n = 53), ADHS (n = 116) oder Schlaganfallhistorie (n = 107).

Weitere Gütekriterien

Wie bei allen Leistungstests sind auch bei der WAIS-IV mögliche Einflüsse der Umgebung oder situativer Zustände der Testperson (Motivation, Ermüdungserscheinungen etc.) auf die Testergebnisse zu berücksichtigen. Eine Verhaltensbeobachtung im Rahmen einer Einzeltestung kann hier wertvolle Hinweise liefern, jedoch sind Zeitaufwand und Informationsgewinn in einem Kosten-Nutzen-Verhältnis gegeneinander abzuwägen. Die Option, gemäß Fragestellung nur Teilkomponenten zu untersuchen, bietet dabei eine gewisse Flexibilität und verringert die Testdauer. Zur Zumutbarkeit tragen abwechslungsreiche Aufgaben, überarbeitete Abbruchregeln und die Modularisierung bei. Ein Faking-bad ist bei der WAIS-IV ohne Weiteres möglich; Faking-good hingegen nur durch zielgerichtetes Üben. Paralleltestversionen existieren nicht. Erweiterte Instruktionen für die Testung von Personen mit bestimmten Einschränkungen (Hörschädigungen, motorische Einschränkungen, Sehschwäche) sollen die Testfairness erhöhen.

Abschlussbewertungen

Zur hohen Verfahrensakzeptanz der WAIS-IV tragen die internationale Verbreitung, die jahrzehntelange Historie und Begleitforschung und die abwechslungsreichen Aufgabentypen bei. Allerdings stellen diese Pluspunkte auch zugleich die größten Schwächen des Verfahrens dar: Adaptionen in andere Sprachen bedürfen empirischer Belege bzw. Anpassungen (z. B. bzgl. des Untertests „Allgemeines Wissen“). Die Aktualisierung der Aufgabentypen erfolgt nur punktuell und das Konstruktionsrational des Tests orientiert sich nicht primär an aktuellen Intelligenztheorien, sondern an den Inhalten der bestehenden Untertests. Zu begrüßen ist jedoch, dass mit der WAIS-IV nun endgültig die messtheoretisch nicht haltbare Aufteilung in Verbal- und Handlungs-IQ der vorhergehenden Versionen aufgegeben wurde.

Als ähnlich kompromisshaft sind auch andere Aspekte des Verfahrens zu bewerten. So tragen die detaillierten Anwendungsinstruktionen zur Standardisierung und Objektivität bei, stellen aber auch erhöhte Anforderungen an die Testleitung. Das verstärkte Augenmerk auf Menschen im höheren Lebensalter ist positiv hervorzuheben, jedoch wäre eine bessere Abdeckung in der Normstichprobe wünschenswert, um so präzisere Schätzungen zu ermöglichen. Auch mangelt es für eine Anwendungsempfehlung für den AFI im höheren Alter an theoretischer Fundierung und empirischen Validitätsbelegen.

Mit der WAIS-IV lassen sich vielfältige für die Einzelfalldiagnostik relevante Intelligenzkomponenten messen und – im Vergleich zu konkurrierenden Verfahren – für die meisten Altersgruppen auch mit soliden Normwerten vergleichen. Die hohen Reliabilitätswerte sprechen für eine zuverlässige Messung auf Ebene des Gesamt-IQ und der Indizes. Um die Anschlussfähigkeit an die moderne Intelligenzforschung weiterhin zu gewährleisten sowie valide Rückschlüsse im klinischen Anwendungskontext zu erlauben, sollten der Kurs der behutsamen Anpassung des Aufgabenspektrums und zumindest für den deutschsprachigen Kontext auch die Validierungsbemühungen weiterverfolgt werden.

Formalisierte Bewertung

Diese Testrezension wurde im Auftrag des Diagnostik- und Testkuratoriums der Föderation Deutscher Psychologenvereinigungen (DGPs und BDP) gemäß TBS-DTK (Diagnostik- und Testkuratorium, 2018) erstellt.

Diagnostik- und Testkuratorium (2018). TBS-DTK. Testbeurteilungssystem des Diagnostik- und Testkuratoriums der Föderation Deutscher Psychologenvereinigungen. Revidierte Fassung vom 3. Januar 2018. Report Psychologie, 43 (3), 106 – 113.

Diagnostik- und Testkuratorium (2018). TBS-DTK. Testbeurteilungssystem des Diagnostik- und Testkuratoriums der Föderation Deutscher Psychologenvereinigungen. Revidierte Fassung vom 3. Januar 2018. Psychologische Rundschau, 69‍(2), 109 – 116.

Testinformationen

Wechsler, D. (2012). Wechsler Adult Intelligence Scale – Fourth Edition (WAIS-IV) (deutschsprachige Adaptation durch F. Petermann). Frankfurt am Main: Pearson.

Bezugsquelle:https://www.pearsonclinical.de

Gesamtsatz, 25 Aufgabenhefte 1 A oder 1B, 25 Aufgabenhefte 2, 25 Protokollbögen, Auswertungsschablonen, Koffer: 1.308 Euro (Netto)

Bitte zitieren Sie diesen Artikel wie folgt: Gewehr, E., Molz, G. & Schroeders, U. (2022). TBS-DTK-Rezension: „Wechsler Adult Intelligence Scale – Fourth Edition (WAIS-IV)“, Psychologische Rundschau, 73, 92 – 94. https://doi.org/10.1026/0033-3042/a000581

Kontakt: Elsa Gewehr, Universität Kassel,

Literatur

  • Benson, N., Hulac, D. M. & Kranzler, J. H. (2010). Independent examination of the Wechsler Adult Intelligence Scale—Fourth Edition (WAIS-IV): What does the WAIS-IV measure? Psychological Assessment, 22 (1), 121 – 130. First citation in articleCrossrefGoogle Scholar