Skip to main content
Free AccessNachrichten

TBS-TK Rezension

K-ABC: Kaufman – Assessment Battery for Children

Published Online:https://doi.org/10.1026/0033-3042/a000101

Allgemeine Informationen über den Test, Beschreibung des Tests und seiner diagnostischen Zielsetzung

Die deutsche Version der K-ABC (Melchers & Preuß, 1991, 2009) gehört zu den gut eingeführten, häufig verwendeten Individualtests der Intelligenz bei Kindern zwischen 2;6 und 12;5 Jahren. Der Tests enthält 15 reguläre, je nach Alter vorzugebende Untertests (UT) sowie den fakultativen UT Lesen und Buchstabieren. Die UT bilden folgende Skalen: Skala intellektueller Fähigkeiten (SIF) mit den Subskalen einzelheitliches Denken (SED, 3 UT) und ganzheitliches Denken (SGD, 7 UT), Fertigkeitenskala (FS, 6 UT), Sprachfreie Skala (NV, 3-5 UT) als Version der SIF für Kinder ab 4 Jahren mit sprachlichen Einschränkungen. Neben der theoretisch fundierten Erfassung der Intelligenz (s.u.) und der Fähigkeit von Kindern, „Informationen aus ihrer kulturellen und schulischen Umgebung zu erlangen und diese adäquat anzuwenden” (Melchers & Preuß, 2009, S. 8), zählt die Herleitung von Fördermaßnahmen zu den diagnostischen Zielen. Die Bearbeitungsdauer liegt zwischen 40 und 90 Minuten (Kindergarten- bzw. Schulalter).

Theoretische Grundlagen als Ausgangspunkt der Testkonstruktion

Die Autoren definieren Intelligenz im Anschluss an A. S. und N. L. Kaufman „als die Art und Weise, in der ein Individuum Probleme löst und Informationen verarbeitet” und damit als „Gewandtheit” bei der Informationsverarbeitung (S. 7). Die wesentliche theoretische Grundlage stellt, aufbauend auf der zerebralen Spezialisationstheorie von Luria (1966) und unter Verweis auf neuropsychologische Befunde (z.B. die duale Kodierungstheorie von Paivio, 1971, 1986), die Differenzierung zwischen „einzelheitlichem” („sequential”) und „ganzheitlichem” („simultaneous”) Denken und den entsprechenden intellektuellen Fähigkeiten dar, die beide der fluiden Intelligenz zugeordnet werden. Das so definierte intellektuelle Problemlösen wird vom erlernten Faktenwissen unterschieden. Die letztere Unterscheidung wird mit Bezug auf Cattell und Horn getroffen, doch werden die Fertigkeiten bzw. das erlernte Faktenwissen nicht wie bei diesen Autoren als kristalline Intelligenz dem Intelligenzkonstrukt zugeordnet.

Objektivität

Die Angaben der Autoren zur Durchführung und Auswertung zeichnen sich durch besondere Klarheit, Genauigkeit und Differenziertheit aus. Die Durchführungs- und Auswertungsobjektivität sind daher als sehr gut zu bezeichnen. Das Interpretationshandbuch bietet ausführliche Hinweise für die Interpretation signifikanter Differenzen zwischen den Skalen und zu Profilinterpretationen (Abweichungen der individuellen UT-Ergebnisse vom Skalenmittelwert, die als individuelle Stärken und Schwächen interpretiert werden und als Basis für die Förderdiagnostik bzw. Anregungen für Fördermaßnahmen dienen; S. 213ff.). Durch die präzisen Interpretationshinweise und instruktiven Fallbeispiele ist die Interpretationsobjektivität, verstanden als regelkonforme Durchführung, gegeben. Allerdings werden Testleitende in diesem Kontext auch mehrfach zu persönlichen, empirisch nicht bestätigten Interpretationen eingeladen, was die Interpretationsobjektivität gefährdet.

Wünschenswert wären Hinweise auf Evaluationsstudien.

Normierung (Eichung)

Die Normierungsstichprobe wurde von 1986–1989 erhoben (91% Zufallsauswahl, N = 3098: 2567 Deutschland ohne DDR, 531 Österreich/Schweiz/Südtirol). Angeboten werden Altersnormen in Dreimonatsintervallen. Die Normen der NV entstammen der Durchführung der kompletten K-ABC. Für die 4 Skalen und die UTs der FS liegen „Standardwerte” (IQ- Normen) vor, für die UTs der Intelligenzskalen Wertpunktnormen. Zum Teil fehlen spezifische Informationen (Vorgehen bei Zufallsauswahl) oder Belege für Aussagen (z.B. Geschlechterunabhängigkeit, Normäquivalenz für NV, Übertragbarkeit auf frühere DDR). Die Normen sind wegen der lange zurückliegenden Normierung nicht aktuell (Möglichkeit des Auftretens eines Flynn-Effektes bzw. des Gegenteils), was von den Autoren aufgrund von rezenteren Studien (Oest 2002, N = 68; Preuß 2006,N = 371 Schweizer Kinder; beide Quellen zitiert nach den Verfahrenshinweisen, S. 94f.) aber relativiert wird. Aufgrund der nicht repräsentativen Stichproben ist die Verallgemeinbarkeit jedoch fraglich. Derzeit ist die K-ABC-II in Arbeit.

Zuverlässigkeit (Reliabilität, Messgenauigkeit)

Split-Half Reliabilitäten pro Altersstufe (odd/even; korr. nach Spearman-Brown): Die Mittelwerte der Reliabilitätskoeffizienten der UTs der SIF variieren (ohne einen Ausreißer) zwischen .69 und .93, jene der FS zwischen .72 und .89. Die Erhebung der Retest-Reliabilität (Intervall 19 Tage, 9;0–12;5-jährige, N = 24) ergab für die UTs .57–.95, die Skalen .84–.97. Die Autoren interpretieren die Korrelationen der UTs mit den Skalen als Nachweis der internen Konsistenz (S. 115): Sie liegen für die Altersgruppen für SED bei .71–.90, SGD .59–.90, FS .71–.86. Konfidenzintervalle werden für UTs und Gesamtskalen angegeben (jedoch fehlen Angaben zu einigen UTs). Für die (Profil-)Interpretation auf UT- und Skalenebene gibt es pro Altersstufe zufallskritische Angaben zu Testwertdifferenzen. Hier sind die z.T. niedrigen UT-Reliabilitäten problematisch. Renner u.a. (2009) ermittelten für 5–6-jährige (sozialpädiatrische Stichprobe) Reliabilitäten der Skalen von .89–.92.

Gültigkeit (Validität)

Validitätsangaben zur deutschen K-ABC basieren auf der Eichstichprobe und einigen weiteren Studien (keine aktuellen). Für alle UTs zeigt sich ein alterskorrelierter Rohwertanstieg. Die Korrelationen mit anderen Intelligenztests liegen je nach Test zwischen .50 bis .80. Die Autoren berufen sich bzgl. der Konstruktvalidität auf die Ergebnisse von Faktorenanalysen (lc S. 117ff.), die mit zwei Ausnahmen die zu erwartenden 3 Faktoren aufzeigen (die Metaanalyse von Ochieng, 2003, ergab meist 3 Faktoren; bei 2er-Lösungen fanden sich die FS-UTs meist in der SED-Skala). Ein konfirmatorischer Nachweis der Faktorstruktur wäre wünschenswert. Für weitere Validitätsaspekte erfolgt vielfach der Verweis auf die Originalfassung, wobei die Übertragbarkeit nicht ausreichend geprüft ist. Zur differentiellen Validität fanden Renner et al. (2009) deutlich bessere Leistungen bei SGD als bei SED bei Kindern mit expressiven und rezeptiven Sprachstörungen. Angaben zur diskriminanten Validität fehlen.

Weitere Gütekriterien (Störanfälligkeit, Unverfälschbarkeit und Skalierung)

Durch die exakten Anweisungen ist die Störanfälligkeit als gering einzuschätzen. Faking-Good ist ohne vorherige Kenntnis des Testmaterials kaum möglich, Faking-Bad wie in jedem Leistungstest jedoch schon. Geringere Leistungen sind bei Auftreten von Demotivation oder Ermüdung beobachtbar. Konzentrationsprobleme können z.B. beim „Zahlennachsprechen” durch die dreimalige Wiederholung von Reihen gleicher Länge auftreten. Im Hinblick auf die Skalierung ist für die deutsche K-ABC nicht angegeben, inwieweit die Verrechnungsvorschriften testtheoretischen Ansprüchen genügen. Für die amerikanische Originalversion wird Rasch-Modellkonformität postuliert, für die deutsche K-ABC jedoch nicht geprüft (lc S. 23f.). Der Altersanstieg der Schwierigkeiten der Items bzw. der die Fähigkeiten repräsentierenden Testleistungen ist aufgrund der Befunde gegeben. Entsprechend dem Testkonzept wurde jedoch keine Eindimensionalität der Subtests angestrebt, sondern „Untertestspezifitäten” berechnet (lc S. 176).

Abschlussbewertung/Empfehlung

Die K-ABC ist ein weitverbreitetes, in der Originalversion stark beforschtes Verfahren zur altersstufenbezogenen Bestimmung der Intelligenz bzw. der lernabhängigen Fertigkeiten. Im Vordergrund der Auswertung steht die Profilinterpretation der Testleistungen, welche diagnostisch sehr ergiebig ausfallen kann. Allerdings sind nicht alle Interpretationshinweise empirisch gestützt wie z.B. die Diagnostik von Impulsivität, Feldabhängigkeit und von (z.T. ungenügend definierten) Konzepten wie „Entwicklung von Strategien” oder „Aufmerksamkeit der Umwelt gegenüber”. Trotz entsprechender Mahnung der Testautoren legt das Handbuch Interpretationen dieser Art nahe, die über den Geltungsbereich des Verfahrens deutlich hinausgehen. Die Darstellung empirischer Untersuchungen ist optimierbar (z.B. genauere Angaben zu Stichproben, Befunden). Im Hinblick auf die theoretische Fundierung des Verfahrens wäre eine stärkere Anbindung an die differenzielle Intelligenzforschung wünschenswert (wieso wird z.B. die FS nicht als Intelligenzmaß verstanden?). Hauptproblem der deutschen K-ABC ist die Nichtberücksichtigung aktueller Untersuchungen.

Diese Testrezension wurde im Auftrag des Diagnostik- und Testkuratoriums der Föderation deutscher Psychologenvereinigungen (DGPs und BDP) gemäß den TBS-TK-Richtlinien (Testkuratorium, 2009, 2010) erstellt.

Testinformationen

Kaufman, A. S. & Kaufman N. L. (Dt. Bearbeitung von P. Melchers und U. Preuß) (2009). K-ABC: Kaufman – Assessment Battery for Children. 8., unveränderte Auflage. Frankfurt: Pearson.

Bezugsquelle: Pearson Assessment & Information GmbH; Baseler Str. 35–37, 60329 Frankfurt/M.

Kaufman Assessment Battery for Children (K-ABC); kompletter Satz, 995,00 EUR, zzgl. 7% UST exkl. Versandkosten. Windows Auswertungsprogramm, Netzversion 215,00 EUR, zzgl. 19% UST exkl.Versandkosten. Windows Auswertungsprogramm, Einzelplatz 180,00 EUR, zzgl. 19% UST exkl.Versandkosten.

Bitte zitieren Sie diesen Artikel wie folgt:

Rollett, B. & Preckel, F. (2011). TBS-TK Rezension: „K-ABC: Kaufman – Assessment Battery for Children.”Psychologische Rundschau, 63, 139–141.