Skip to main content
Open AccessOriginalarbeit

Erstellung und Validierung einer Kurzversion des Fragebogens zur Erfassung aversiver und protektiver Kindheitserfahrung (APK-18)

Eine Anwendung des Ant Colony Optimization (ACO) Algorithmus

Published Online:https://doi.org/10.1026/0012-1924/a000276

Abstract

Zusammenfassung. Die Erfassung von Kindheitserfahrungen stellt einen wichtigen Baustein für Verständnis und Behandlung psychischer Belastungen im Erwachsenenalter dar. Dabei kommt der Erfassung protektiver Kindheitserfahrungen neben etablierten aversiven Erlebnissen eine wachsende Bedeutung zu. Ziel der vorliegenden Studie ist die Erstellung einer validen, reliablen und zeitökonomischen Kurzform des Fragebogens zur Erfassung aversiver und protektiver Kindheitserfahrungen (APK). Mithilfe des Ant-Colony Optimization (ACO) Algorithmus wurden an einer klinisch-psychotherapeutischen Stichprobe (n = 701) aus den 59 Items der Langversion ein Set von 18 Items identifiziert und an einer nicht-klinischen Stichprobe (n = 643) validiert. Die Kurzversion (APK-18) zeigte gute Reliabilität und Validität und unterschied anhand latenter Mittelwertunterschiede zuverlässig zwischen klinischen und nicht-klinischen Teilnehmenden. Einschränkungen bezüglich der Reliabilität ergaben sich bei 2 der insgesamt 8 Sub-Skalen, „Sonstige traumatische Ereignisse“ und „Trennungserfahrungen“. Mit der Kurzversion APK–18 liegt ein ökonomisches und valides Messinstrument vor, welches in klinische Routineerhebungen integriert werden kann.

Development and Validation of the Short-Form of the Questionnaire for the Assessment of Adverse and Protective Childhood Experiences (APC)

Abstract. The assessment of childhood experiences is an essential element for understanding and treating subsequent mental health issues during adulthood. In addition to established adverse events, the assessment of protective childhood experiences becomes increasingly important. The present study develops and validates an efficient, reliable, and valid short form of the Questionnaire for the Assessment of Adverse and Protective Childhood Experience (APC). Applying ant colony optimization (ACO) algorithms, we identified a set of 18 out of the 59 items of the long version in a clinical sample (n = 701) and validated this item set in a nonclinical sample (n = 643). The APC-18 short form yielded good reliability and validity indices, and reliably distinguished between clinical and nonclinical participants in terms of latent mean differences. The two subscales “other traumatic events” and “separation experience” showed lower reliability, demanding a more cautious interpretation. The APC-18 short form is a timesaving and valid instrument that can be implemented in routine clinical assessments.

Aversive Kindheitserfahrungen zeigen studienübergreifend stabile Zusammenhänge mit psychischen, aber auch körperlichen Erkrankungen im Erwachsenenalter (Felitti et al., 1998; Wingenfeld et al., 2010). Zu aversiven Kindheitserfahrungen werden klassischerweise körperlicher, sexueller und emotionaler Missbrauch sowie körperliche und emotionale Vernachlässigung gezählt. Neben dieser engeren Definition existieren eine Reihe weiterer ungünstiger Bedingungen wie z.B. Ausgrenzungs-, Verlust- und Trennungserfahrungen und Zeugenschaft von Gewalterlebnissen, die oftmals mit erheblichen Herausforderungen für die individuelle Entwicklung einhergehen (Finkelhor, Shattuck, Turner & Hamby, 2013). Die Prävalenz aversiver Kindheitserfahrungen in internationalen und deutschsprachigen Studien liegt je nach Untersuchungsmethode zwischen 10–50% (Häuser, Schmutzer, Brähler & Glaesmer, 2011; Kessler et al., 2010; Merrick, Ford, Ports & Guinn, 2018). Der negative Einfluss aversiver Kindheitserfahrungen auf die spätere psychische und somatische Gesundheit gilt als empirisch gesichert (Chapman et al., 2004; Dube, Anda, Felitti, Edwards & Croft, 2002; Felitti et al., 1998; Varese et al., 2012; Wegman & Stetler, 2009). Zunehmend gewinnt neben der Erfassung aversiver Kindheitserfahrungen die Untersuchung protektiver Erfahrungen als eigenständiger Einflussfaktor auf späteres körperliches und emotionales Wohlbefinden an Bedeutung, wie z.B. der Wirkung verlässlicher Bindungserfahrung (Afifi & Macmillan, 2011; Ehrenthal, Stoffel & Ditzen, 2019; Ehrenthal, Schauenburg, Wagner, Dinger & Volz, 2020; Sroufe, Egeland & Carlson, 1999). Allerdings werden positive Kindheitserfahrungen besonders im klinischen Kontext meist weder systematisch noch im Zusammenhang mit aversiven Kindheitserfahrungen erfasst, sondern häufig im Sinne eines „Entweder-Oder“.

Fragebögen sind essenziell für die Erfassung (aversiver) Kindheitserfahrungen und werden neben retrospektiven Daten (z.B. Gerichts- oder Gesundheitsakten) und interviewbasierten Methoden am häufigsten verwendet (Hardt & Rutter, 2004). Einer der am häufigsten verwendeten Fragebogen ist der Childhood Trauma Questionnaire (CTQ; Bernstein et al., 2003; Wingenfeld et al., 2010). Die ursprünglich 70 Items umfassende Langversion des CTQ (Bernstein, Ahluvalia, Pogge & Handelsman, 1997) wurde um eine Kurzversion mit 28 Items (Bernstein et al., 2003) ergänzt. Sowohl Kurz- als auch Langversion des CTQ decken in ihrer Faktorstruktur die engere Definition aversiver Kindheitserfahrungen ab, wobei für die Kurzversion diese Faktorstruktur trotz uneindeutiger Befunde beibehalten wurde (Bernstein et al., 1997; Dudeck et al., 2015; Spinhoven et al., 2014). Dem CTQ wurde von unserer Arbeitsgruppe ein deutschsprachiges Erfassungsinstrument gegenübergestellt: der Fragebogen zur Erfassung aversiver und protektiver Kindheitserfahrungen (APK; Ehrenthal et al., 2020). Der APK hat zum Ziel, einige Limitationen des CTQ zu adressieren: Erstens erlaubt der APK die systematische und parallele Erfassung protektiver Kindheitserfahrungen, und trägt so deren wachsender Bedeutung Rechnung. Zweitens soll das Spektrum der erfassten aversiven Kindheitserfahrungen um relevante Bereiche wie z.B. Trennungs- oder Verlusterfahrungen erweitert werden. Dies hat das Ziel, eine umfassendere und für das Verständnis von psychischer Gesundheit bedeutsamere Erhebung aversiver Kindheitserfahrungen zu ermöglichen (Finkelhor et al., 2013). Zusätzlich erlaubt der APK über zwei (optionale) Textfelder die Beschreibung und zeitliche Eingrenzung sexueller und anderer traumatischer Erfahrungen. Drittens erfasst der APK die von Patientinnen und Patienten heute wahrgenommene emotionale Beeinträchtigung durch die berichteten Kindheitserfahrungen. Die Grundidee des APK ist, durch die breitere Erhebung aversiver Kindheitserfahrungen und der zusätzlichen Erfassung protektiver Kindheitserfahrungen ein vollständigeres Bild für die Therapieplanung und prognostische Risikoeinschätzung zu ermöglichen. Die Langversion des APK wurde anhand einer teil- und vollstationären klinischen Stichprobe validiert (Ehrenthal et al., 2020). Über alle Skalen gemittelt zeigte sich für den APK dabei eine hohe interne Konsistenz (Cronbachs α = .80), wobei jene Skalen, die mit dem Referenzinstrument CTQ korrespondierten, eine hohe Reliabilität (Range: Cronbachs α = .91 – .96) aufwiesen. Bei Skalen, die teilweise bewusst ein heterogenes Konstrukt und damit die breitere Definition von Kindheitserfahrungen erfassen sollen (z.B. sonstige traumatische Ereignisse), zeigte sich die zu erwartende größere Bandbreite der internen Konsistenz (Range: Cronbachs α = .55 – .96; vgl. Ehrenthal et al., 2020, S. 210). Zudem zeigten sich die erwarteten starken Zusammenhänge zum CTQ, sowohl für aversive Kindheitserfahrungen als auch für protektive Kindheitserfahrungen. Die negativen Korrelationen zwischen protektiven Kindheitserfahrungen und CTQ blieben auch dann bestehen, wenn die Interkorrelation zwischen negativen und protektiven Kindheitserfahrungen statistisch kontrolliert wurde. Dies betont die Wichtigkeit, protektive Kindheitserfahrungen separat zu erfassen, da sie nicht nur eine Abwesenheit von negativen Kindheitserfahrungen darstellen. Außerdem trennten die APK-Skalen (jeweils für aversive als auch für protektive Kindheitserfahrungen) zuverlässig zwischen voll- und teilstationären Patientinnen und Patienten und zeigten bedeutsame Zusammenhänge zu klinischen Außenkriterien wie Bindung und aktueller Depressivität (Ehrenthal et al., 2020).

Während die Langversion des APK mit 59 Items eine umfassendere Diagnostik ermöglicht, begrenzt die derzeitige Länge des Instruments den Einsatz in Settings mit bestehenden und häufig umfangreichen Diagnostik-Batterien (z. B. stationäre Settings, Primärversorgung oder Beratungsstellen). Die Länge der APK-Kurzversion soll daher von 59 auf 18 Items bzw. von derzeit 15 auf ca. 5 Minuten reduziert werden, um so dem Bedarf einer Minimierung der zeitlichen und emotionalen Belastung der Teilnehmenden Rechnung tragen (Leite, Huang & Marcoulides, 2008). Zu den 18 Items zählen 2 Items, welche aus der Langversion aufgrund ihrer Wichtigkeit für die Therapieplanung und klinische Arbeit übernommen werden, aber nicht zu den (Sub-)Skalen zählen: (1) das Vorhandensein vager Erinnerung an sexuellen Missbrauch (Ja / Nein) und (2) die heutige Belastung durch die Kindheitserfahrungen (Likert-Skala: 1–5). Die verbleibenden 16 Items sollen die einzelnen Aspekte von Kindheitserfahrungen, die im APK systematisiert wurden, jeweils gleichwertig und sparsam abbilden, um ein möglichst umfassendes Bild relevanter Kindheitserfahrungen zu erfassen. Vor dem Hintergrund, dass die Erfassung von Kindheitserfahrungen besonders im Zusammenhang mit anderen (klinischen) Aspekten wie z.B. Depressivität, Traumatisierung, Persönlichkeitsstruktur oder Bindung sinnvoll ist (Bernstein et al., 2003; Ehrenthal et al., 2020), erscheint die Erstellung einer validen und reliablen Kurzversion des APK notwendig und sinnvoll.

Die Konstruktion von Kurzversionen mit guten psychometrischen Eigenschaften kann als Optimierungsproblem der Itemselektion verstanden werden (Leite et al., 2008; Schroeders, Wilhelm & Olaru, 2016). Bislang werden bei Itemselektionen häufig statistische, experten-basierte oder ad-hoc Verfahren verwendet (Kruyen, Emons & Sijtsma, 2013; Smith, McCarthy & Anderson, 2000). Statistische Verfahren wie z.B. die schrittweise konfirmatorische Faktoranalyse (SCOFA) oder die Auswahl von Items mit bestimmter Mittelwertstruktur oder Korrelationen zu relevanten (Außen-)Kriterien haben gemeinsam, dass jene Items ausgewählt werden, die bestimmte psychometrische Eigenschaften (z.B. Reliabilität, Modellfit, Sensitivität oder Kriteriumsvalidität) erfüllen. Expertenverfahren dienen häufig zur Itemselektion unter dem Aspekt der Inhaltsvalidität, während ad-hoc Verfahren weder auf statistische noch inhaltliche Aspekte zurückgreifen. Die Verwendung solcher Methoden führt häufig zur Fokussierung eines bestimmten (psychometrischen) Aspekts wie (entweder) Reliabilität, Modellfit oder Validität. Wünschenswert wäre allerdings, dass bei der Erstellung von Kurzversionen mehrere Gütekriterien simultan in Betracht gezogen werden (Leite et al., 2008; Widaman, Little, Preacher & Sawalani, 2011). In dieser Studie soll für die Itemselektion der APK-Kurzversion das kombinatorische Optimierungsverfahren Ant Colony Optimization (ACO; Leite et al., 2008) eingesetzt werden, welches zunehmend in verschiedenen Bereichen der psychologischen Fragebogenkonstruktion verwendet wird (Kerber et al., 2020; Olaru, Schroeders, Hartung, Wilhelm & Wrzus, 2019; Olaru & Jankowsky, 2021; Schroeders et al., 2016). Studien, die ACO mit alternativen Ansätzen vergleichen, zeigen eine Überlegenheit des ACO-Verfahrens hinsichtlich der Auswahl der optimalen Items gegenüber alternativen Vorgehensweisen wie z.B. SCOFA und Generic Algorithm (GE) (Schroeders et al., 2016) oder der Maximierung einzelner Aspekte wie Reliabilität oder Modellfit (Janssen, Schultze & Grötsch, 2017; Olaru, Witthöft & Wilhelm, 2015). Durch die Möglichkeit der simultanen Einbeziehung mehrerer Optimierungskriterien erlaubt die Verwendung des ACO-Verfahrens eine Balance zwischen Reliabilitäts- und Validitätsaspekten und kann somit entsprechende methodische Empfehlungen berücksichtigen (Schroeders et al., 2016; Smith et al., 2000; Widaman et al., 2011; Ziegler, Kemper & Kruyen, 2014).

Diese Arbeit verfolgt zwei Ziele: Erstens soll aus der Langversion des APK ein optimales Itemset für die zu erstellende Kurzversion anhand einer ACO mit mehreren vorab definierten Gütekriterien identifiziert werden. Dazu soll eine klinische Stichprobe (n = 701) verwendet werden. Zweitens soll die neu erstellte APK-Kurzversion anhand einer nicht-klinischen Stichprobe (n = 643) mit Blick auf dieselben Gütekriterien validiert werden. Da zu erwarten ist, dass klinische und nicht-klinische Probandinnen und Probanden bedeutsame Unterschiede im Ausmaß berichteter aversiver und protektiver Kindheitserfahrungen zeigen, sollen diese Unterschiede anhand einer Analyse latenter Mittelwertunterschiede geprüft werden.

Methode

Diese Studie basiert auf Re-Analyse der originalen Stichprobe (N = 128) der APK-Langversion (Ehrenthal et al., 2020) sowie der querschnittlichen Erstanalyse zweier neuer Stichproben (klinisch: n = 573; nicht-klinisch: n = 643). Die für die ACO verwendete klinische Stichprobe setz sich demnach aus (1) der Original-Stichprobe (n = 128) und (2) einer neuen klinischen Stichprobe (n = 573) zusammen, umfasst also n = 701 Probandinnen und Probanden. Die Kombination der Original- und neuen klinischen Stichprobe hat das Ziel, eine ausreichend große Datenbasis von klinischen Patienteninnen und Patienten für die durchzuführende ACO bereitstellen zu können.

Stichproben

Die Original-Stichprobe der APK-Langversion (N = 128) aus voll- und teilstationären Patientinnen und Patienten wurde an der Klinik für Allgemeine Innere Medizin und Psychosomatik am Universitätsklinikum Heidelberg von Juni 2018 bis März 2019 erhoben (Ehrenthal et al., 2020). Die zweite klinische Stichprobe (n = 573) wurde zwischen 2011 und 2012 ebenfalls am Universitätsklinikum Heidelberg erhoben und besteht aus Patientinnen und Patienten der psychotherapeutischen Ambulanz, die sich aufgrund psychischer Beschwerden zur Diagnostik und therapeutischen Weiterempfehlung vorstellen. Nach erfolgter Patientenaufklärung und -einwilligung durchliefen alle Patientinnen und Patienten vor der diagnostischen Erstsicht eine routinemäßige Diagnostik, u. a. bestehend aus den hier verwendeten Fragebögen. Eine ausführliche Beschreibung der Rekrutierung und Vorgehensweise ist bei Nikendei et al. (2020) zu finden. Die nicht-klinische Vergleichsstichprobe wurde als Convenience Sample in einer online-basierten Untersuchung im Jahr 2017 vor allem durch eine Verbreitung über soziale Medien (Facebook, estudy, Psychologie Heute) in Deutschland und Österreich erhoben. Voraussetzung zur Teilnahme war die informierte Einwilligung in die wissenschaftliche Auswertung der Daten. Insgesamt nahmen N = 778 Probandinnen und Probanden teil, wobei n = 135 Probandinnen und Probanden die Teilnahme vorzeitig abbrachen bzw. komplette Fragebögen der Erhebung unausgefüllt ließen. Eingeschlossen wurden Personen (n = 643), die vollständige Datensätze im Sinne der Untersuchungsfragestellung lieferten. Einzelne fehlende Werte innerhalb der Fragebögen kamen aufgrund der Seitenprogrammierung nicht vor. Zwischen den ein- bzw. ausgeschlossenen Probandinnen und Probanden gab es hinsichtlich Alter (p = .95) und Geschlecht (p = .12) keine signifikanten Unterschiede. Es gab keine Aufwandsentschädigung. Tabelle 1 zeigt die Beschreibung der klinischen und nicht-klinischen Stichproben:

Tabelle 1 Beschreibung der für die ACO zugrunde liegenden klinischen Stichprobe und der nicht-klinischen Vergleichsstichprobe.

Messinstrumente

Fragebogen zu aversiven und protektiven Kindheitserfahrungen (APK): Kindheitserfahrungen wurden mit der Langversion des APK erfasst (Ehrenthal et al., 2020). Der Selbsteinschätzungsbogen umfasst 59 Items auf einer fünfstufigen Likert-Skala von 1 (überhaupt nicht) bis 5 (sehr oft). Eine Ja-Nein-Frage erfasst außerdem vage erinnerte sexuelle Übergriffe. In zwei optionalen Freitextfeldern können Art und Zeitraum aversiver Ereignisse zu sexuellen und sonstigen traumatischen Erfahrungen beschrieben werden. Aversive Kindheitserfahrungen werden auf sieben Skalen erfasst: Emotionale Vernachlässigung und Missbrauch (11 Items), Körperliche Vernachlässigung und Missbrauch (4 Items), Sexueller Missbrauch (4 Items), Sonstige traumatische Ereignisse (3 Items), Trennungserfahrungen (5 Items), Dysfunktionale Familiensituation (10 Items) und Fehlende oder Dysfunktionale Peergroup-Einflüsse (3 Items). Protektive Kindheitserfahrungen werden mit einer Skala (17 Items) erfasst. Der jeweilige Skalenwert entspricht dem Mittelwert über alle zugehörigen Items. Eine Zusatzfrage (Item 59) erfasst die heutige wahrgenommene Belastung durch die negativen Kindheitserfahrungen auf einer fünfstufigen Likert-Skala (1 – 5). Die psychometrische Auswertung der Originalstichprobe ergab interne Konsistenzen im akzeptablen bis exzellenten Bereich (Range Cronbachs α = .69–.96) für alle Faktoren mit Ausnahme der Subskalen Sonstige Traumatische Erlebnisse (Cronbachs α = .55) und Fehlende / Dysfunktionale Peergroup-Einflüsse (Cronbachs α = .58), wobei die geringere interne Konsistenz auch auf die gewünschte Heterogenität dieser Skalen zurückzuführen ist (Ehrenthal et al., 2020). Alle Skalen zeigten eine hohe konvergente Validität zum CTQ sowie eine hohe und mit dem CTQ vergleichbare Kriteriumsvalidität bezüglich Bindung und Depressivität. Für die hier verwendeten Stichproben zeigte sich für die klinische Stichprobe eine interne Konsistenz im Bereich von α = .63–.95 (mit Ausnahme der Subskala Sonstige Traumatische Erlebnisse: Cronbachs α = .48), und α = .66–.95 (Sonstige Traumatische Erlebnisse: Cronbachs α = .50) für die nicht-klinische Stichprobe. Eine Auswertungshilfe sowie die APK-Fragebögen (Lang- und Kurzversion) können unter http://strukturdiagnostik.de/apk/ bei den Autoren angefragt und kostenfrei heruntergeladen werden.

Childhood Trauma Questionnaire – Short Form (CTQ-SF): Kindheitserfahrungen wurden parallel anhand der deutschen Kurzversion des CTQ-SF (Klinitzke, Romppel, Häuser, Brähler & Glaesmer, 2012) erfasst. Der Selbsteinschätzungsbogen erfasst auf einer fünfstufigen Likert-Skala von 1 (überhaupt nicht) bis 5 (sehr häufig) mit jeweils fünf Items die Subskalen Emotionale Vernachlässigung, Körperliche Vernachlässigung, Emotionaler Missbrauch, Körperlicher Missbrauch und Sexueller Missbrauch. Zusätzlich wird mit drei Items die Tendenz zur Bagatellisierung und Verleugnung erhoben. Der jeweilige Skalenwert ergibt sich aus der Summe aller zugehörigen Items. Die Summe aller Skalen (bzw. Items) ergibt den Gesamtwert des CTQ-28. Die guten psychometrischen Eigenschaften wurden in verschiedenen Settings beschrieben (Bernstein et al., 2003; Klinitzke et al., 2012).

Gesundheitsbogen für Patienten (PHQ-9): Depressivität wurde mithilfe des Depressionsmoduls des Gesundheitsbogen für Patienten (PHQ-9; Löwe, Kroenke, Herzog & Gräfe, 2004) erfasst. Das Selbsteinschätzungsinstrument erfasst mit neun Items jeweils auf einer vierstufigen Likert-Skala von 0 (überhaupt nicht) bis 3 (beinahe jeden Tag) je ein DSM-5 Kriterium der Major Depressionsdiagnose. Neben einem dimensionalen Summenwert, welcher über alle Items hinweg errechnet wird, kann auch eine kategoriale Einschätzung über das Vorliegen einer Major Depression bestimmt werden. Bei ≥ 5 Kriterien mit einem Skalenwert von ≥ 2 sowie einem A-Kriterium (Interessenverlust oder Niedergeschlagenheit) kann die Diagnose Major Depression gestellt werden. In der nicht-klinischen Vergleichsstichprobe wurden aus Platzgründen nur die A-Kriterien erfasst. Der PHQ-9 ist ein etabliertes Standardinstrument und wurde sowohl in klinischen als auch nicht-klinischen Populationen validiert (Manea, Gilbody & McMillan, 2012).

Experience in Close Relationships – Revised (ECR-RD8): Bindung wurde mithilfe der deutschen Kurzversion des Selbsteinschätzungsbogen ECR-RD8 (Ehrenthal et al., 2021) erfasst. Der ECR-RD8 umfasst acht Items auf einer siebenstufigen Likert-Skala von 1 (stimme gar nicht zu) bis 7 (stimme völlig zu), die zu den Subskalen bindungsbezogene Angst (4 Items: BANG) und bindungsbezogene Vermeidung (4 Items: BVER) aggregiert werden. Der jeweilige Skalenwert ergibt sich aus den Mittelwerten der zugehörigen Items. Der ECR-RD8 verfügt über bessere psychometrische Kennwerte insbesondere in Bezug auf eine konfirmatorische Testung der angenommenen Skalenstruktur als eine andere Kurzversion (Brenk-Franz et al., 2018).

Statistische Analysen

Ant Colony Optimization (ACO)

Die Erstellung von Kurzversionen für Fragebögen wird zunehmend als Optimierungsproblem der Itemselektion verstanden (Olaru et al., 2019; Schroeders et al., 2016). Zur Lösung dieses Problems eignen sich kombinatorische Optimierungsverfahren wie die etablierte ACO. ACO beschreibt einen iterativen Prozess, welcher das Verhalten von Ameisen bei der Essenssuche imitiert: Ameisen hinterlassen bei ihrer zufälligen Wahl des Weges Pheromone, welche andere Ameisen anlocken, und so die Wahl des gleichen Weges erhöhen. Auf kürzeren Wegen evaporieren diese Pheromone weniger stark, so dass mehr Ameisen auf diese Wege angelockt werden und kürzere (bessere) Wege zunehmend genutzt werden. Analog wird bei der Fragebogenkonstruktion zunächst ein zufälliges Set von Items aus allen vorhandenen Items ausgewählt, und anhand eines vorher festgelegten Kriteriums (bei Ameisen: Kürze des Weges) bewertet. Items, die zu besonders guten (i. S. v. optimalen) Lösungen führen, werden mit virtuellen Pheromonen markiert, so dass sich die Wahrscheinlichkeit dieser Items erhöht, im nächsten iterativen Schritt wieder gezogen zu werden. Durch die iterative Anhäufung von Pheromonen wird die Wahl zunehmend auf günstige Items konzentriert. Dieser Prozess wird so lange fortgesetzt, bis eine festgelegte Anzahl von Prozessschleifen keine nennenswerte Verbesserung mehr erzielt (Stopp-Kriterium). Die ACO zählt zu den probabilistischen Auswahlverfahren und findet daher nicht zwangsläufig die beste aller Möglichkeiten. Daher ist eine wiederholte Durchführung sinnvoll, um die Robustheit des gefundenen Ergebnisses zu prüfen (Schroeders et al., 2016).

ACO Modellspezifikation

Um den klinischen Fokus des APK zu erhalten, insbesondere die breitere Erfassung aversiver Kindheitserfahrung und separate Erfassung protektiver Erfahrungen, wurden die Skalen der APK-Langversion übernommen. Neben der theoretischen Fundierung der Faktorstruktur zeigte auch die empirische Struktur der Langversion eine dafür ausreichende Validität (Ehrenthal et al., 2021). Um eine ausgewogene aber gleichzeitig sparsame Erfassung des breiteren Spektrums relevanter Kindheitserfahrungen zu gewährleisten (Finkelhor et al., 2013), sollten alle Skalen mit der gleichen Anzahl von Items abgebildet werden, um eine Über- oder Unterbetonung bestimmter Arten von Kindheitserfahrung zu vermeiden. Um die Itemzahl möglichst gering zu halten, sollte jeder Faktor mit zwei Items abgebildet werden. Um das Modell zu identifizieren, wurden pro Faktor die unstandardisierten Ladungen beider manifester Indikatoren auf 1 fixiert. Somit ergaben sich acht Subskalen mit 8 x 2 = 16 Items1, mit sieben Facetten der breiter definierten aversiven Kindheitserfahrungen und einer Skala für protektive Kindheitserfahrungen. Hinzu kommen die oben beschrieben zwei Textfelder und zwei Fragen (nach sexuellem Missbrauch und heutiger Belastung durch die Kindheitserfahrungen), die keinen Skalen zugeordnet sind, sondern der Verbesserung der klinischen bzw. prognostischen Einschätzung dienen sollen (Ehrenthal et al., 2020). Hieraus ergibt sich die Summe von 18 Items für die Kurzversion APK-18.

Optimierungskriterien: Als Kriterien wurden (1) der Modell-Fit, (2) die durchschnittliche und minimale faktor-spezifische Reliabilität und (3) die faktor-spezifische Kriteriumsvalidität mit der APK Langversion verwendet. Basierend auf den Empfehlungen von Schroeders et al. (2016) und Olaru et al. (2019) wurde als Optimierungsfunktion für jedes Kriterium eine Funktion mit Logit-Transformation durchgeführt (siehe unten). Dies hat zum Ziel, dass einerseits jedes Kriterium auf einen Punktwert zwischen 0 bis 1 skaliert wird, und andererseits eine Optimierung gegenüber festgelegten Schwellenwerten (Cut-Offs) möglich ist. Zusätzlich kann die Funktion um einen Steigungsparameter ergänzt werden. Auch hier verwendeten wir die Empfehlungen der o. g. Autoren mit einem Wertebereich von 0–100, wobei ein höherer Steigungsparameter eine genauere (strengere) Lösungsdiskriminierung um die festgelegten Schwellenwerte (Cut-Offs) bedeutet, so dass sich eine Abweichung gegenüber dem Schwellenwert stärker auf den Punktwert niederschlägt. Die drei Kriterien wurden folgendermaßen definiert:

Kriterium 1: Für die Modellpassung wurde eine Kombination der Fit-Indizes Comparative-Fit-Index (CFI) und Root Mean Square Error of Approximation (RMSEA) mit den Schwellenwerten CFI > .90 und RMSEA < .05 verwendet. Das bedeutet, dass ein Modell mit einem CFI = .90 und RMSEA = .05 nach erfolgter Logit-Transformation einen Punktwert von .50 erhalten würde. Modelle, die diese Schwellenwerte übererfüllen, erhalten eine höhere Punktzahl (maximal 1). Die Cut-Offs basieren auf etablierten Empfehlungen für ausreichend guten Modell-Fit (Hu & Bentler, 1999; Kline, 2011). Aufgrund nicht-normalverteilter Daten des APK (Mardia-Test: p < .01) und der mit fünf Stufen relativ geringen Anzahl von Ausprägungen der Likert-Skala wurde als konservatives Vorgehen ein ordinales Skalenniveau angenommen und entsprechend der Weighted-Least-Squared (WLSMV) Schätzer verwendet, welcher bei den vorliegenden fünf Antwortkategorien gegenüber robusten Maximum-Likelihood Schätzern zu bevorzugen ist (Li, 2016).

(mit)
(und)

Kriterium 2: Für die Reliabilität wurde McDonalds ω als Indikator für die Faktorsättigung (Flora, 2020; Zinbarg, Revelle, Yovel & Li, 2005) verwendet. Es wurde eine Kombination aus Cut-Offs für die mittlere und minimale Reliabilität festgelegt: Für die mittlere Reliabilität über alle Skalen wurde ein Schwellenwert von ω > .70 (Kruyen et al., 2013; Widaman et al., 2011) mit einer Steigung von 30 gewählt. Außerdem wurde für alle Einzelskalen ein Minimalwert für einen zur Interpretation der Skala nötigen Mindestwert von ω > .50 mit einer Steigung von 100 gewählt (Reise, Bonifay & Haviland, 2013).

(mit)
(und)

Kriterium 3: Für die Kriteriumsvalidität wurde als robuster Schätzer bzw. Absicherung gegen mögliche Verzerrungen der nicht-normalverteilten Daten die ordinale Rangkorrelation r zwischen den Skalen der APK-Lang- und -Kurzversion mit einem Cut-off von r > .80 als Mindestwert der konvergenten Korrelation gewählt sowie eine Steigung von 100 festgelegt. Für das Optimierungskriterium wurde für alle Subskalen die jeweilige Korrelation zur Skala der Langversion berechnet und der Punktwert anhand der niedrigsten Korrelation im Modell (rmin) bestimmt.

Die finale Optimierungsfunktion setzte sich aus der Summe aller Punkte der drei Kriterien zusammen.

Als konservatives Stoppkriterium wurden in Anlehnung an Schroeders et al. (2016) eine Anzahl von 50 Iterationen ohne Verbesserung mit 80 Ameisen pro Iteration festgelegt. Um das Risiko einer Überbetonung von früh gefundenen suboptimalen Lösungen zu minimieren wurde ein Evaporationsfaktor von .90 festgelegt (Leite et al., 2008; Olaru et al., 2019). Die Evaporation senkt nach jeder Markierung favorisierter Items deren Wahrscheinlichkeit bevorzugt gezogen zu werden um den festgelegten Faktor ab. Zur Sicherstellung robuster Ergebnisse wurde der Algorithmus 15 mal unter Verwendung unterschiedlicher Zufallszahlen durchgeführt. Alle Rechnungen wurden mit der Software R Version 4.0.2 (R Core Team, 2020) unter Verwendung der Pakete „lavaan“ (Rosseel, 2012), „semTools“ (Jorgensen et al., 2018), „psych“ (Revelle, 2011) und „cocor“ (Diedenhofen & Musch, 2015) durchgeführt. Der ACO R-Code ist auf Anfrage beim Erstautor erhältlich und basiert auf dem Skript von Schroeders et al. (2016).

Evaluation und Validierung der APK-Kurzversion

ACO Kriterien: Die Evaluation des identifizierten Itemsets der APK-Kurzversion soll anhand der beschriebenen Cut-Offs erfolgen. Zudem soll geprüft werden, ob die identifizierte Kurzversion die Cut-Offs auch in der nicht-klinischen Stichprobe erfüllt.

Außenkriterien: Um zu prüfen, ob der Zusammenhang zu den Außenkriterien Depressivität (PHQ) und Bindung (BVER und BANG) in der Kurzversion erhalten blieb, sollen die Rangkorrelationen im Vergleich zur Langversion verglichen werden. Das Vorliegen der Außenkriterien in beiden Stichproben ermöglicht die Berechnung von Konfidenzintervallen (KI) anhand des Vorgehens nach Zou (2007) für die Differenz der jeweiligen Korrelationen zwischen Kurz- und Langversion. Schließt das KI mit einem Konfidenzniveau von 95 % den Wert 0 nicht mit ein, kann von einem bedeutsamen Unterschied der Korrelation zwischen Lang- und Kurzversion und dem Außenkriterium ausgegangen werden.

Mittelwertstruktur: Unterschiede in der Ausprägung aversiver und protektiver Kindheitserfahrungen zwischen klinischen und nicht-klinischen Teilnehmenden sollen anhand latenter Mittelwerte durch den Vergleich von Multigruppenmodellen untersucht werden. Aufgrund des ordinalen Skalenniveaus wurden in Anlehnung an Millsap (2004) und Kite (2018) die beobachteten Werte als diskrete Manifestationen einer kontinuierlichen latenten Ausprägung konzipiert. Dabei stellen latente Schwellenwerte („thresholds“) Perzentile der normalverteilten latenten Ausprägungsverteilung dar. Als Voraussetzung für die Analyse latenter Mittelwertunterschiede wird geprüft, ob eine ausreichende Modellpassung für ein Modell mit gleichen Schwellenwerten und Faktorladungen in beiden Gruppen gegeben ist. Darauf aufbauend können dann die geschätzten Mittelwertdifferenzen der Faktoren als latente Unterschiede zwischen den Gruppen, im Vergleich zur Referenzgruppe (hier: klinische Stichprobe) interpretiert werden. Auf die zusätzliche Fixierung von Fehlervarianzen wurde verzichtet (Millsap & Yun-Tein, 2004). Als Kriterien für ausreichenden Modellfit wurde ein CFI > .90 und RMSEA < .05 festgelegt, wobei die Fit-Indizes auf Grundlage der skalierten χ²-Werte mit Satorra-Bentler-Korrektur (Satorra & Bentler, 2001) berechnet wurden.

Ergebnisse

Tabelle 2 zeigt die ACO Ergebnisse für die final ausgewählte Kurzversion APK-18. Abbildung 1 zeigt das finale Modell mit den jeweiligen Item-Zuordnungen, aufgeklärter Faktorsättigung (ω) sowie den wichtigsten Faktorkorrelationen (vollständige Liste für klinische und nicht-klinische Stichprobe im elektronischen Supplement [ESM]1). Alle 15 ACO-Durchläufe konvergierten regulär über das Stoppkriterium. Das gewählte Itemset wies mit f‍(x) = 1.61 über alle Durchläufe die höchste Punktzahl der Optimierungsfunktion aus (Range aller Endmodelle der fünfzehn Durchläufe = 1.49 – 1.61). Das für den APK-18 ausgewählte Modell wurde in 5 der insgesamt 15 separaten ACO-Durchläufen identifiziert, wobei für jeden Durchlauf zufällige Startwerte verwendet wurden. Die graphische Darstellung aller 15 Durchläufe sind als convergence plots im ESM 2 einzusehen.

Abbildung 1 Anmerkungen: Jede Itemformulierung beginnt mit „In meiner Kindheit und Jugendzeit…“. Dargestellt sind die Korrelationen der latenten Faktoren (Werte an den Doppelpfeilen), die standardisierten Faktorladungen sowie die Faktorreliabilität (McDonalds ω; jeweils linker unterer Rand) in der klinischen Stichprobe (n = 701). EVM = Emotionale Vernachlässigung und Missbrauch; KVM = Körperliche Vernachlässigung und Missbrauch, SMi = Sexueller Missbrauch, SoT = Sonstige traumatische Ereignisse, Tre = Trennungserfahrungen, DyF = Dysfunktionale Familiensituation, PeG = Fehlende oder Dysfunktionale Peergroup-Einflüsse, Pro = Protektive Kindheitserfahrung. *p < .05. Abbildung 1. Messmodell mit Itemformulierungen der erstellten Kurzversion des APK-18.
Tabelle 2 Vergleich zwischen der Langversion des APK und der durch Ant Colony Optimization (ACO) ermittelten Kurzversion APK-18 auf den Optimierungskriterien 1 – 3 für die klinische und nicht-klinische Stichprobe.

Das anhand der ACO identifizierte optimale Itemset für den APK-18 (d. h. mit der höchsten Punktzahl der Optimierungsfunktion) erfüllte die Vorgaben des Model-Fit (CFI = .99; RMSEA = .05). Die durchschnittliche Faktorsättigung lag bei ω = .76. Alle Faktoren lagen über dem Cut-Off von ω ≥ .7 (vgl. Tabelle 2) mit Ausnahme der Skalen Sonstige traumatische Ereignisse (ω = .47) und Trennungserfahrung (ω = .57). Die durchschnittliche Korrelation zwischen den Skalen der Lang- und Kurzversion lag über beide Stichproben hinweg bei r = .86 (vgl. Tabelle 2). Die Übersichten aller Korrelationen zw. Lang- und Kurzversion sind in Abbildung 2 für beide Stichproben dargestellt.

Abbildung 2 Anmerkungen: Korrelationen mit je p < .01. Die obere Dreiecksmatrix gibt die Korrelationen der klinischen Stichprobe (n = 701) an, die untere Dreiecksmatrix die der nicht-klinischen Stichprobe (n = 643). Abbildung 2. Korrelationen (Heatmap) der Skalen der Lang- und Kurzversion des APK.

Die Korrelationen des APK-18 mit den Außenkriterien zeigten eine maximale Abweichung zwischen Lang- und Kurzversion von Δr = .13 für die Skala Trennungserfahrungen und BVER (vgl. Abbildung 3; linker Teil, klinische Stichprobe). Bedeutsame Unterschiede zwischen der Lang- und Kurzversion ergaben sich für PHQ und Trennungserfahrung, 95 % KI [–.15, -.05], körperliche Vernachlässigung und Missbrauch, 95 % KI [–.07, -.01]; BANG und Trennungserfahrung, 95 % KI [–.11, -.01], körperliche Vernachlässigung und Missbrauch 95 % KI [–.07, -.01]; BVER und Fehlender oder Dysfunktionale Peergroup-Einflüsse, 95 % KI [–.07, -.01], Trennungserfahrung, 95 % KI [–.18, -.08] und Sonstige traumatische Ereignisse, 95 % KI [–.12, -.02].

Abbildung 3 Anmerkungen: PHQ = Patient-Health-Questionnaire; BANG = Bindungsbezogene Angst; BVER = Bindungsbezogene Vermeidung. * p < .05. Abbildung 3. Korrelationen (Heatmap) der Skalen der Lang- und Kurzversion des APK mit den Außenkriterien Depressivität (PHQ) und Bindung (BANG; BVER).

Validität der APK-Kurzversion in der nicht-klinischen Stichprobe

ACO Kriterien: In der nicht-klinischen Stichprobe (vgl. Tabelle 2 unten) erfüllte die APK-Kurzversion die Modell–Fit-Kriterien (CFI = .99; RMSEA = .04). Die durchschnittliche Faktorsättigung lag bei ω = .74 (Schwellenwert ω > .70). Analog zur klinischen Stichprobe lag die Reliabilität der Skalen Sonstige traumatische Ereignisse (ω = .49) und Trennungserfahrung (ω = .49) knapp unter dem Minimalwert von ω = .50. Die durchschnittliche Korrelation zwischen den Skalen der Lang- und Kurzversion lag bei r = .85 (Schwellenwert r > .80). Die Korrelation des APK-18 mit den Außenkriterien (vgl. Abbildung 3; rechter Teil, nicht-klinische Stichprobe) lag im Bereich r < |.42| (in klinischer Stichprobe: r < |.34|). Die maximale Abweichung zwischen Kurz- und Langversion lag bei Δr = .08 für die Skala Trennungserfahrungen und BANG. Die Analyse der Korrelationsunterschiede ergab bedeutsame Unterschiede zwischen der Lang- und Kurzversion für PHQ und Trennungserfahrung, 95 % KI [–.12, -.02], Sonstige traumatische Ereignisse, 95 % KI [–.14, -.03]; BANG und Sonstige traumatische Ereignisse, 95 % KI [–.12, -.01] und Emotionale Vernachlässigung und Missbrauch, 95 % KI [–.10, -.01]; BVER und Protektiver Kindheitserfahrungen, 95 % KI [–.10, -.02], Fehlender oder Dysfunktionale Peergroup-Einflüsse, 95 % KI [–.07, -.01], Trennungserfahrungen, 95 % KI [–.11, -.01] und Sonstige traumatische Ereignisse, 95 % KI [–.13, -.02].

Latente Mittelwertstruktur: Das Gruppenmodell mit fixierten Schwellenwerten (thresholds) und Faktorladungen zeigte einen ausreichend guten Modellfit (χ² = 500.43; df = 208; CFI = .993; RMSEA = .049), was die Interpretation der latenten Mittelwertunterschiede ermöglicht. Nicht-klinische Teilnehmende (n = 643) zeigten im Vergleich zur klinischen Referenzstichprobe (n = 701) bedeutsame Unterschiede in den latenten Ausprägungen [in Cohens d; Effekte an SD der klinischen Referenzgruppe standardisiert] für die Skalen Emotionale Vernachlässigung und Missbrauch (d = -1.45; p < .01); Körperliche Vernachlässigung und Missbrauch (d = -1.36; p < .01); Sexueller Missbrauch (d = -1.53; p = .01); Dysfunktionale Familiensituation (d = -.97; p < .01); Fehlende oder Dysfunktionale Peergroup-Einflüsse (d = -.37; p < .01) und Protektive Kindheitserfahrungen (d = 1.61; p < .01). Keine bedeutsamen Unterschiede zeigten sich für Sonstige traumatische Ereignisse (d = -.40; p = .06) und Trennungserfahrungen (d = -.28; p = .05).

Diskussion

Die reliable, valide und zeitökonomische Erfassung von Kindheitserfahrungen ist aufgrund der stabilen Zusammenhänge mit psychischen und somatischen Erkrankungen im Erwachsenenalter von großer Bedeutung. Ziel der vorliegenden Studie war die Erstellung einer Kurzversion des Fragebogens zur Erfassung aversiver und protektiver Kindheitserfahrungen (APK) unter Einbeziehung einer Kombination mehrerer Gütekriterien (Modellfit, Reliabilität und Kriteriumsvalidität) mithilfe des kombinatorischen Optimierungsverfahrens Ant Colony Optimization. Die Itemzahl sollte unter Wahrung der bestehenden Faktorstruktur von 59 auf 18 reduziert werden, um die Bearbeitungszeit von derzeit ca. 15 Minuten auf ca. 5 Minuten zu senken und so eine Integration in routinemäßige Erhebungen in verschiedenen Settings zu vereinfachen. Die neu erstellte Kurzversion (APK-18) wurde anschließend anhand einer nicht-klinischen Vergleichsstichprobe validiert und auf zu erwartende latente Mittelwertunterschiede zwischen klinischen und nicht-klinischen Teilnehmenden hin untersucht.

Das durch die ACO identifizierte Itemset für den APK-18 wies über alle Durchläufe mit verschiedenen Zufallszahlen hinweg die höchste Punktzahl in der Optimierungsfunktion auf und wurde mehrfach identifiziert. Da die ACO ein probabilistisches Verfahren darstellt, spricht die wiederholte Selektion der identischen Items bei mehreren Durchläufen für die Robustheit der Ergebnisse (Olaru et al., 2019; Schroeders et al., 2016). Die identifizierte Version des APK-18 zeigte einen guten Modellfit (CFI = .99; RMSEA = .05) und eine gute Reliabilität (ω = .76). Dies galt auch für die nicht-klinische Vergleichsstichprobe, obwohl die Kurzversion auf Basis der klinischen Stichprobe ermittelt wurde. Trotz der erheblichen Reduktion von 59 auf 18 Items blieb die gemittelte Reliabilität der Langversion (ω = .77) erhalten, wobei sechs der acht Skalen im guten bis sehr guten Bereich von ω = .71 – .93 lagen. Ausnahmen stellten die Skalen Sonstige Traumatisierungen (ω = .47) und für die nicht-klinische Stichprobe die Skala Trennungserfahrungen (ω = .49) dar. Zieht man in Betracht, dass diese Skalen auch in der APK Langversion die niedrigsten (ω = .49 – .63) Reliabilitäten aufweisen, deuten die Ergebnisse darauf hin, dass die Items dieser Faktoren zwar jeweils gemeinsame Varianz aufweisen, jedoch gleichzeitig eine Heterogenität bezüglich der erfassten Konstrukte besteht (Kruyen et al., 2013; Reise et al., 2013). Diese Interpretation wird auch durch die Konzeption dieser Skalen unterstützt, da beispielsweise Sonstige Traumatisierungen explizit die Erfassung eines möglichst breiten Spektrums erlauben soll, welches über die anderen erfassten Arten traumatischer aversiver Kindheitserfahrungen (z. B. körperlicher oder sexueller Missbrauch) hinausgeht (Ehrenthal et al., 2020). Mit Blick auf die gewählte Breite der Skala wurde das optionale Textfeld aus der Langversion übernommen, welches eine zeitliche und inhaltliche Einordnung zulässt. Die Skala Trennungserfahrungen soll analog dazu ebenfalls ein breites Spektrum an Erfahrungen (z. B. Scheidung der Eltern, aber auch bis hin zu temporärer Obdachlosigkeit) erfassen, die mit höherer Vulnerabilität für psychische Erkrankungen assoziiert sind (Finkelhor et al., 2013). Für die quantitative Interpretation dieser beiden Subskalen bedeutet dies, dass ein ähnlich hoher Mittelwert bei unterschiedlichen Patientinnen und Patienten nur eingeschränkt als Indikator für die Ausprägung ähnlicher aversiver Erfahrungen verstanden werden kann. Trotzdem können diese Subskalen mit Blick auf die klinische Arbeit als wichtige Anhaltspunkte für das Vorliegen relevanter (heterogener) Traumatisierungs- bzw. Trennungserfahrungen dienen, welche im klinischen Interview gezielt weiter exploriert und für die Therapiekonzeption verwendet werden können.

Die Analyse latenter Mittelwerte zeigte die erwarteten Unterschiede zwischen klinischen und nicht-klinischen Patientinnen und Patienten. Dies galt sowohl für protektive Kindheitserfahrungen (signifikant höhere Ausprägung bei nicht-klinischen Teilnehmenden) als auch für aversive Kindheitserfahrungen (signifikant niedrigere Ausprägungen bei nicht-klinischen Teilnehmenden mit Ausnahme der Skalen Sonstige Traumatisierungen [p = .06] und Trennungserfahrungen [p = .05]). Die Ergebnisse der latenten Mittelwertstruktur mit den Ausprägungen in die jeweils erwartete Richtung deuten auf eine ausreichende Eignung des APK-18 für die Erfassung von relevanten Unterschieden in einem breiten, klinischen und nicht-klinischen Spektrum hin. Die für die Untersuchung von Kindheitserfahrungen wichtige Kriteriumsvalidität (Bernstein et al., 2003) wurde sowohl mit Blick auf die Konvergenz zwischen APK-Kurz- und -Langversion als auch mit den beiden relevanten Außenkriterien Bindung und aktueller Depressivität geprüft. Der APK-18 zeigte die erwartete hohe konvergente Kriteriumsvalidität mit der Langversion (r =.74 – .92). In beiden untersuchten Stichproben zeigten sich die erwarteten Zusammenhänge mit Bindung und aktueller Depressivität in der jeweils erwarteten Richtung. Gleichzeitig blieben die Zusammenhänge zu den relevanten Außenkriterien Depressivität und Bindung in der Kurzversion erhalten, mit einer leichten Tendenz zu kleineren Zusammenhängen in der APK-Kurzversion.

Der APK-18 stellt ein Instrument zur standardisierten und parallelen Erfassung aversiver und positiver Kindheitserfahrungen dar, mit dem Ziel einer erweiterten, und damit relevanteren, und für die Therapieplanung hilfreicheren Erfassung bedeutsamer Bereiche (Ehrenthal et al., 2019; Finkelhor et al., 2013). Der APK-18 soll in erster Linie klinisch-therapeutisch arbeitenden Behandelnden die Erfassung und Identifikation relevanter Kindheitserfahrungen ermöglichen und durch den reduzierten Umfang der Kurzversion eine Integration in bestehende und oftmals bereits umfangreiche Diagnostik-Batterien erleichtern. Außerdem sollte der APK-18 auch eine Verwendung in Bereichen der Primärversorgung bzw. nicht-klinischen Settings (wie z. B. Beratungsstellen) erleichtern, um auch hier der Relevanz von Kindheitserfahrungen für das Verständnis von psychischen Erkrankungen gerecht werden zu können. Dabei kann der APK-18 als Screening-Instrument verstanden werden, der neben einer psychometrischen Auswertung die Identifikation relevanter Bereiche für die weitere Exploration wichtiger biografischer Erfahrungen im klinischen Interview oder Therapieverlauf erleichtern soll.

Limitationen und Ausblick: Grundlage für die Optimierung des APK war die bereits vorliegende Langversion mit insgesamt 59 Items (Ehrenthal et al., 2020). Durch die Maximierung der Korrelation zwischen Lang- und Kurzversion als eines von drei Optimierungskriterien wurde die Langversion somit als Grundlage des Samplings herangezogen und die APK-Langversion daher implizit als erschöpfende Operationalisierung der erfassten Konstrukte angenommen. Zweitens wurden bei der Berechnung der Korrelationen zw. Lang- und Kurzversion die unkorrigierten Korrelationen (ohne Entfernung der selektierten Items) verwendet. Dies könnte tendenziell zu einer Überschätzung der berichteten Kriteriumsvalidität führen (Smith et al., 2000). Mit Blick auf künftige Studien wäre es daher wünschenswert, die Kriteriumsvalidität durch die Prüfung in weiteren Stichproben bzw. unter Verwendung korrigierter Korrelationsparameter weiter abzusichern. Drittens ergeben sich durch die Festlegung der Itemanzahl auf 2 Items pro Skala Einschränkung bei der Möglichkeit, breitere Konstrukte durch eine höhere Anzahl von Items abzubilden. Gleichzeitig sollte für die klinische Verwendung ein möglichst sparsames Instrument mit gleichwertiger Erfassung der Facetten von Kindheitserfahrungen konstruiert werden. Daher wurde bei der Abwägung der Itemanzahl zusätzlich geprüft, ob eine potenzielle Verlängerung der beiden heterogenen Subskalen Sonstige Traumatisierungen und Trennungserfahrungen zu einer deutlichen Erhöhung der Reliabilität führen wurde. Es zeigte sich, dass selbst eine Verlängerung auf die maximal möglich Itemanzahl die Reliabilität lediglich um ω = .02 bzw. ω = .05 erhöht hätte. Da die weiteren Subskalen der Kurzversion eine gute bis sehr gute Reliabilität aufwiesen, erschienen die Vorteile der Festlegung auf 2 Items pro Skala aus klinischer und statistischer Sicht zu überwiegen. Viertens wurden in der vorliegenden Studie keine alternativen Faktorstrukturen getestet, da das Ziel der Optimierung war, die dem APK zugrundeliegende Faktorstruktur der Langversion zu erhalten. Diese Faktorstruktur basiert auf der breiteren Definition aversiver sowie der Inklusion protektiver Kindheitserfahrungen (Ehrenthal et al., 2020; Finkelhor et al., 2013) und stellt hierdurch eine gewollte Erweiterung gegenüber dem bestehenden Referenzinstrument CTQ-SF dar. Auch wenn der Modellfit des APK-18 in beiden Stichproben eine gute Passung der Daten mit der angenommenen Faktorstruktur zeigte, schließt dies eine Passung alternativer Faktorstrukturen (z.B. höherer Ordnung) nicht aus. Eine wieterführende Untersuchung alternativer Faktorstrukturen wäre für den APK-18 vor diesem Hintergrund wünschenswert. Für den CTQ-SF wurde die Fünf-Faktoren-Struktur beispielsweise mit hierarchischen (bifaktoriellen) Modellen (Spinhoven et al., 2014), einer Vier-Faktoren-Struktur (Bernstein et al., 2003) oder für verschiedene Moderatoren wie z.B. Geschlecht (Dudeck et al., 2015) getestet, wobei sich uneindeutige Befunde zeigten und die Fünf-Faktoren-Struktur beibehalten wurde. Des Weiteren wurde für den APK die Möglichkeit einer weiteren Ausdifferenzierung protektiver Kindheitserfahrungen zugunsten einer möglichst starken Itemreduktion zurückgestellt. Dies hat zur Folge, dass der APK-18 für aversive Kindheitserfahrungen ein differenzierteres Bild liefert als für protektive Einflüsse. Für zukünftige Studien wäre zudem eine Prüfung der Messinvarianz gegenüber relevanten Moderatoren wie Geschlechter oder Alter (Olaru et al., 2019) denkbar, da hier geschlechtsspezifische Prävalenzen (aversiver) Kindheitserfahrungen beobachtet wurden (Baglivio et al., 2014). Mit Blick auf die verwendeten Stichproben ist einschränkend zu sagen, dass für die nicht-klinische Stichprobe keine standardisierten klinischen Interviews durchgeführt wurden, so dass eine genaue psychopathologische Charakterisierung erschwert wird. Die in der Allgemeinbevölkerung vorliegende, bekannte psychische Belastung (Jacobi et al., 2014) wurde daher im Unterschied zur klinischen Stichprobe lediglich anhand der verwendeten Fragebögen erhoben. Des Weiteren können aufgrund der Querschnittserhebung keine Aussagen über den prädiktiven Wert von Kindheitserfahrungen auf spätere (Therapie-)Prozesse oder klinische Kriterien (z.B. Depression) getroffen werden. Da für die therapeutische Behandlung schulen- und settingübergreifend die Erhebung von Kindheitserfahrungen einen festen Bestandteil der Therapieplanung darstellt (Dührssen & Rudolf, 2011; Hautzinger, 2015), wären solche längsschnittlichen Untersuchung sowohl für die prognostische Risikoeinschätzung als auch zur Einschätzung des Therapieverlaufs von großer klinischer Bedeutung.

Die Ergebnisse der vorliegenden Studie ergaben Hinweise, dass mithilfe des Ant Colony Optimization (ACO) Algorithmus eine ausreichend reliable, valide und zeitökonomische Kurzversion des Fragebogens zur Erfassung aversiver und protektiver Kindheitserfahrungen identifiziert wurde. Die guten psychometrischen Eigenschaften der 18-Item Version (APK-18) bestätigten sich sowohl in der klinischen Validierungsstichprobe als auch in einer nicht-klinischen Vergleichsstichprobe. Die beiden Skalen Sonstige traumatische Ereignisse und Trennungserfahrungen sind zwar nur eingeschränkt quantitativ auswertbar, bilden aber dennoch eine wichtige Komponente für die klinischen Urteilsbildung und Therapieplanung. Der APK-18 stellt damit eine geeignete Alternative zur Langversion des APK bzw. zum Referenzinstrument CTQ-SF dar. Trotz geringerer Itemzahl ermöglicht der APK-18 eine breite Messung aversiver Kindheitserfahrungen, erlaubt gleichzeitig die systematische Erfassung protektiver Kindheitserfahrungen und trägt so deren wachsender Bedeutung für die Konzeptualisierung von psychischer Belastung und Gesundheit Rechnung.

Elektronische Supplemente (ESM)

Die elektronischen Supplemente sind mit der Online-Version dieses Artikels verfügbar unter https://doi.org/10.1026/0012-1924/a000276

Wir möchten uns bei allen Teilnehmenden bedanken, uns Einblicke in diese persönlichen und oft schwierigen Themenbereiche ihrer Kindheitserfahrungen zu geben. Hannah Eckstein und Luise Nehf möchten wir für ihre Hilfe bei der Dateneingabe sowie Daniel Bühler für seine Unterstützung bei der Modifkation des R-Scripts danken.

Literatur

  • Afifi, T. O. & Macmillan, H. L. (2011). Resilience following child maltreatment. A review of protective factors. Canadian Journal of Psychiatry. Revue Canadienne De Psychiatrie, 56, 266 – 272. https://doi.org/10.1177/070674371105600505 First citation in articleCrossrefGoogle Scholar

  • Baglivio, M. T., Epps, N., Swartz, K., Huq, M. S., Sheer, A. & Hardt, N. S. (2014). The prevalence of adverse childhood experiences (ACE) in the lives of juvenile offenders. Journal of Juvenile Justice, 3 (2), 1 – 17. First citation in articleGoogle Scholar

  • Bernstein, D. P., Ahluvalia, T., Pogge, D. & Handelsman, L. (1997). Validity of the childhood trauma questionnaire in an adolescent psychiatric population. Journal of the American Academy of Child & Adolescent Psychiatry, 36, 340 – 348. First citation in articleCrossrefGoogle Scholar

  • Bernstein, D. P., Stein, J. A., Newcomb, M. D., Walker, E., Pogge, D., Ahluvalia, T. et al. (2003). Development and validation of a brief screening version of the Childhood Trauma Questionnaire. Child Abuse & Neglect, 27, 169 – 190. https://doi.org/10.1016/S0145-2134(02)00541-0 First citation in articleCrossrefGoogle Scholar

  • Brenk-Franz, K., Ehrenthal, J., Freund, T., Schneider, N., Strauß, B., Tiesler, F. et al. (2018). Evaluation of the short form of ”Experience in Close Relationships” (Revised, German Version ”ECR-RD12”) – A tool to measure adult attachment in primary care. PloS One, 13 (1), e0191254. https://doi.org/10.1371/journal.pone.0191254 First citation in articleCrossrefGoogle Scholar

  • Chapman, D. P., Whitfield, C. L., Felitti, V. J., Dube, S. R., Edwards, V. J. & Anda, R. F. (2004). Adverse childhood experiences and the risk of depressive disorders in adulthood. Journal of Affective Disorders, 82, 217 – 225. https://doi.org/10.1016/j.jad.2003.12.013 First citation in articleCrossrefGoogle Scholar

  • Diedenhofen, B. & Musch, J. (2015). cocor. A comprehensive solution for the statistical comparison of correlations. PloS One, 10 (3), e0121945. https://doi.org/10.1371/journal.pone.0121945 First citation in articleGoogle Scholar

  • Dube, S. R., Anda, R. F., Felitti, V. J., Edwards, V. J. & Croft, J. B. (2002). Adverse childhood experiences and personal alcohol abuse as an adult. Addictive Behaviors, 27, 713 – 725. https://doi.org/10.1016/S0306-4603(01)00204-0 First citation in articleCrossrefGoogle Scholar

  • Dudeck, M., Vasic, N., Otte, S., Streb, J., Wingenfeld, K., Grabe, H. J. et al. (2015). Factorial validity of the short form of the Childhood Trauma Questionnaire (CTQ-SF) in German psychiatric patients, inmates and university students. Psychological Reports, 116, 685 – 703. https://doi.org/10.2466/16.03.PR0.116k27w5 First citation in articleCrossrefGoogle Scholar

  • Dührssen, A. & Rudolf, G. (2011). Die biographische Anamnese unter tiefenpsychologischem Aspekt. Stuttgart: Schattauer Verlag. First citation in articleGoogle Scholar

  • Ehrenthal, J. C., Zimmermann, J., Brenk-Franz, K., Dinger, U., Schauenburg, H., Brähler, E. & Strauß, B. (2021). Evaluation of a short version of the Experiences in Close Relationships-Revised questionnaire (ECR-RD8): results from a representative German sample. BMC psychology 9: 140 https://doi.org/10.1186/s40359-021-00637-z First citation in articleCrossrefGoogle Scholar

  • Ehrenthal, J. C., Schauenburg, H., Wagner, F. E., Dinger, U. & Volz, M. (2020). Entwicklung und Evaluation des Fragebogens zur Erfassung Aversiver und Protektiver Kindheitserfahrungen (APK). Psychiatrische Praxis, 47, 207 – 213. https://doi.org/10.1055/a-1123-1615 First citation in articleCrossrefGoogle Scholar

  • Ehrenthal, J. C., Stoffel, M. & Ditzen, B. (2019). Psychobiologische Aspekte der Traumafolgestörungen. PiD – Psychotherapie im Dialog, 20, 100 – 104. https://doi.org/10.1055/a-0771-4890 First citation in articleCrossrefGoogle Scholar

  • Felitti, V. J., Anda, R. F., Nordenberg, D., Williamson, D. F., Spitz, A. M., Edwards, V. et al. (1998). Relationship of childhood abuse and household dysfunction to many of the leading causes of death in adults. American Journal of Preventive Medicine, 14, 245 – 258. https://doi.org/10.1016/S0749-3797(98)00017-8 First citation in articleCrossrefGoogle Scholar

  • Finkelhor, D., Shattuck, A., Turner, H. & Hamby, S. (2013). Improving the adverse childhood experiences study scale. JAMA Pediatrics, 167 (1), 70 – 75. https://doi.org/10.1001/jamapediatrics.2013.420 First citation in articleCrossrefGoogle Scholar

  • Flora, D. B. (2020). Your coefficient alpha is probably wrong, but which coefficient omega is right? A tutorial on using R to obtain better reliability estimates. Advances in Methods and Practices in Psychological Science, 3 (4), 484 – 501. https://doi.org/10.1177/2515245920951747 First citation in articleCrossrefGoogle Scholar

  • Hardt, J. & Rutter, M. (2004). Validity of adult retrospective reports of adverse childhood experiences. Review of the evidence. Journal of Child Psychology and Psychiatry, 45, 260 – 273. https://doi.org/10.1111/j.1469-7610.2004.00218.x First citation in articleCrossrefGoogle Scholar

  • Häuser, W., Schmutzer, G., Brähler, E. & Glaesmer, H. (2011). Maltreatment in childhood and adolescence. Results from a survey of a representative sample of the German population. Deutsches Ärzteblatt International, 108, 287 – 294. https://doi.org/10.3238/arztebl.2011.0287 First citation in articleGoogle Scholar

  • Hautzinger, M. (2015). Diagnostik in der Verhaltenstherapie. In M. LindenM. Hautzinger (Hrsg.), Verhaltenstherapiemanual (S. 7 – 13). Berlin: Springer. First citation in articleGoogle Scholar

  • Hu, L. & Bentler, P. M. (1999). Cutoff criteria for fit indexes in covariance structure analysis. Conventional criteria versus new alternatives. Structural Equation Modeling: A Multidisciplinary Journal, 6 (1), 1 – 55. https://doi.org/10.1080/10705519909540118 First citation in articleCrossrefGoogle Scholar

  • Jacobi, F., Höfler, M., Strehle, J., Mack, S., Gerschler, A., Scholl, L. et al. (2014). Psychische Störungen in der Allgemeinbevölkerung. Studie zur Gesundheit Erwachsener in Deutschland und ihr Zusatzmodul Psychische Gesundheit (DEGS1-MH). Der Nervenarzt [Mental disorders in the general population : Study on the health of adults in Germany and the additional module mental health (DEGS1-MH)], 85(1), 77 – 87. https://doi.org/10.1007/s00115-013-3961-y First citation in articleCrossrefGoogle Scholar

  • Janssen, A. B., Schultze, M. & Grötsch, A. (2017). Following the ants. European Journal of Psychological Assessment, 33, 409 – 421. https://doi.org/10.1027/1015-5759/a000299 First citation in articleLinkGoogle Scholar

  • Jorgensen, T. D., Pornprasertmanit, S., am Schoemann, Rosseel, Y., Miller, P., Quick, C. et al. (2018). semTools: Useful tools for structural equation modeling. R package version 0.5 – 1. Retrieved from https://CRAN.R-project.org/package=semTools First citation in articleGoogle Scholar

  • Kerber, A., Schultze, M., Müller, S., Rühling, R. M., Wright, A. G. C., Spitzer, C. et al. (2020). Development of a short and ICD-11 compatible measure for DSM-5 maladaptive personality traits using ant colony optimization algorithms. Assessment. https://doi.org/10.1177/1073191120971848 First citation in articleCrossrefGoogle Scholar

  • Kessler, R. C., McLaughlin, K. A., Green, J. G., Gruber, M. J., Sampson, N. A., Zaslavsky, A. M. et al. (2010). Childhood adversities and adult psychopathology in the WHO World Mental Health Surveys. The British Journal of Psychiatry : the Journal of Mental Science, 197, 378 – 385. https://doi.org/10.1192/bjp.bp.110.080499 First citation in articleCrossrefGoogle Scholar

  • Kite, B. A., Jorgensen, T. D. & Chen, P.‑Y. (2018). Random permutation testing applied to measurement invariance testing with ordered-categorical indicators. Structural Equation Modeling: A Multidisciplinary Journal, 25, 573 – 587. https://doi.org/10.1080/10705511.2017.1421467 First citation in articleCrossrefGoogle Scholar

  • Kline, R. (2011). Principles and practice of structural equation modeling (3rd ed.). New York: Guilford Press. First citation in articleGoogle Scholar

  • Klinitzke, G., Romppel, M., Häuser, W., Brähler, E. & Glaesmer, H. (2012). Die deutsche Version des Childhood Trauma Questionnaire (CTQ) – psychometrische Eigenschaften in einer bevölkerungsrepräsentativen Stichprobe. Psychotherapie, Psychosomatik, medizinische Psychologie, 62 (2), 47 – 51. https://doi.org/10.1055/s-0031-1295495 First citation in articleCrossrefGoogle Scholar

  • Kruyen, P. M., Emons, W. H. M. & Sijtsma, K. (2013). On the Shortcomings of shortened tests. A literature review. International Journal of Testing, 13, 223 – 248. https://doi.org/10.1080/15305058.2012.703734 First citation in articleCrossrefGoogle Scholar

  • Leite, W. L., Huang, I.‑C. & Marcoulides, G. A. (2008). Item selection for the development of short forms of scales using an ant colony optimization algorithm. Multivariate Behavioral Research, 43, 411 – 431. https://doi.org/10.1080/00273170802285743 First citation in articleCrossrefGoogle Scholar

  • Li, C.‑H. (2016). Confirmatory factor analysis with ordinal data. Comparing robust maximum likelihood and diagonally weighted least squares. Behavior research methods, 48, 936 – 949. https://doi.org/10.3758/s13428-015-0619-7 First citation in articleCrossrefGoogle Scholar

  • Löwe, B., Kroenke, K., Herzog, W. & Gräfe, K. (2004). Measuring depression outcome with a brief self-report instrument. Sensitivity to change of the Patient Health Questionnaire (PHQ-9). Journal of Affective Disorders, 81 (1), 61 – 66. First citation in articleCrossrefGoogle Scholar

  • Manea, L., Gilbody, S. & McMillan, D. (2012). Optimal cut-off score for diagnosing depression with the Patient Health Questionnaire (PHQ-9). A meta-analysis. CMAJ : Canadian Medical Association Journal = Journal De L’Association Medicale Canadienne, 184 (3) – 6, E191. https://doi.org/10.1503/cmaj.110829 First citation in articleCrossrefGoogle Scholar

  • Merrick, M. T., Ford, D. C., Ports, K. A. & Guinn, A. S. (2018). Prevalence of adverse childhood experiences from the 2011 – 2014 behavioral risk factor surveillance system in 23 states. JAMA Pediatrics, 172 (11), 1038 – 1044. https://doi.org/10.1001/jamapediatrics.2018.2537 First citation in articleCrossrefGoogle Scholar

  • Millsap, R. E. & Yun-Tein, J. (2004). Assessing factorial invariance in ordered-categorical measures. Multivariate Behavioral Research, 39, 479 – 515. https://doi.org/10.1207/S15327906MBR3903_4 First citation in articleCrossrefGoogle Scholar

  • Nikendei, C., Mölle, C., Fischer, K., Granov, M., Huber, J., Dinger, U. et al. (2020). Persönlichkeitsstruktur und Bindungsstil als Prädiktoren für die erfolgreiche Aufnahme einer ambulanten psychotherapeutischen Behandlung. Zeitschrift für Psychosomatische Medizin und Psychotherapie, 66, 178 – 192. First citation in articleCrossrefGoogle Scholar

  • Olaru, G. & Jankowsky, K. (2021). The HEX-ACO-18: Developing an age-invariant HEXACO short scale using ant colony optimization. Journal of Personality Assessment, 1 – 12. https://doi.org/10.1080/00223891.2021.1934480 First citation in articleCrossrefGoogle Scholar

  • Olaru, G., Schroeders, U., Hartung, J., Wilhelm, O. & Wrzus, C. (2019). Ant colony optimization and local weighted structural equation modeling. A tutorial on novel item and person sampling procedures for personality research. European Journal of Personality, 33, 400 – 419. https://doi.org/10.1002/per.2195 First citation in articleCrossrefGoogle Scholar

  • Olaru, G., Witthöft, M. & Wilhelm, O. (2015). Methods matter: Testing competing models for designing short-scale Big-Five assessments. Journal of Research in Personality, 59, 56 – 68. https://doi.org/10.1016/j.jrp.2015.09.001 First citation in articleCrossrefGoogle Scholar

  • R Core Team. (2020). R. A language and environment for statistical computing. Vienna, Austria. First citation in articleGoogle Scholar

  • Reise, S. P., Bonifay, W. E. & Haviland, M. G. (2013). Scoring and modeling psychological measures in the presence of multidimensionality. Journal of Personality Assessment, 95 (2), 129 – 140. https://doi.org/10.1080/00223891.2012.725437 First citation in articleCrossrefGoogle Scholar

  • Revelle, W. (2011). An overview of the psych package. Dep Psychol Northwest Univ, 3, 1 – 25. First citation in articleGoogle Scholar

  • Rosseel, Y. (2012). lavaan : An R package for structural equation modeling. Journal of Statistical Software, 48 (2) https://doi.org/10.18637/jss.v048.i02 First citation in articleCrossrefGoogle Scholar

  • Satorra, A. & Bentler, P. M. (2001). A scaled difference chi-square test statistic for moment structure analysis. Psychometrika, 66 (4), 507 – 514. https://doi.org/10.1007/BF02296192 First citation in articleCrossrefGoogle Scholar

  • Schroeders, U., Wilhelm, O. & Olaru, G. (2016). Meta-heuristics in short scale construction. Ant colony optimization and genetic algorithm. PloS One, 11, e0167110. https://doi.org/10.1371/journal.pone.0167110 First citation in articleCrossrefGoogle Scholar

  • Smith, G. T., McCarthy, D. M. & Anderson, K. G. (2000). On the sins of short-form development. Psychological Assessment, 12, 102 – 111. https://doi.org/10.1037//1040-3590.12.1.102 First citation in articleCrossrefGoogle Scholar

  • Spinhoven, P., Penninx, B. W., Hickendorff, M., van Hemert, A., Bernstein, D. & Elzinga, B. M. (2014). Childhood trauma questionnaire. Factor structure, measurement invariance, and validity across emotional disorders. Psychological Assessment, 26. https://doi.org/10.1037/pas0000002 First citation in articleCrossrefGoogle Scholar

  • Sroufe, L. A., Egeland, B. & Carlson, E. A. (1999). One social world: The integrated development of parent-child and peer relationships. In W. A. CollinsB. Laursen (Eds.), Relationships as Developmental Contexts (pp. 252 – 273). London: Psychology Press. First citation in articleGoogle Scholar

  • Varese, F., Smeets, F., Drukker, M., Lieverse, R., Lataster, T., Viechtbauer, W. et al. (2012). Childhood adversities increase the risk of psychosis. A meta-analysis of patient-control, prospective- and cross-sectional cohort studies. Schizophrenia Bulletin, 38, 661 – 671. https://doi.org/10.1093/schbul/sbs050 First citation in articleCrossrefGoogle Scholar

  • Wegman, H. L. & Stetler, C. (2009). A meta-analytic review of the effects of childhood abuse on medical outcomes in adulthood. Psychosomatic Medicine, 71, 805 – 812. https://doi.org/10.1097/PSY.0b013e3181bb2b46 First citation in articleCrossrefGoogle Scholar

  • Widaman, K. F., Little, T. D., Preacher, K. J. & Sawalani, G. M. (2011). On creating and using short forms of scales in secondary research. In K. H. Trzesniewski, M. B. Donnellan & R. E. Lucas (Eds.), Secondary data analysis: An introduction for psychologists (pp. 39 – 61). Washington: American Psychological Association. First citation in articleGoogle Scholar

  • Wingenfeld, K., Spitzer, C., Mensebach, C., Grabe, H. J., Hill, A., Gast, U. et al. (2010). Die deutsche Version des Childhood Trauma Questionnaire (CTQ). Erste Befunde zu den psychometrischen Kennwerten. Psychotherapie, Psychosomatik, medizinische Psychologie, 60, 442 – 450. https://doi.org/10.1055/s-0030-1247564 First citation in articleCrossrefGoogle Scholar

  • Ziegler, M., Kemper, C. J. & Kruyen, P. (2014). Short scales–Five misunderstandings and ways to overcome them: Boston: Hogrefe Publishing. First citation in articleLinkGoogle Scholar

  • Zinbarg, R., Revelle, W., Yovel, I. & Li, W. (2005). Cronbach’s alpha, Revelle’s beta, and McDonald’s omega h. Their relations with each other and two alternative conceptualizations of reliability. Psychometrika, 70, 123 – 133. First citation in articleCrossrefGoogle Scholar

  • Zou, G. Y. (2007). Toward using confidence intervals to compare correlations. Psychological Methods, 12, 399. First citation in articleGoogle Scholar

1Für die hier beschriebene APK-Kurzversion ergibt die Auswahl von 16 aus 59 Items mit der Bedingung von 2 Items pro Faktor insgesamt = 30 472 200 mögliche Modelle.