Skip to main content
Open AccessOriginalarbeit

Längsschnittliche psychometrische Analysen des Fragebogens zur Beziehungszufriedenheit – Kurzform (FBZ-K)

Befunde zur Stabilität und Konstruktvalidität

Published Online:https://doi.org/10.1026/0012-1924/a000312

Abstract

Zusammenfassung: Kurze diagnostische Instrumente zur Erfassung von Beziehungsqualität sind für den klinischen Alltag notwendig, wie z. B. die sieben Items umfassende Abbreviated Dyadic Adjustment Scale (ADAS; dt.: Fragebogen zur Beziehungszufriedenheit – Kurzform, FBZ-K). Ziel ist es, die psychometrische Qualität der FBZ-K zu untersuchen und mit den Daten der ADAS zu vergleichen. Für den Vergleich wurden in einer ersten Studie 422 Mütter rekrutiert. In einer zweiten Studie wurden Daten von 424 Eltern (223 Mütter, 201 Väter) verwendet, die im Rahmen einer Langzeitstudie über 10 Jahre zu sechs Messzeitpunkten untersucht wurden. Die psychometrischen Kennwerte der FBZ-K entsprachen denen der ADAS. Die interne Konsistenz mit α = .84 und die 1-Jahres-Retest-Reliabilität mit r = .75 sind gut, die Konstrukt- und prognostische Validität zur Vorhersage von Scheidung kann als in hohem Maße als gegeben gelten. Die FBZ-K kann daher als Screening-Instrument in epidemiologischen Studien und in der klinischen Praxis zur Eingangsmessung und Prozessforschung empfohlen werden.

Longitudinal Psychometric Analyses of the German Short Form of the Abbreviated Dyadic Adjustment Scale (ADAS). Results on Stability and Validity

Abstract: Short diagnostic instruments to assess the relationship quality are necessary for everyday clinical practice, such as the 7-item Abbreviated Dyadic Adjustment Scale (ADAS; German version: Fragebogen zur Beziehungszufriedenheit – Kurzform, FBZ-K). The present study examined the psychometric quality of the FBZ-K and compared it with the data from the ADAS. For this comparison, we recruited 422 mothers in an initial study. A second study used data from 424 parents (223 mothers, 201 fathers) assessed with the FBZ-K at six measurement time points over 10 years. Since the psychometric parameters of the FBZ-K highly corresponded to those of the ADAS, a successful cross-cultural adaptation of the ADAS may be assumed. The internal consistency of α = .84 and the 1-year retest reliability of r = .75 were good. Furthermore, the construct and prognostic validity to predict divorce can be considered high. The FBZ-K has very good reliability and validity and can therefore be recommended as a screening instrument in epidemiological studies and in clinical practice for intake assessment and process research.

Die Qualität intimer Beziehungen hat sich als wichtiger Indikator für das Wohlbefinden von Erwachsenen, Paaren und Kindern erwiesen. Partnerschaftsprobleme sind daher in der klinischen Praxis sehr häufig Gegenstand psychotherapeutischen Handelns. Immer mehr Paare suchen qualifizierte Beratung auf (Schindler, Hahlweg & Revenstorf, 2019). Aber nicht nur in der Paartherapie (Paarberatung und Paartherapie werden hier synonym gebraucht), sondern auch bei der psychotherapeutischen Behandlung vieler psychischer Störungen (Depressionen, Ängste, psychosomatische Störungen, Abhängigkeiten) werden Partner mit in die Therapie einbezogen (Baucom, Fischer, Corrie, Worrell & Boeding, 2020). Beispielsweise erhöht sich das Risiko, an einer psychischen Störung zu erkranken, signifikant durch die Unzufriedenheit mit der Partnerschaft (Whisman, 2007). Des Weiteren wird die Partnerschaft als bedeutsamer Einflussfaktor auf die Lebensqualität von Patienten mit chronischen somatischen Erkrankungen wie z. B. Krebs, Herz-Kreislauferkrankungen oder Diabetes betrachtet (Robles, Slatcher, Trombello & McGinn, 2014). In einer Metaanalyse von Sbarra, Law und Portley (2011) zeigte sich, dass Getrennte und Geschiedene im Vergleich zu Verheirateten ein signifikant höheres Risiko hatten, vorzeitig zu sterben. Ein weiterer Anwendungsbereich ist die Kinder- und Jugendpsychotherapie. Die Partnerschaft der Eltern ist der Dreh- und Angelpunkt des familiären Funktionierens. Destruktive Paarkonflikte und Scheidung können die emotionale Sicherheit der Kinder in der Familie bedrohen und gelten als einer der gewichtigsten Risikofaktoren, die das Erziehungshandeln negativ beeinflussen und verhindern, dass die elterlichen Ressourcen angemessen für die Entwicklung der Kinder eingesetzt werden (Cummings & Davis, 2010; Hahlweg & Bodenmann, in Druck).

Der Einbezug von Familienangehörigen in die individuelle Psychotherapie kann die Therapieplanung verbessern, die Wirksamkeit der Therapie erhöhen und Rückfälle verhindern (Baucom et al., 2020). Dieses weite Einsatzspektrum erfordert validierte und möglichst auch normierte diagnostische Instrumente für den Paarbereich, insbesondere besteht ein erheblicher Bedarf an (Früh–)‌Erkennung von sich verschlechternden Beziehungen, bevor ernsthafte und irreversible Verschlechterungen der Beziehungsqualität entstanden sind (Hahlweg, 2016).

Fragebögen zur Erfassung der Beziehungsqualität

Im deutschen Sprachraum wird zur Erfassung der Zufriedenheit mit der intimen Beziehung der 31 Items umfassende Partnerschaftsfragebogen (PFB; Hahlweg, 2016) bevorzugt eingesetzt. Andere, vor allem international verbreitete Instrumente zur Erfassung der Partnerschaftsqualität sind der Marital Adjustment Test (MAT; 15 Items; Locke & Wallace, 1959), die Dyadic Adjustment Scale (DAS; 32 Items; Spanier, 1976; Klann, Hahlweg & Heinrichs, 2003), das Marital Satisfaction Inventory (MSI; 150 Items; Snyder, 1981; Klann, Hahlweg, Limbird & Snyder, 2006), das Quality of Relationship Inventory (QRI; 25 Items; Reiner, Beutel, Skaletz, Brähler & Stöbel-Richter, 2012) oder der Couples Satisfaction Index (CSI; 32 Items; Funk & Rogge, 2007). Eine Übersicht weiterer Selbst- und Fremdbeurteilungsverfahren finden sich in Heinrichs (2006), Klann, Hahlweg und Heinrichs (2003) und Richter, Brähler und Ernst (2015). Die meisten der Fragebögen erscheinen jedoch auf Grund ihrer Länge nur sehr bedingt für den Einsatz im Rahmen von epidemiologischer Forschung, zum Screening von Partnerschaftskonflikten, zur psychotherapeutischen Qualitätssicherung und für die Prozessdiagnostik geeignet.

Kurzfragebögen zur Erfassung der Beziehungsqualität

International wurden daher verschiedene Kurzfragebogen zur unidimensionalen Erfassung der Partnerschaftsqualität bzw. –zufriedenheit entwickelt, die auch in deutscher Übersetzung vorliegen, so zum Beispiel der Quality of Marriage Index (QMI; 6 Items; α = .95; Norton, 1983; deutsche Version: Zimmermann, de Zwaan & Heinrichs, 2019), die Relationship Assessment Scale (RAS; 7 Items; α = .95; Hendrick, 1988; deutsche Version: Zufriedenheit in Partnerschaften, ZIP; Dinkel & Balck, 2005) und der Partnerschaftsfragebogen PFB – Kurzform (PFB-K; 10 Items, 3 Subskalen; α = .84; Hahlweg, 2016).

Diese Entwicklung hat jedoch leider die Verbreitung nicht standardisierter, lokal konstruierter und zu kurzer Instrumente gefördert, die meist aus eher redundanten Items bestehen (z. B. „Wir haben eine gute Partnerschaft“, „Wie glücklich sind Sie mit Ihrem Ehepartner?“, „Meine Beziehung mit meinem Partner macht mich glücklich“; QMI, Zimmermann et al., 2019).

Ziele der vorliegenden Arbeit

Die Dyadic Adjustment Scale (DAS; Spanier, 1976; deutsche Version: Fragebogen zur Beziehungszufriedenheit FBZ in Klann et al., 2003, S. 59 – 62; Bearbeitungszeit 5 bis 10 Minuten) wurde bisher in über 1 000 internationalen Studien eingesetzt (Spanier, 1988) und ist im angloamerikanischen Sprachraum der am häufigsten eingesetzte Fragebogen zur Bestimmung von Ehequalität. Hahlweg, Klann und Hank (1992) konnten die Reliabilität und Validität der DAS für den deutschen Sprachraum replizieren. Sharpley und Rogers publizierten 1984 eine sieben Items umfassende Kurzform der DAS, die Abbreviated Dyadic Adjustment Scale (ADAS, 1984). Mit Hilfe von Diskriminanzanalysen identifizierten die Autoren die Items, die am besten zwischen glücklichen und unglücklichen Partnern differenzierten.

In der Folge wurden weitere Kurzformen der DAS mit unterschiedlichen Itemanzahlen publiziert: DAS-10 Items (Kurdek, 1992), DAS-14 (Busby, Christensen, Crane, & Larson, 1995), DAS-4 (Sabourin, Valois & Lussier, 2005) und DAS-12 (Dinkel & Balck, 2006). Alle Skalen weisen gute interne Konsistenzen auf (α = .76 – .96) und korrelieren bedeutsam mit der DAS-Langform und anderen Fragebögen zur Erfassung der Beziehungsqualität. Problematisch ist jedoch, dass die Übereinstimmung der Items der einzelnen Skalen sehr gering ist, so haben z. B. die DAS-7 und DAS-4 nur ein gemeinsames Item (Sabourin et al., 2005).

Ziele der vorliegenden Arbeit war zum einen, mit Hilfe von zwei Studien, darunter eine Längsschnittstudie über 10 Jahre, die psychometrische Qualität der deutschen ADAS-Version (Fragebogen zur Beziehungszufriedenheit – Kurzform; FBZ-K; Köppe, 2001) zu überprüfen (Trennschärfe, Re-Test-Reliabilität, faktorielle Validität) und mit den Daten der Originalversion zu vergleichen. Zum anderen sollte die Konstruktvalidität und die Prognosevalidität der FBZ-K zur Vorhersage der langfristigen Partnerschaftszufriedenheit überprüft werden.

Zur Überprüfung der Konstruktvalidität wird zwischen individuellen Merkmalen (elterliche psychische Belastung, Lebenszufriedenheit), auf die Erziehung bezogenen Merkmalen (Coparenting, funktionales bzw. dysfunktionales Erziehungsverhalten) sowie kindlichen Verhaltensproblemen und emotionalen Auffälligkeiten (internalisierende. externalisierende Auffälligkeiten) unterschieden. Nach dem Stand der Literatur korrespondieren diese Merkmale mit der Partnerschaftszufriedenheit, und zwar sowohl aus Mütter- als auch aus Vätersicht (nomologisches Netzwerk). Erwartet werden durchgängig signifikante Zusammenhänge, wobei – gemäß dem Stand der Forschung – mittlere bis hohe Effektstärken für die psychische Belastung, die Lebenszufriedenheit und das Coparenting und mittlere bis geringe Effektstärken für das Erziehungsverhalten und eher geringe Effektstärken für die kindlichen Auffälligkeiten angenommen werden (Baucom et al., 2020; Cummings & Davis, 2010; Hahlweg & Bodenmann, in Druck; siehe auch Einleitung). Die Interpretation der Effektstärke orientiert sich an den üblichen Richtwerten: d ≥ 0.20 bzw. r ≥ .10 kleiner Effekt, d ≥ 0.50 bzw. r ≥ 30 mittlerer Effekt, d ≥ 0.80 bzw. r ≥ 50 großer Effekt (Cohen, 1988). Weiterhin werden als weiterer Aspekt der Konstruktvalidität hohe Zusammenhänge zwischen Mutter- und Vaterzufriedenheit angenommen (Hahlweg, 2016). Unumstritten ist, dass die Beziehungsqualität mit der späteren Trennungs- und Scheidungsrate korreliert (Karney & Bradbury, 1995). Ist dies der Fall, spricht das ebenfalls für die Güte der FBZ-K (Prognosevalidität). Schließlich werden längsschnittliche Befunde zur zeitlichen Stabilität berichtet, die für epidemiologische und klinische Fragestellungen von Bedeutung sein können.

Bei hohen Kennwerten zu Reliabilität und Validität könnte die FBZ-K eine geeignete Alternative zu den bestehenden Kurzformen darstellen, zumal die ADAS-Items keine inhaltlichen Redundanzen aufweisen. Weiterhin ist die lizenzfreie ADAS international verbreitet und wird in englischsprachigen Publikationen leichter akzeptiert als deutschsprachige Instrumente.

Zur Verdeutlichung der Zielsetzung dieser Studien und zum gewählten methodischen Vorgehen sei hier noch auf folgende Aspekte hingewiesen (Ziegler, 2014):

1. Mit dem FBZ-K wird das Konstrukt Beziehungszufriedenheit erfasst. Im Gegensatz z. B. zur Qualität der Partnerbeziehung verweist dieses Konstrukt auf den evaluativen Aspekt der Paarbeziehung und betont die subjektive Perspektive der Partner. Die psychometrische Prüfung zielt vor allem darauf ab zu überprüfen, ob der FBZ-K tatsächlich das Konstrukt Beziehungszufriedenheit misst. Daher kommt der Überprüfung der Konstruktvalidität eine zentrale Bedeutung zu. Es ist nicht das Ziel, auf der Basis von FBZ-K Befunden im Einzelfall diagnostische Entscheidungen zu treffen.

2. Die FBZ-K dient in erster Linie der epidemiologischen und klinischen Forschung. Ob sich der FBZ-K für die Indikation therapeutischer Entscheidungen oder zur Verlaufskontrolle im Rahmen der Therapiestudien eignet, wären interessante Fragen, diese können allerdings mit den Designs dieser Studie nicht beantwortet werden.

3. Prinzipiell sollte mit dem FBZ-K das ganze Spektrum stabiler intimer Beziehungen erfasst werden (verheiratet oder zusammenlebend, heterosexuelle, homosexuelle usf.). Nicht gemeint sind beispielsweise berufliche Partnerschaften. Diese Studie beschränkt sich auf verheiratete und zusammenlebende heterosexuelle Paare mit Kindern. Die externe Validität ist damit eingeschränkt.

Studie 1: Braunschweiger Kindergartenstudie

Die im Rahmen der Braunschweiger Kindergartenstudie (Kita-Studie; Kuschel et al., 2004) durchgeführte Untersuchung sollte Aufschluss über die Prävalenz psychischer Auffälligkeiten bei drei- bis sechsjährigen Kindern geben. Die Studie wurde parallel zu einer australischen Untersuchung der Arbeitsgruppe von Prof. Dr. Matthew Sanders (University of Queensland, Brisbane, Australien) geplant und im November 1998 in enger Kooperation mit dem Jugendamt der Stadt Braunschweig in den städtischen Kindertagesstätten durchgeführt. Die englischsprachigen Fragebögen wurden übersetzt und rückübersetzt. Alle deutschsprachigen Eltern von Kindergartenkindern (N = 1 800) wurden gebeten, Fragebögen zur sozioökonomischen Lage der Familie, dem Verhalten der Kinder, dem Erziehungsverhalten der Eltern, ihrer Zufriedenheit und ihrem Kompetenzgefühl im Zusammenhang mit der Elternrolle, ihrer persönlichen Befindlichkeit und ihrer Zufriedenheit mit der Partnerschaft zu beantworten. Den Eltern war freigestellt, wer den Fragebogen bearbeitete, zudem war es möglich, dass beide Elternteile den Fragebogen gemeinsam beantworteten. Sie wurden angewiesen, sich auf das Kind zu beziehen, welches den Kindergarten besuchte.

Stichprobenbeschreibung. Es wurden insgesamt N = 852 verwertbare Fragebogenpakete zurückgegeben, was einer Rücklaufquote von 47 % entsprach. Die Alters- und Geschlechtsverteilung der Kinder ist repräsentativ für Kindergartenkinder: Das durchschnittliche Alter lag bei 4,3 Jahren (SD = 1.0), 53 % waren Jungen. Die meisten Fragebogen wurden von den Müttern ausgefüllt (69 %, n = 570), 25 % (n = 206) der Eltern bearbeiteten den Fragebogen gemeinsam und 6 % (n = 46) der Väter beantworteten das Instrumentarium. In dieser Arbeit wird nur die Stichprobe der Mütter, die mit ihrem Partner in einem Haushalt zusammenlebten (n = 422), verwendet. Die Beziehung der Partner bestand im Durchschnitt M = 11 Jahre (SD = 5 Jahre). 40 % der Mütter hatten einen Realschul-‍, 24 % einen Haupt- oder Sonderschulabschluss, 17 % Abitur / Fachabitur und 19 % einen Hochschul- oder Fachhochschulabschluss.

Instrumente

Die Kurzversion ADAS von Sharpley und Rogers (1984) erfasst mit sieben Items die subjektiv erlebte Zufriedenheit mit der Partnerschaft. Die deutsche Version (Fragebogen zur Beziehungszufriedenheit – Kurzform; FBZ-K; Köppe, 2001) wurde von Muttersprachler_innen aus dem englischen Original übersetzt und rückübersetzt. Mit drei Items wird der Grad der Übereinstimmung (immer einig [0] bis immer uneinig [5]) in den Bereichen Weltanschauung, Dinge und Ziele, die wir für wichtig halten und gemeinsam verbrachte Zeit erfragt. In weiteren drei Items wird die Häufigkeit, wie oft ein anregender Gedankenaustausch zwischen den Partnern stattfindet, die Partner in Ruhe miteinander diskutieren und die Partner an einem gemeinsamen Vorhaben arbeiten, erfasst. Die Häufigkeitsangaben reichen von nie (0), über wenigstens einmal im Monat (1), ein- oder zweimal im Monat (2), ein- oder zweimal in der Woche (3), einmal am Tag (4) bis öfter (5). Wie glücklich bzw. unglücklich im Augenblick die Partnerbeziehung ist, wird mit einem globalen Item (Item 7) auf einer siebenstufigen Skala von extrem unglücklich (0) bis perfekt (6) eingeschätzt.

Die Auswertung des FBZ-K erfolgt durch Aufsummierung der sieben Items, sodass der Gesamtwert von 0 bis 36 Punkten reichen kann. Nach Sharpley und Rogers (1984) zeigen Gesamtwerte unter 17.1 Punkten eine geringe Zufriedenheit mit der Partnerschaft an, Gesamtwerte mit mehr als 22.5 Punkten weisen dagegen auf eine durchschnittliche bis hohe Zufriedenheit hin.

Hunsley, Best, Lefebre und Vito (2001) untersuchten die psychometrischen Aspekte der ADAS. In einer ersten Studie wurden Daten von 148 Klient_innen in Ehetherapie und 122 Paaren ohne Therapiewunsch verwendet, um die Kriteriumsvalidität der ADAS zu bewerten. Es zeigten sich signifikante Unterschiede zwischen beiden Gruppen. In einer zweiten Studie an 162 verheirateten Paaren wurde die Reliabilität und konvergente Validität der ADAS untersucht. Die Werte waren mit denen vergleichbar, die Sharpley und Rogers (1984) berichteten.

Ergebnisse

Psychometrische Kennwerte und Vergleich ADAS und FBZ-K. Der mittlere Gesamtwert des FBZ-K betrug M = 22.8 (SD = 5.8) mit einer Spannweite von 0 bis 36. Dieser lag ähnlich hoch wie der ADAS-Mittelwert und die Standardabweichung der australischen Stichprobe der Verheirateten (N = 453, M = 23.2, SD = 5.4; Sharpley & Rogers, 1984) und im Bereich durchschnittlicher bis hoher Partnerschaftszufriedenheit. Auch die Mittelwerte der einzelnen Items sind mit den Mittelwerten der ADAS-Stichprobe vergleichbar (höchste Differenz 0.7 Punkte, siehe Tabelle E1). Es erschien daher gerechtfertigt, die Trennwerte für die Klassifikation von Köppe (2001) und Sharpley und Rogers (1984) auch auf die FBZ-K anzuwenden. Danach weisen Gesamtwerte ≤ 17 Punkte auf eine geringe Zufriedenheit mit der Partnerschaft (hier 17 %), Gesamtwerte zwischen 18 und 22 auf eine mittlere (27 %) und Gesamtwerte ≥ 23 Punkte auf eine höhere Zufriedenheit hin (56 %; siehe ESM-Tabelle E1).

Die mittlere Trennschärfe betrug ritKita = .59 (Range .43 – .71). Lediglich Item 1 lag mit rit = .43 unter dem von Sharpley und Rogers (1984) angegebenen Mittelwert. Die Reliabilitäts-Schätzung des FBZ-K ergab eine interne Konsistenz von α = .84 und war damit numerisch höher als bei der ADAS mit α = .76. Die durchschnittliche Inter-Korrelation lag bei rKita = .42 (ESM-Tabelle E1).

Konfirmatorische Faktorenanalyse. Zur Überprüfung der Eindimensionalität des FBZ-K wurde zunächst für die Mütter der Kita-Stichprobe (N = 417) eine konfirmatorische Faktorenanalyse gerechnet. Als Schätzmethode wurde die Maximum-Likelihood-Methode verwendet. Die Berechnungen erfolgten mit dem Programm MPlus Version 7.31 (Muthén & Muthén, 2017). Zur Bestimmung der Modellgüte werden zusätzlich zum χ²-Test, welcher bei großen Stichproben schnell signifikant wird, Fit-Indizes berichtet, um die Passung der Modelle zu den Daten zu überprüfen. Als Fit-Indizes werden der Root Mean Square of Error Approximation (RMSEA), der Comparative Fit Index (CFI), der Tucker Lewis Index (TLI) und das Standardized Root Mean Square Residual (SRMR) berechnet. Bei χ²/df ≤ 3, RMSEA ≤ .08, CFI ≥ .95, TLI ≥ .95 und SRMR ≤. 10 kann von einer akzeptablen, χ²/df ≤ 2, RMSEA ≤ .05, CFI ≥ .97, TLI ≥ .97 und SRMR ≤ .05 von einer guten Passung des Modells ausgegangen werden (Gäde, Schermelle-Engel & Brandt, 2020).

Die Ergebnisse sind der Tabelle E5 im ESM zu entnehmen. Da keiner der Fit-Indizes die Grenzwerte für einen akzeptablen Modell-Fit erreicht, muss das mittels unserer Daten geprüfte Modell abgelehnt und damit die Eindimensionalität in Zweifel gezogen werden. Die Ladungen schwanken zwischen .45 und .81. In einem nächsten Schritt wurde anhand der von MPlus vorgeschlagenen „modification indices“ eine Modellverbesserung getestet, indem die Korrelationen der Fehlerterme zwischen den Items 4 und 5, 4 und 6, 1 und 2 sowie 5 und 6 berücksichtigt wurden. Diese Modifikation führte zu einer deutlichen Verbesserung des Modells, sämtliche Fit-Indizes sprechen nach der durchgeführten Anpassung für einen guten Model-Fit (χ²/df = 1.6, RMSEA = .04, CFI = .99, TLI = .99, SRMR = .02). Die Ladungen schwanken zwischen .45 und .73.

Eine inhaltliche Betrachtung der einzelnen Items und der Korrelationen zeigen, dass die Items 4, 5 und 6 (Gedankenaustausch, diskutieren miteinander, gemeinsame Vorhaben) gemeinsame Aspekte erfassen (Kohäsion); ebenso die Items 1 und 2 (Weltanschauung, wichtige Dinge / Ziele; Konsens). Die Spezifikationen sind demnach auch inhaltlich nachvollziehbar.

Betrachtet man weiterhin die Ladungen und die Trennschärfen der einzelnen Items, so wird deutlich, dass zumindest Item 1 geringere bzw. die geringsten Werte aufweist. Item 1 (ggf. auch Item 2) misst möglicherweise einen anderen Aspekt der Beziehungszufriedenheit. Allerdings weisen auch die Trennschärfen und Ladungen zufriedenstellende Werte auf.

FBZ-K und soziodemografische Variablen. Zwischen dem Gesamtwert des FBZ-K und soziodemographischen Variablen wie dem Geschlecht und Alter des Kindes, der Anzahl der Kinder, dem Alter, dem Bildungsabschluss und der Arbeitszeit der Mütter sowie dem Haushaltsnettoeinkommen der Familie und der Dauer der Partnerschaft bestanden keine signifikanten Korrelationen (siehe ESM-Tabelle E6).

Insgesamt sprechen die psychometrischen Befunde der Kita-Studie für die Güte des FBZ-K. Sie entsprechen auch der australischen Ursprungsversion ADAS.

Studie 2: Projekt Zukunft Familie (ZF)

Die Erhebungen erfolgten im Rahmen der DFG-Projekte Zukunft Familie I (ZF I) und Zukunft Familie III (ZF III). Bei der ZF I-Studie (Heinrichs et al., 2006) handelt es sich um eine randomisierte Kontrollgruppenstudie, in der die Wirksamkeit des Elterntrainings Triple P (Positive Parenting Program; Sanders, 2012) mit den Messzeitpunkten Prä, Follow-up 1 (FU1, Responderrate: 99 %), FU2 (99 %), FU3 (99 %) und FU4 (4 Jahre nach Prä, 90 %) untersucht wurde. Innerhalb der ZF III-Studie (Hahlweg & Schulz, 2018; Responderrate: 89 %) wurde die zehnjährige Wirksamkeit des Triple P und die Vorhersage von Verhaltensauffälligkeiten im Jugendalter (FU10) unter Berücksichtigung von Risiko- und Schutzfaktoren im Kindergartenalter (Prä) exploriert. Zu allen Messzeitpunkten wurde der FBZ-K vorgegeben.

Methode

Durchführung

Mithilfe des Kita-Sozialstrukturindex (Maß der soziodemografischen Struktur des Einzugsbereiches [OKS]; Bäse, 1995) und der Anzahl der Kinder wurden 17 zufällig ausgewählte Kitas in Braunschweig parallelisiert und anschließend randomisiert. Zur Erhebung der Daten wurde eine Kombination von Interviews und standardisierten Fragebögen gewählt. Nach Einwilligung der Familie wurden in der Regel während eines Hausbesuches das Kind bzw. der Jugendliche und ein Elternteil in parallel stattfindenden Gesprächen getrennt voneinander befragt. Für den Hausbesuch wurden pro Familie maximal 2.5 Stunden benötigt. Die Interviewten erhielten eine Aufwandsentschädigung von 40 €.

Stichprobenbeschreibung

Insgesamt konnten N = 280 Familien (MMütter = 35,2 Jahre, SD = 5,0; MVäter = 38.5 Jahre, SD = 6.1; MKinder = 4.5 Jahre, SD = 1.0; 51 % Jungen) rekrutiert werden. Alleinerziehend waren zu Prä n = 61 (22 %) und verheiratet bzw. zusammenlebend n = 219 (78 %) der Familien. Der FBZ-K wurde außer von den Verheirateten bzw. Zusammenlebenden auch von den Alleinerziehenden ausgefüllt, die angaben, aktuell eine_n Partner_in zu haben. Insgesamt lag der FBZ-K von den Müttern zu den einzelnen Zeitpunkten wie folgt vor: Prä: N = 233, FU1: N = 234, FU2: N = 232, FU3: N = 223, FU4: N = 205 und FU10: N = 213 (Mittelwert: N = 223); Väter: Prä: N = 201, FU1: N = 201, FU2: N = 197, FU3: N = 190, FU4: N = 175 und FU10: N = 182 (Mittelwert: N = 191). Die Beteiligung der Väter im Vergleich zu den Müttern liegt demnach bei durchschnittlich 86 % (zu den Gründen für die geringere Väterbeteiligung siehe Schulz, Hahlweg & Supke, 2022).

Rund 24 % der Familien gehörten der unteren, 34 % zur mittleren und 42 % zur höheren Schicht an (lt. OKS). Die Rücklaufraten der Follow-ups waren sehr hoch (s. o.), sodass sich hinsichtlich der soziodemographischen Kennwerte nur sehr geringe Veränderungen ergaben, die hier nicht berichtet werden. Zu FU10 waren 35 Paare (14 %) geschieden oder getrennt, 173 (70 %) lebten stabil über den Untersuchungszeitraum mit derselben Partner_in zusammen, 28 (11 %) lebten in instabilen Beziehungen (zu Prä ohne Partner_in, im Verlauf mit neuer Partner_in oder wechselnden Partner_innen) und 13 (5 %) waren stabil alleine über den Untersuchungszeitraum.

Instrumente

Bei allen Untersuchungen wurden neben dem FBZ-K folgende Messinstrumente verwendet:

Erziehungskonfliktskala (EKS). Die EKS ist die deutsche Fassung (Kröger et al., 2009) der Parent Problem Checklist (PPC; Dadds & Powell, 1991). Ziel ist, die Güte des Coparenting der Eltern zu erfassen, das heißt, ob und wie gut es Eltern gelingt, in der Erziehung als Team zusammenzuwirken und in welchen Bereichen sich Diskrepanzen ergeben. Mit 16 Items beschreibt der Fragebogen typische Konfliktfelder im Zusammenhang mit der Erziehungsaufgabe (z. B. Streit in Gegenwart der Kinder), die dahingehend beurteilt werden, inwieweit sie für das Paar im Verlauf der letzten vier Wochen ein Problem dargestellt haben (1 = trifft nicht zu bis 4 = trifft zu). Die interne Konsistenz ist mit α = .89 sehr gut (Kröger et al., 2009).

Erziehungsfragebogen (EFB). Der Erziehungsfragebogen (Naumann et al., 2010) ist die deutsche Übersetzung der Parenting Scale (PS; Arnold, O’Leary, Wolff & Acker, 1993). Mit 35 Items wird elterliches Erziehungsverhalten bei problematischem Kindverhalten bipolar (effektiv vs. ineffektiv) beschrieben. Das eigene Verhalten soll bezüglich der letzten zwei Monate auf einer siebenstufigen Antwortskala zwischen den beiden Verhaltensankern eingestuft werden. Höhere Gesamtwerte zeigen schlechteres elterliches Erziehungsverhalten an. Der EFB konnte in vorangehenden Studien zwischen Eltern klinischer und nicht klinischer Stichproben differenzieren (Arnold et al., 1993). Die internen Konsistenzen der Stichproben Zukunft Familie I sind mit αMütter = .80 und αVäter = .74 befriedigend bis gut (Naumann et al., 2010).

Fragebogen zur Lebenszufriedenheit (FLZ). Der FLZ (Henrich & Herschbach, 2000) ist ein Instrument zur Erfassung der subjektiven Lebensqualität. Es wird die Lebenszufriedenheit für acht Bereiche erhoben (Gesundheit, Beruf / ‌Arbeit, Finanzielle Situation, Freizeitgestaltung / Hobbys, Familienleben / Kinder, Partnerschaft / Sexualität, Freunde / ‌Bekannte und Wohnsituation). Die interne Konsistenz für den Gesamtwert beträgt für Mütter α = .76 (für Väter .75) und ist damit befriedigend. Der FLZ wurde an einer repräsentativen deutschen Stichprobe normiert (Daig et al., 2011).

Depression-Angst-Stress-Fragebogen (DASS). Der DASS (Köppe, 2001) ist die deutsche Übersetzung der Depression-Anxiety-Stress Scale (Lovibond & Lovibond, 1995). Der DASS besteht aus 42 Items, in denen verschiedene psychische Symptome beschrieben und hinsichtlich ihres Vorkommens in den letzten vier Wochen beurteilt werden sollen (0 = nie bis 3 = sehr oft). Die Antworten lassen sich zu den drei Skalen mit jeweils 14 Items Depressive Gestimmtheit, Angst und Stressbelastung und einem Gesamtwert zusammenfassen. Die interne Konsistenz des DASS-Gesamtwertes beträgt α = .96.

Elternfragebogen über das Verhalten von Klein- und Vorschulkindern (CBCL 1½ – 5) bzw. von Kindern und Jugendlichen (C‍B‍CL 4 – 16). Die Child Behavior Checklist List 1½ – 5 und 4 – 18 (CBCL, Achenbach, 1991; deutsche Version: Döpfner, Plück, Kinnen & Arbeitsgruppe Deutsche Child Behavior Checklist, 2014) beschreibt in 100 (bzw. 113) Items verschiedene Verhaltensprobleme und emotionale Auffälligkeiten. Die Aussagen sollen von den Eltern hinsichtlich der Häufigkeit bzw. des Zutreffens beurteilt werden (0 = nicht zutreffend bis 2 = genau / häufig zutreffend). Die Items lassen sich neben einem Gesamtwert (α = .94 Mütter / 96 Väter) zu den übergeordneten Skalen Internalisierende Störungen (α = .86/.89) und Externalisierende Störungen = .90/.92) zusammenfassen.

Ergebnisse

Ziele der Studie 2 waren zum einen die Ermittlung der deskriptiven Werte (Mittelwerte und Standardabweichungen, Prävalenz der FBZ-K-Zufriedenheitseinschätzungen) sowie der psychometrischen Kennwerte (Trennschärfen, interne Konsistenz, Faktorenstruktur, Konstrukt- und Prognosevalidität) der deutschsprachigen FBZ-K anhand der Prä-Messung der ZF- Studie und damit eine Replikation der Ergebnisse der Kita-Studie. Zum anderen sollte die zeitliche Stabilität der FBZ-K über die Follow-ups 1, 2, 3, 4 und 10 Jahre nach der Prä-Messung überprüft werden, darüber hinaus auch hinsichtlich der deskriptiven Werte und der psychometrischen Kennwerte.

Statistische Analysen

Die FBZ-K liegt in Abhängigkeit vom Messzeitpunkt für Mütter zwischen N = 205 und 234 und für Väter zwischen N = 175 und 201 vor. Fehlte die Angabe von einem der sieben Items des FBZ-K, so wurde dieses Item durch den individuellen Mittelwert ersetzt; bei mehr als einer fehlenden Item-Beantwortung wurde der Fragebogen von der Auswertung ausgeschlossen. Fehlende Werte gab es in weniger als 1 % der Item-Beantwortungen. Bei den anderen Fragebögen wurde entsprechend verfahren (maximal 15 % fehlender Werte wurden ersetzt).

Deskriptive Statistik

Der mittlere FBZ-K Gesamtwert zu Prä betrug bei den ZF-Müttern M = 22.8 (SD = 5.3) und entsprach damit dem der Mütter aus der Kita-Stichprobe (M = 22.8, SD = 5.8). Der Wert der ZF-Väter zu Prä lag mit M = 23.3 (SD = 5.0) etwas höher (siehe Tabelle 1). Auch die Item-Mittelwerte der Kita-Studie sind mit denen der ZF-Stichprobe vergleichbar; die höchste absolute Differenz zu der KITA-Stichprobe bei ZF-Müttern betrug 0.2 Punkte, bei ZF-Vä‍tern 0.3 Punkte. Auch die Verteilung innerhalb der Zufriedenheits-Klassifikation (Köppe, 2001; Sharpley & Rogers, 1984) waren bei den Kita-Müttern ähnlich wie bei den ZF-Müttern: unzufrieden 17 % vs. 15 % (Väter 11 %), mittlere Zufriedenheit: 27 % vs. 28 % (Väter 33 %), durchschnittliche bis hohe Zufriedenheit 56 % vs. 57 % (Väter 56 %).

Tabelle 1 FBZ-K: Item Mittelwerte (M), Standardabweichung (SD), interne Konsistenz (α), Trennschärfen (rit), Item-Interkorrelationen und Zufriedenheitsklassifikationen für KITA-Stichprobe (Studie 1) und ZF1 Prä (Mütter, Väter)

Die deskriptiven Ergebnisse sämtlicher Messzeitpunkte sind den ESM-Tabellen E2a und 2b zu entnehmen. Von einer Ausnahme abgesehen entsprechen die Mittelwerte, Standardabweichungen und die Häufigkeiten der drei Zufriedenheitsklassen sowohl für Mütter als auch Väter den Prä-Werten. Von Prä zu FU4 ergeben sich keine signifikanten geschlechtsspezifischen Unterschiede bezüglich der FBZ-K-Mittelwerte. Lediglich für den Zeitpunkt FU10 ist der Gesamtwert für die Mütter signifikant niedriger als der der Väter. Insgesamt zeigt sich ein hohes Maß an Übereinstimmung sowohl zwischen der Kita-Studie und der ZF-Studie als auch zwischen den verschiedenen Messzeitpunkten der ZF-Studie.

Trennschärfe, interne Konsistenz und Homogenität

Die mittlere Trennschärfe betrug bei den KITA-Müttern rit = .59, bei den ZF-Müttern zu Prä rit = .55 (Väter .57) und auch die internen Konsistenzen des FBZ-K waren mit α‍K‍I‍T‍A = .84 vs. αZFMu = .81 (.82) sehr ähnlich. Die Inter-Item-Korrelation lag bei rMütter = .38 (.40) im Vergleich zu r = .42 der Kita-Studie (Tabelle 1). Insgesamt konnten die Ergebnisse der Kita-Stichprobe durch die unabhängig erhobene ZF-Stichprobe Prä voll repliziert werden, dies sowohl für die Mütter- als auch Väter-Stichprobe. Die Werte für Trennschärfe, interne Konsistenz und Homogenität der Messzeitpunkte FU1 bis FU10 entsprechen denen der Kita-Studie und ZF-Prä sowohl für Mütter als auch Väter (ESM-Tabellen E2a, E2b, E3).

Re-Test-Reliabilität

Bisher gab es keine Studie, in der die Re-Test-Reliabilität der ADAS bzw. FBZ-K überprüft wurde. Es wurden getrennt für Mütter und Väter jeweils 1-Jahres-Re-Test-Reliabilitäten für die Messzeitpunkte Prä bis FU4 berechnet (Tabelle 2). Sie schwankten für Mütter zwischen .70 (Prä–FU1) und .76 (FU2–FU3) bei einem Mittelwert von .73 und für Väter zwischen .74 (Prä–FU1) und .81 (FU2–FU3) bei einem Mittelwert von .78. Der Tabelle 2 sind auch die Korrelationen zwischen den zeitlich weiter auseinanderliegenden Messzeitpunkten zu entnehmen.

Tabelle 2 FBZ-K: Re-Test-Reliabilitäten über die Zeitpunkte Prä, FU1, FU2, FU3 und FU10 für Mütter (1. Korrelation) und Väter (2. Korrelation) und die Korrelation Mütter – Väter zum selben Messzeitpunkt (Diagonale)

In den ESM-Tabellen E2a, b und E4 sind die Mittelwerte und Standardabweichungen der FBZ-K-Items sowie der FBZ-K-Gesamtwerte für Mütter und Väter aufgeführt, die über alle Messzeitpunkte von Prä bis FU10 sehr ähnlich sind (siehe auch ESM-Abbildung E1). Für die FBZ-K-Gesamtwerte ergeben sich nur für FU10 signifikante geschlechtsspezifische Unterschiede (p < .001; ESM-Tabelle E4), da die Mütter mit ihrer Beziehung wesentlich unzufriedener sind als die Väter.

Konfirmatorische Faktorenanalysen

Auch hier wurden, wie bei der Kita-Stichprobe, konfirmatorische Faktorenanalysen gerechnet und zwar insgesamt vier (Prä und FU10, jeweils Mütter und Väter; siehe ESM-Tabelle E5). Die Ergebnisse der vier Analysen entsprechen denen der Kita-Studie. Wiederum erreichen die Fit–Indizes bei der 1-Faktor-Lösung überwiegend nicht die Grenzwerte für einen akzeptablen Modell-Fit. Die Ladungen schwanken über die vier konfirmatorischen Faktorenanalysen zwischen .44 und .82. Nachfolgend durchgeführte Modellmodifikationen unter Berücksichtigung der Korrelationen der Fehlerterme führen auch bei den ZF-Stichproben zu deutlichen Verbesserungen. Sämtliche Fit-Werte sind exzellent und sprechen für eine sehr gute Modellpassung. Die Ladungen schwanken über die vier konfirmatorischen Faktorenanalysen zwischen .34 und .85.

Auch hier zeigt sich bei einer Betrachtung der einzelnen Items, dass das Item 1 geringere bzw. die geringsten Werte für die Trennschärfen und Ladungen aufweist, allerdings handelt es sich auch hier immer noch um akzeptable Werte.

Zusammenhänge zu Soziodemographischen Variablen

Mit den Variablen elterlicher Schulabschluss, Familieneinkommen, kindliches Geschlecht und Migrationszugehörigkeit zeigten sich keine signifikanten Zusammenhänge. Einzig zum Alter ergaben sich für beide Eltern zu Prä, FU2 und FU3 signifikante, negative Korrelationen mit geringer Effektstärke (siehe ESM-Tabelle E6). Wie nach Bühler et al. (2021) zu erwarten, reduziert sich bei längsschnittlicher Betrachtung die Beziehungszufriedenheit bei Paaren im jungen bis mittleren Erwachsenenalter.

Konstruktvalidität

Ein Aspekt der Konstruktvalidität betrifft die Zusammenhänge zwischen Mütter- und Väterzufriedenheit. Erwartet werden hohe und signifikante Korrelationen. Die Ergebnisse sind der Diagonalen in Tabelle 2 für die sechs Messzeitpunkte zu entnehmen. Die mittlere Korrelation zwischen Müttern und Vätern beträgt r = .70 (Range: r = .64 – .75).

Weiterhin wurden die Zusammenhänge zwischen der Beziehungszufriedenheit (FBZ-K) und den Merkmalen Psychische Belastung (Depression, Angst und Stress; DASS), Lebenszufriedenheit (FLZ), Coparenting (EKS), dysfunktionales Erziehungsverhalten (EFB) sowie den kindlichen internalisierenden und externalisierenden Auffälligkeiten (CBCL) berechnet. Dabei wurden durchgängig signifikante Zusammenhänge angenommen, wobei – gemäß dem Stand der Forschung (Baucom et al., 2020; Cummings & Davis, 2010; Hahlweg & Bodenmann, in Druck) – mittlere Effektstärken für psychische Belastung und Lebenszufriedenheit der Eltern und Coparenting, geringe Effektstärken für Erziehungsverhalten und für kindliche Auffälligkeiten erwartet wurden (siehe ESM-Tabelle E7).

Die über die sechs Messzeitpunkte gemittelten Korrelationen zwischen der FBZ-K und den drei Skalen der DASS und dem Gesamtwert schwankten zwischen r = -.32 und r = -.37 (Mütter; Väter: -.26 bis -.38). Die einzelnen Korrelationen sind fast durchgängig von mittlerer Effektstärke und mit p < .001 signifikant. Es fällt auf, dass die Korrelationen zum Messzeitpunkt FU10 für die Mütter etwas geringer als für die Väter ausfallen. Am höchsten sind die mittleren Korrelationen zwischen dem FBZ-K und den Skalen EKS mit durchschnittlich r = .61 (Mütter / .57) und FLZ mit durchschnittlich r = .47 (Mütter / .53). Sämtliche Korrelationen sind signifikant (p < .001) mit mittleren bis hohen Effektstärken.

Demgegenüber sind die Zusammenhänge zwischen dem FBZ-K und dem Erziehungsverhalten und den kindlichen Auffälligkeiten deutlich niedriger. Die mittleren Korrelationen betragen beim EFB r  = -.27 (Mütter / Väter: -.24). Bei der CBCL ergaben sich folgende Korrelationen: Internalisierend: rMütter = -.23 (Väter: -.24); Externalisierend: rMütter = -.19 (–.22); Gesamtwert: rMütter = -.24 (–.26). Auch hier fallen die geringeren Korrelationen zum FU10-Zeitpunkt auf. Dies ist jedoch nicht verwunderlich, da mit zunehmendem Alter der Kinder der Einfluss der Partnerschaft auf das kindliche Verhalten geringer wird (Bodenmann, 2016). Die korrelativen Befunde bestätigen die theoretischen Annahmen, sodass die Konstruktvalidität als in hohem Maße als gegeben angesehen werden kann.

Prognosevalidität

Zur Ermittlung der Prognosevalidität wurde untersucht, ob sich mittels der FBZ-K zu Prä eine Trennung oder Scheidung (T&S) im Verlauf von 10 Jahren vorhersagen lässt. Es wurden die Getrennten / Geschiedenen (n = 35) mit denen verglichen, die über den gesamten Untersuchungszeitraum zusammengeblieben waren (ZUS, n = 173), wobei zu Prä nicht von allen Müttern und Vätern die FBZ-K-Daten vorlagen (Mütter: N = 30 / 173, Väter: 27/162). Es ergaben sich für Mütter und Väter signifikante Kendall-Tau-Korrelationen von jeweils r = .20 (Mittelwerte / Standardabweichung Prä Mütter: T&S 19.5/6.2, ZUS 23.4/4.6, d = 0.81; Väter: T&S 20.1/5.0, ZUS 23.7/4.8, d = 0.74). Der FBZ-K ermöglicht somit valide Vorhersagen von Trennung bzw. Scheidung auf Grund der Prä-Werte.

Diskussion

Die Beziehungsqualität hat sich als wesentlicher Faktor für das psychische und physische Wohlbefinden von Individuen, Paaren und Kindern herausgestellt (Hahlweg & Bodenmann, in Druck). Dieses weite Einsatzspektrum erfordert reliable, valide und normierte diagnostische Instrumente zur Erfassung der Beziehungsqualität, insbesondere besteht ein erheblicher Bedarf an kurzen Screening-Instrumenten zur Früherkennung von sich verschlechternden Beziehungen, bevor ernsthafte und irreversible Verschlechterungen der Beziehungsqualität entstehen (Hahlweg, 2016). Ziel der vorliegenden Arbeit war es, mit Hilfe von zwei Studien die psychometrische Qualität der FBZ-K für den deutschen Sprachraum zu untersuchen und mit den Daten der australischen Originalversion ADAS zu vergleichen.

Im Rahmen der ersten Studie konnte der FBZ-K von 417 Müttern aus Braunschweiger Kindergärten (Kita-Studie; Kuschel et al., 2004) ausgewertet werden, die an einer internationalen Untersuchung zur Prävalenz psychischer Störungen bei Kindergartenkindern teilnahmen. Die kindliche Alters- und Geschlechtsverteilung und das Alter der Mütter waren repräsentativ für die städtischen Kindergärten.

Der mittlere Gesamtwert und die Standardabweichung des FBZ-K entsprachen denen der ADAS, wie auch die Mittelwerte und die hohen Trennschärfen der einzelnen Items. Die interne Konsistenz des FBZ-K betrug α = .84 und war damit numerisch höher als in der ADAS mit α = .76. Es ergaben sich keine signifikanten Korrelationen zwischen dem FBZ-K und soziodemografischen Variablen (Alter, Geschlecht und Anzahl der Kinder, sowie Alter, Bildungsabschluss und Arbeitszeit der Mütter, dem familiären Haushaltsnettoeinkommen sowie der Dauer der Partnerschaft). Insgesamt konnten die Erwartungen der Studie 1 bestätigt werden. Die psychometrischen Kennwerte der Kita-FBZ-K entsprachen in hohem Maße der australischen Ursprungsversion ADAS.

Im Rahmen der zweiten Studie wurde auf die Teilnehmer der sog. Braunschweiger Zukunft Familie-Studie (ZF; Heinrichs et al., 2006) zurückgegriffen. In dieser wurden die Teilnehmer zu den Messzeitpunkten Prä, FU1, FU2, FU3 (alle mit Responderraten von 99 %), FU4 (90 %) und FU10-Jahre (89 %) untersucht. Insgesamt lag der FBZ-K im Mittel von 223 Müttern und 191 Vätern vor. Hervorzuheben ist hier die hohe Väterbeteiligung von 86 % an der 10-jährigen Langzeitstudie.

Der mittlere FBZ-K Gesamtwert, die Item-Mittelwerte, die mittleren Trennschärfen und die interne Konsistenz zu Prä entsprachen bei den ZF-Müttern und Vätern denen der Kita-Mütter. Insgesamt konnten die Ergebnisse der Kita-Stichprobe durch die unabhängig erhobene ZF-Stichprobe zu Prä voll repliziert werden, dies sowohl für die Mütter als auch Väter-Stichprobe.

In Bezug auf die längsschnittliche Stabilität über 10 Jahre entsprachen – von einer Ausnahme abgesehen – die Mittelwerte, Standardabweichungen und die Häufigkeiten der drei Zufriedenheitsklassen sowohl für Mütter als auch Väter den Prä-Werten. Die mittlere Interkorrelation von r = .70 zwischen Müttern und Vätern entsprach den Daten aus der Literatur (Hahlweg, 2016). Lediglich für den Zeitpunkt FU10 war der Gesamtwert für die Mütter signifikant niedriger sowie der Anteil der hoch Zufriedenen geringer.

Mit den konfirmatorischen Faktorenanalysen konnte die Eindimensionalität nicht bestätigt werden, weder für die Kita- noch für die ZF-Studie, sodass erhebliche Zweifel an der Eindimensionalität des FBZ-K bestehen. Auf der anderen Seite sind die Trennschärfen, die inneren Konsistenzen und die Item-Interkorrelation durchgehend als gut zu bewerten und entsprechen denen von Sharpley und Rogers (1984). Möglicherweise erfasst das Item 1 und in geringerem Maße auch das Item 2 andere Aspekte der Beziehungszufriedenheit als die anderen Items. Auch eine Stichprobenbesonderheit (Eltern von Kindern und Jugendlichen) muss in Betracht gezogen werden. In künftigen Studien an repräsentativen Stichproben sollte diesen Fragen nachgegangen werden, bevor eine Revision des Fragebogens vorgenommen wird, zumal eine Veränderung des Fragebogens zur Folge hätte, dass eine Vergleichbarkeit mit internationalen Ergebnissen dann nicht mehr möglich wäre. Zumindest ist bei der Interpretation des Gesamtwertes Vorsicht geboten.

Bisher wurden für die ADAS keine Re-Test-Reliabilitäten berichtet. Die zeitliche Stabilität der BFZ-K über die Follow-ups, die im Abstand von einem Jahr über vier Jahre nach der Prä-Messung durchgeführt wurden, ergab eine mittlere Re-Test- Reliabilität von ≥ .75 und ist somit sehr hoch zu bewerten.

Bezüglich der Konstruktvalidität wurden Zusammenhänge zwischen FBZ-K und der psychischen Gesundheit der Eltern mit Hilfe der DASS, den elterlichen Erziehungskonflikten (EKS) und ihrem Erziehungsverhalten (EFB), ihrer Lebenszufriedenheit (FLZ) und den kindlichen Verhaltensauffälligkeiten (CBCL) über alle sechs Messzeitpunkte bestimmt. Es bestätigten sich durchgängig die Befunde aus der Literatur (Hahlweg & Bodenmann, in Druck), wobei überrascht, dass die jeweiligen Korrelationen teilweise so gut übereinstimmten. So betrug z. B. der Zusammenhang von FBZ-K und Depression im Mittel r = -.35, dies entspricht in etwa der Korrelation von r = –.40 aus der Metaanalyse von Whisman (2007). Mit dem Gesamtwert der CBCL ergab sich eine mittlere Korrelation von r = -.25, dies entspricht dem Ergebnis der Meta-Analyse von Erel und Burman (1995) von r = -.22. Geringe Ehequalität korreliert somit mit schlechterer elterlicher psychischer Gesundheit, geringerer Lebensqualität, dysfunktionalem Erziehungsverhalten, konfliktreicherem Co-Parenting und häufigeren kindlichen emotionalen Störungen und Verhaltensauffälligkeiten. Die korrelativen Befunde bestätigen die theoretischen Annahmen, sodass die Konstruktvalidität der FBZ-K als in hohem Maße als gegeben angesehen werden kann.

Bisher lagen für die international benutzten Kurzfragebogen zur Erfassung der Beziehungsqualität keine Daten zur prognostischen Validität vor. Sehr überraschend war daher der Befund, dass die zu Prä erhobenen Daten der BFZ-K über einen Zeitraum von 10 Jahren valide Vorhersagen von Trennung und Scheidung ermöglichen – ein gewichtiges Argument für seinen Einsatz als Screening-Instrument.

Stärken dieser Studie sind zum einen die Replikation der Befunde durch zwei unabhängig erhobene Stichproben, zum anderen die längsschnittliche Untersuchung der zeitlichen Stabilität der psychometrischen Kennwerte (Mittelwerte, Trennschärfen, interne Konsistenz, Re-Test-Reliabilität) der FBZ-K über 10 Jahre. Darüber hinaus die kreuzkulturelle Validierung mit der australischen ADAS und die Bestätigung der Konstrukt- und prognostischen Validität.

Allerdings sollten zusätzlich zu der bereits genannten Einschränkung bezüglich der Vorsicht bei der Interpretation des Gesamtwertes der FBZ-K weitere Einschränkungen unserer Studie beachtet werden. Erstens handelt es sich bei unseren Stichproben um Eltern von Kindergartenkindern; Daten von kinderlosen Paaren wie auch von Paaren mit höherem Alter fehlen. Daher sollte baldmöglichst eine Normierung an einer repräsentativen deutschen Studie erfolgen. Zweitens fehlt eine klinische Stichprobe von Partnern in Paartherapie, sodass Daten zur Änderungssensitivität der FBZ-K bisher nicht vorliegen. Drittens fehlen Daten zur Interkorrelation zwischen DAS-Lang- und FBZ-Kurzform, sodass Schätzungen aufgrund von FBZ-K-Werten auf DAS-Werte nicht möglich sind. Dies würde Vergleiche der Ergebnisse von Studien, die entweder die DAS oder den FBZ-K bzw. ADAS verwendet haben, ermöglichen. Viertens fehlen Daten zur konvergenten Validität, da kein weiterer Beziehungsqualitätsfragebogen gegeben wurde. Dies war schon deshalb nicht möglich, um die Eltern nicht mit noch mehr Fragebögen zu belasten. Annäherungsweise kann die Korrelationen zwischen den Gesamtwerten der PFB- und der DAS-Langform herangezogen werden, die mit r = .85 sehr hoch ist (Hahlweg, Klann & Hank, 1992); ebenso die zwischen PFB-Langform und dem sechs Items umfassenden Quality of Marriage Index (QMI, r = .72; Zimmermann et al., 2015). Generell korrelieren Beziehungsqualitätsfragebogen hoch miteinander (siehe Hahlweg, 2016; Sabourin et al., 2005), sodass dies auch für den PBZ-K angenommen werden kann. Entsprechende Studien sollten jedenfalls durchgeführt werden.

Konvergente Validität ist ohne Frage ein zentrales Validitätskriterium. Allerdings sind auch andere Validitätskriterien von erheblicher Bedeutung und inwiefern diese in einem Gesamtzusammenhang zu sehen sind, wie Inhaltsvalidität, Konstruktvalidität (im Sinne einer Theorie, nomologische Validität) und Vorhersagevalidität. Hinzu kommen andere psychometrische Kriterien wie Trennschärfe und Reliabilitätsmaße. Das Ziel dieser Studie war nicht, einen neuen bzw. veränderten Fragebogen zu entwickeln, sondern einen Beitrag zur psychometrischen Güte des FBZ-K zu leisten, einem in der internationalen Forschung und klinischen Praxis in Deutschland häufig verwendeten Fragebogen. Hinzu kommt, dass Studien, die einen im englischsprachigen Raum entwickelten Fragebogen verwenden, im internationalen Kontext vermehrt akzeptiert werden, da so zumindest Vergleiche gezogen werden können.

Zusammenfassend zeigt die aktuelle Studie, dass die FBZ-K sehr gute psychometrische Kennwerte aufweist und die Beziehungszufriedenheit zeitlich stabil erfasst. Die FBZ-K kann daher als lizenzfreies, ökonomisches Screening-Instrument in epidemiologischen Studien und in der klinischen Praxis zur Eingangsmessung und Prozessforschung empfohlen werden.

Elektronische Supplemente (ESM)

Die elektronischen Supplemente sind mit der Online-Version dieses Artikels verfügbar unter https://doi.org/10.1026/0012-1924/a000312

Wir danken den Paaren für ihre Mitarbeit.

Literatur

  • Achenbach, T. M. (1991). Integrative guide for the 1991 CBCL / 4 – 18, YSR, and TRF profiles. Burlington: Department of Psychiatry, University of Vermont. First citation in articleGoogle Scholar

  • Arnold, D. S., O’Leary, S. G., Wolff, L. S. & Acker, M. M. (1993). The Parenting Scale: A measure of dysfunctional parenting in discipline situations. Psychological Assessment, 5, 131 – 144. https://doi.org/10.1037/1040-3590.5.2.137 First citation in articleCrossrefGoogle Scholar

  • Bäse, B. (1995). Die sozial-räumliche Gliederung der Stadt Braunschweig. Methodik und Durchführung sozial-geographischer Analyse im städtischen Wohnumfeld auf der Grundlage des Zensus 1987. Braunschweig: Technische Universität Braunschweig. First citation in articleGoogle Scholar

  • Baucom, D. H., Fischer, M. S., Corrie, S., Worrell, M. & Boeding, S. E. (2020). Treating relationship distress and psychopathology in couples. A cognitive-behavioural approach. Oxon, GB: Routledge. First citation in articleGoogle Scholar

  • Bodenmann, G. (2016). Lehrbuch Klinische Paar- und Familienpsychologie (2., überarb. Aufl.). Bern: Huber. First citation in articleCrossrefGoogle Scholar

  • Bühler, J. L., Krauss, S. & Orth, U. (2021). Development of relationship satisfaction across the life span: A systematic review and meta-analysis. Psychological Bulletin, 147 (10), 1012 – 1053. https://doi.org/10.1037/bul0000342 First citation in articleCrossrefGoogle Scholar

  • Busby, D. M., Christensen, C., Crane, D. R. & Larson, J. H. (1995). A revision of the Dyadic Adjustment Scale for use with distressed and nondistressed couples: Construct hierarchy and multidimensional scales. Journal of Marital and Family Therapy, 21, 289 – 308. https://doi.org/10.1111/j.1752-0606.1995.tb00163.x First citation in articleCrossrefGoogle Scholar

  • Cohen, J. (1988). Statistical power analysis for the behavioral sciences (2nd ed). Hillsdale, N. J: Erlbaum Associates. First citation in articleGoogle Scholar

  • Cummings, E. M. & Davies, P. T. (2010). Marital conflict and children. An emotional security perspective. New York: Guilford. First citation in articleGoogle Scholar

  • Dadds, M. R. & Powell, M. B. (1991). The relationship of interparental conflict and global marital adjustment to aggression, anxiety, and immaturity in aggressive and non-clinic children. Journal of Abnormal Child Psychology, 19, 553 – 567. https://doi.org/10.1007/BF00925820 First citation in articleCrossrefGoogle Scholar

  • Daig, I., Spangenberg, L., Henrich, G., Herschbach, P., Kienast, T. & Brähler, E. (2011). Alters- und geschlechtsspezifische Neunormierung der Fragen zur Lebenszufriedenheit (FLZM) für die Altersspanne von 14 bis 64 Jahre. Zeitschrift für Klinische Psychologie und Psychotherapie, 0, 3, 172 – 178. https://doi.org/10.1026/1616-3443/a000099 First citation in articleLinkGoogle Scholar

  • Dinkel, A. & Balck., F. (2005). An evaluation of the German Relationship Assessment Scale. Swiss Journal of Psychology, 64 (4), 259 – 263. https://doi.org/10.1024/1421-0185.64.4.259 First citation in articleLinkGoogle Scholar

  • Dinkel, A. & Balck, F. (2006). Psychometrische Analyse der deutschen Dyadic Adjustment Scale. Zeitschrift für Psychologie, 214 (1), 1 – 9. https://doi.org/10.1026/0044-3409.214.1.1 First citation in articleLinkGoogle Scholar

  • Döpfner, M., Plück, J. & Kinnen, C., Arbeitsgruppe Deutsche Child Behavior Checklist (2014). CBCL/6 – 18R, TRF/6 – 18R, YSR/11 – 18R. Deutsche Schulalter-Formen der Child Behavior Checklist von Thomas M. Achenbach. Elternfragebogen über das Verhalten von Kindern und Jugendlichen (CBCL/6 – 18R), Lehrerfragebogen über das Verhalten von Kindern und Jugendlichen (TRF/6 – 18R), Fragebogen für Jugendliche (YSR/11 – 18R). Göttingen: Hogrefe. First citation in articleGoogle Scholar

  • Erel, O. & Burman, B. (1995). Interrelatedness of marital relations and parent-child relations: A meta-analytic review. Psychological Bulletin, 118, 108 – 32. https://doi.org/10.1037/0033-2909.118.1.108 First citation in articleCrossrefGoogle Scholar

  • Funk, J. L. & Rogge, R. D. (2007). Testing the ruler with item response theory: Increasing precision of measurement for relationship satisfaction with the Couples Satisfaction Index. Journal of Family Psychology, 21, 572 – 583. https://doi.org/10.1037/0893-3200.21.4.572 First citation in articleCrossrefGoogle Scholar

  • Gäde, J. C., Schermelle-Engel, K. & Brandt, H. (2020). Konfirmatorische Faktorenanalyse (CFA). In H. MoosbruggerA. Kavala (Hrsg.), Testtheorie und Fragebogenkonstruktion (3. Aufl., S. 615 – 659). Berlin: Springer. First citation in articleGoogle Scholar

  • Hahlweg, K. (2016). Fragebogen zur Partnerschaftsdiagnostik (FPD: Partnerschaftsfragebogen PFB, PFB-K, Problemliste PL und Fragen zur Lebensgeschichte und Partnerschaft FLP-R, 2., neu normierte Aufl.). Göttingen: Hogrefe. First citation in articleGoogle Scholar

  • Hahlweg, K. & Bodenmann, B. (in Druck). Die Familie und ihr Einfluss auf die psychische Entwicklung in Kindheit und Jugendzeit. In J. Fegert, F. M., Resch, M., Döpfner, Kaess, K., Konrad, T., Legenbauer, T. & Plener, P. (Hrsg.), Psychiatrie und Psychotherapie des Kindes- und Jugendalters. Heidelberg: Springer. First citation in articleGoogle Scholar

  • Hahlweg, K., Klann, N. & Hank, G. (1992). Zur Erfassung der Ehequalität: Ein Vergleich der „Dyadic Adjustment Scale“ (DAS) und des „Partnerschaftsfragebogens“ (PFB). Diagnostica, 38, 312 – 327. First citation in articleGoogle Scholar

  • Hahlweg, K. & Schulz, W. (2018). Universelle Prävention kindlicher Verhaltensstörungen durch Elterntrainings: Wirksamkeit nach 10 Jahren aus Sicht von Müttern, Vätern und Jugendlichen. Zeitschrift für Klinische Psychologie und Psychotherapie, 7, 1, 1 – 16. https://doi.org/10.1026/1616-3443/a000462 First citation in articleLinkGoogle Scholar

  • Heinrichs, N. (2006). Partnerschaftsdiagnostik. In W. Lutz (Hrsg.), Lehrbuch der Paartherapie. (S. 36 – 56). München: Ernst Reinhardt, UTB. First citation in articleGoogle Scholar

  • Heinrichs, N., Hahlweg, K., Bertram, H., Kuschel, A., Naumann, S. & Harstick, S. (2006). Die langfristige Wirksamkeit eines Elterntrainings zur universellen Prävention kindlicher Verhaltensstörungen: Ergebnisse aus Sicht der Mütter und Väter. Zeitschrift für Klinische Psychologie und Psychotherapie, 35, 82 – 96. https://doi.org/10.1026/1616-3443.35.2.82 First citation in articleLinkGoogle Scholar

  • Henrich, G. & Herschbach, P. (2000). Fragen zur Lebenszufriedenheit (FLZ-M). In U. Ravens-SiebererA. CiezaM. BullingerN. von SteinbuechelE. Poeppel (Hrsg.), Lebensqualität und Gesundheitsökonomie in der Medizin. Konzepte, Methoden, Anwendung. (S. 98 – 110). Landsberg: ecomed. First citation in articleGoogle Scholar

  • Hendrick, S. S. (1988). A generic measure of relationship satisfaction. Journal of Marriage and the Family, 50, 93 – 98. https://doi.org/10.2307/352430 First citation in articleCrossrefGoogle Scholar

  • Hunsley, J., Best, M., Lefebre, M. & Vito, D. (2001). The seven-item short form of the Dyadic Adjustment Scale: Further evidence for construct validity. The American Journal of Family Therapy, 29, 325 – 335. https://doi.org/10.1080/01926180126501 First citation in articleCrossrefGoogle Scholar

  • Karney, B. R. & Bradbury, T. N. (1995). The longitudinal course of marital quality and stability: A review of theory, method, and research. Psychological Bulletin, 118, 3 – 34. https://doi.org/10.1037/0033-2909.118.1.3 First citation in articleCrossrefGoogle Scholar

  • Klann, N., Hahlweg, K. & Heinrichs, N. (2003). Diagnostische Verfahren für die Beratung. Göttingen: Hogrefe. First citation in articleGoogle Scholar

  • Klann, N., Hahlweg, K., Limbird, C. & Snyder, D. (2006). EPF Einschätzung von Partnerschaft und Familie. Deutsche Form des Marital Satisfaction Inventory – Revised (MSI-R) von Douglas K. Snyder. Göttingen: Hogrefe. First citation in articleGoogle Scholar

  • Köppe, E. (2001). Glückliche Eltern – liebe Kinder? Auswirkungen von Partnerschaft und psychischer Symptomatik der Eltern auf das Verhalten ihrer Kinder. Unveröffentlichte Dissertation, Technische Universität Carolo-Wilhelmina zu Braunschweig. First citation in articleGoogle Scholar

  • Kröger, C., Hahlweg, K., Heinrichs, N., Döpfner, M. & Plück, J. (2009). Erziehungskonfliktskala (EKS): Reliabilität und Validität. Diagnostica, 55, 201 – 210. https://doi.org/10.1026/0012-1924.55.4.201 First citation in articleLinkGoogle Scholar

  • Kurdek, L. A. (1992). Dimensionality of the Dyadic Adjustment Scale: Evidence from heterosexual and homosexual couples. Journal of Family Psychology, 6, 22 – 35. https://doi.org/10.1037/0893-3200.6.1.22 First citation in articleCrossrefGoogle Scholar

  • Kuschel, A., Lübke, A., Köppe, E., Miller, Y., Hahlweg, K. & Sanders, M. R. (2004). Häufigkeit psychischer Auffälligkeiten und Begleitsymptome bei drei- bis sechsjährigen Kindern: Ergebnisse der Braunschweiger Kindergartenstudie. Zeitschrift für Kinder- und Jugendpsychiatrie, 32, 97 – 106. https://doi.org/10.1024/1422-4917.32.2.97 First citation in articleLinkGoogle Scholar

  • Locke, H. J. & Wallace, K. M. (1959). Short-term marital adjustment and prediction tests: Their reliability and validity. Marriage and Family Living, 21, 251 – 255. https://doi.org/10.2307/348022 First citation in articleCrossrefGoogle Scholar

  • Lovibond, P.F. & Lovibond, S.H. (1995). The structure of negative emotional states: Comparison of the Depression Anxiety Stress Scales (DASS) with the Beck Depression and Anxiety Inventories. Behaviour Research and Therapy, 33, 335 – 343. https://doi.org/10.1016/0005-7967(94)00075-u First citation in articleCrossrefGoogle Scholar

  • Muthén, L. K. & Muthén, B. O. (2017). Mplus: Statistical analyses with latent variables: User’s guide (Version 8). Los Angeles, CA: Muthén & Muthén. First citation in articleGoogle Scholar

  • Naumann, S., Bertram, H., Kuschel, A., Heinrichs, N., Hahlweg, K. & Döpfner, M. (2010). Der Erziehungsfragebogen (EFB). Ein Fragebogen zur Erfassung elterlicher Verhaltenstendenzen in schwierigen Erziehungssituationen. Diagnostica, 56, 144 – 157. https://doi.org/10.1026/0012-1924/a000018 First citation in articleLinkGoogle Scholar

  • Norton, T.R. (1983). Measuring marital quality: A critical look at the dependent variable. Journal of Marriage and the Family, 45, 141 – 151. https://doi.org/10.2307/351302 First citation in articleCrossrefGoogle Scholar

  • Reiner, I., Beutel, M., Skaletz, C., Brähler, E. & Stöbel-Richter, Y. (2012). Validating the German version of the Quality of Relationship Inventory: Confirming the three-factor structure and report of psychometric properties. PLoS ONE, 7 (5), e37380. https://doi.org/10.1371/journal.pone.0037380 First citation in articleCrossrefGoogle Scholar

  • Richter, D., Brähler, E. & Ernst, J. (Hrsg.). (2015). Diagnostische Verfahren für Beratung und Therapie von Paaren und Familien. Göttingen: Hogrefe. First citation in articleCrossrefGoogle Scholar

  • Robles, T. F., Slatcher, R. B., Trombello, J. M. & McGinn, M. M. (2014). Marital quality and health: A meta-analytic review. Psychological Bulletin, 140, 140 – 187. https://doi.org/10.1037/a0031859 First citation in articleCrossrefGoogle Scholar

  • Sabourin, S., Valois, P. & Lussier, Y. (2005). Development and validation of a brief version of the Dyadic Adjustment Scale with a nonparametric item analysis model. Psychological Assessment, 17 (1), 15 – 27. https://doi.org/10.1037/1040-3590.17.1.15 First citation in articleCrossrefGoogle Scholar

  • Sanders, M. R. (2012). Development, evaluation, and multinational dissemination of the Triple P-Positive Parenting Program. Annual Review of Clinical Psychology, 8, 1 – 35. https://doi.org/10.1146/annurev-clinpsy-032511-143104 First citation in articleCrossrefGoogle Scholar

  • Sbarra, D. A., Law, R. W. & Portley, R. M. (2011). Divorce and death: A meta-analysis and research agenda for Clinical, Social, and Health Psychology. Perspectives on Psychological Science, 6 (5), 454 – 474. https://doi.org/10.1177/1745691611414724 First citation in articleCrossrefGoogle Scholar

  • Schindler, L., Hahlweg, K. & Revenstorf, D. (2019). Partnerschaftsprobleme: Diagnose und Therapie. Handbuch für den Therapeuten (3., neugestaltete Aufl.). Berlin, Heidelberg: Springer. First citation in articleCrossrefGoogle Scholar

  • Schulz, W., Hahlweg, K. & Supke, M. (2022). Predictors of fathers’ participation in a longitudinal psychological research study on child and adolescent psychopathology. BMC. Manuskript eingereicht zur Publikation. First citation in articleGoogle Scholar

  • Sharpley, C. F. & Rogers, H. J. (1984). Preliminary validation of the Abbreviated Spanier Dyadic Adjustment Scale: Some psychometric data regarding a screening test of marital adjustment. Educational and Psychological Measurement, 44, 1045 – 1049. https://doi.org/10.1177/0013164484444029 First citation in articleCrossrefGoogle Scholar

  • Snyder, D.K. (1981). Marital Satisfaction Inventory (MSI). Los Angeles, CA: Western Psychological Services. First citation in articleGoogle Scholar

  • Spanier, G. B. (1976). Measuring dyadic adjustment: New scales for assessing the quality of marriage and similar dyads. Journal of Marriage and the Family, 38, 15 – 28. https://doi.org/10.1177/0013164484444029 First citation in articleCrossrefGoogle Scholar

  • Spanier, G.B. (1988). Assessing the strength of the Dyadic Adjustment Scale. Journal of Family Psychology, 2, 92 – 94. https://doi.org/10.1037/h0080477 First citation in articleCrossrefGoogle Scholar

  • Whisman, M.A. (2007). Marital distress and DSM-IV psychiatric disorders in a population-based national survey. Journal of Abnormal Psychology, 116, 638 – 643. https://doi.org/10.1037/0021-843X.116.3.638 First citation in articleCrossrefGoogle Scholar

  • Ziegler, M. (2014). Stop and state your intentions! Let’s not forget the ABC of test construction [Editorial]. European Journal of Psychological Assessment, 30 (4), 239 – 242. https://doi.org/10.1027/1015-5759/a000228 First citation in articleLinkGoogle Scholar

  • Zimmermann, T., de Zwaan, M. & Heinrichs, N. (2019). The German version of the Quality of Marriage Index: Psychometric properties in a representative sample and population-based norms. PLoS ONE, 14 (2): e0212758 https://doi.org/10.1371/journal.pone.0212758 First citation in articleCrossrefGoogle Scholar