Skip to main content
Open AccessOriginalarbeit

Die Dunkle Triade in einer deutschen repräsentativen Stichprobe

Faktorstruktur, Messinvarianz und Normwerte der Niederträchtigen Neun

Published Online:https://doi.org/10.1026/0012-1924/a000292

Abstract

Zusammenfassung. Die „Niederträchtigen Neun“ ist eine psychometrisch optimierte deutsche Version des „Dreckigen Dutzends“ zur Erfassung der Dunklen Triade. In dieser Studie betrachten wir diverse psychometrische Eigenschaften der Niederträchtigen Neun mit einer repräsentativen deutschen Stichprobe. Es wurden verschiedene Faktorstrukturen miteinander verglichen sowie Messinvarianzanalysen über das Geschlecht und über das Alter anhand von konfirmatorischen Faktoranalysen und lokal gewichteten Strukturgleichungsmodellen durchgeführt. Außerdem stellen wir Normwerte zur individualdiagnostischen Interpretation von Rohwerten zur Verfügung. Ergebnisse zeigen, dass die Niederträchtigen Neun durch Bifaktor-Modelle mit Machiavellismus als inhaltlicher Anker des allgemeinen Faktors (dem „dunklen Kern“) am besten repräsentiert wird. Über das Geschlecht ergaben sich Einschränkungen der metrischen Invarianz, die hauptsächlich auf Indikatoren von Psychopathie zurückzuführen sind. Partielle metrische Invarianz konnte jedoch belegt werden. Über das Alter konnte metrische Invarianz belegt werden, jedoch ergaben sich Einschränkungen der skalaren und strikten Invarianz. Implikationen für die Erfassung der Dunklen Triade mit der Niederträchtigen Neun oder dem Dreckigen Dutzend werden diskutiert.

The Dark Triad in a German Representative Sample. Factor Structure, Measurement Invariance, and Reference Values of the Naughty Nine

Abstract. The so-called “Naughty Nine” is a psychometrically optimized German version of the “Dirty Dozen”, a scale designed to assess the Dark Triad. This article examines different psychometric features of the Naughty Nine using a representative German sample. We compared several factor structures discussed in the literature and investigated measurement invariance across sex and age, using confirmatory factor analyses and locally weighted structural equation models. Further, we provide reference values for the Naughty Nine to rank individual raw values relative to a German reference population. The results show that bifactor models with Machiavellianism as the reference construct that defines the content of the general factor (the “Dark Core”) best represent the Naughty Nine. We found limitations of metric invariance across sex, which can mainly be attributed to indicators of psychopathy. Partial metric invariance was supported. Across age, we found evidence for metric invariance but also found limitations of scalar and strict invariance. Finally, we discuss the implications of investigating the Dark Triad using the Naughty Nine or the Dirty Dozen.

Die Dunkle Triade (DT; Paulhus & Williams, 2002) umfasst die antagonistischen Persönlichkeitskonstrukte Machiavellismus, Psychopathie und Narzissmus. Per Definition zeigen Personen mit einer hohen Ausprägung in Machiavellismus zynisches, manipulatives und unethisches Verhalten. Personen mit einer hohen Ausprägung in Psychopathie zeigen Gefühlskälte sowie antisoziales, impulsives und enthemmtes Verhalten. Personen mit einer hohen Ausprägung in Narzissmus zeigen selbstverherrlichendes Verhalten, ein ausgeprägtes Anspruchsdenken und das Streben nach der Befriedigung der persönlichen Eitelkeit (Furnham, Richards & Paulhus, 2013; Muris, Merckelbach, Otgaar & Meijer, 2017).

Gängige Messinstrumente für die multidimensionale Erhebung der DT (Paulhus & Jones, 2015) sind die Short Dark Triad (Jones & Paulhus, 2014) und das Dreckige Dutzend (Jonason & Webster, 2010). Die Short Dark Triad misst die DT mit neun Items pro Konstrukt, während das Dreckige Dutzend jeweils vier Items verwendet. Studien belegen die Konstruktvalidität des Dreckigen Dutzends (Jonason & Webster, 2010; Küfner, Dufner & Back, 2014). Auch die Kriteriumsvalidität wurde durch Assoziationen mit Persönlichkeits- und Verhaltenseinschätzungen dritter Personen sowie mit Drogenkonsum und riskantem Sexualverhalten belegt (Küfner et al., 2014; Pechorro, Jonason, Raposo & Maroco, 2021). Die Differenzierbarkeit zwischen den drei Konstrukten bleibt jedoch fraglich, da das Dreckige Dutzend nur auf die Kernaspekte der DT fokussiert. Dies führte häufig zu der Kritik, dass die Skala nicht alle Merkmale der DT angemessen abbilden könne (Miller et al., 2012; Muris et al., 2017). Dennoch wurde das Dreckige Dutzend in der Vergangenheit oft verwendet. Die Niederträchtigen Neun ist eine auf drei Items pro Konstrukt gekürzte und psychometrisch optimierte deutsche Version des Dreckigen Dutzends (Küfner, Dufner & Back, 2014). Für die Kürzung wurde pro Konstrukt ein Item mit niedriger Ladung oder hoher Doppelladung entfernt, was eine verbesserte Modellgüte ergab.

Während für die psychometrische Qualität des Dreckigen Dutzends besonders in Hinblick auf die deutsche Version der Skala Fragen offen bleiben (Spurk & Hirschi, 2018), liegen für die Niederträchtigen Neun bisher kaum Untersuchungen vor (Küfner, Dufner & Back, 2014). In dieser Studie haben wir diverse psychometrische Eigenschaften der Niederträchtigen Neun mit einer repräsentativen deutschen Stichprobe evaluiert: Es werden verschiedene Faktorstrukturen verglichen, Messinvarianz über das Geschlecht und über das Alter untersucht und erstmals Normwerte für die DT zur Verfügung gestellt.

Faktorstruktur

Paulhus und Williams (2002) beschrieben mit Machiavellismus, Psychopathie und Narzissmus drei konzeptuell unterschiedliche Dimensionen der DT, die zwar teilweise überlappen, aber grundsätzlich voneinander unabhängig sein sollten. Jedoch wurde aufgrund von substanziellen Überlappungen der drei Konstrukte angezweifelt, ob sie überhaupt voneinander unterscheidbar seien (Muris et al., 2017). Eine starke Übereinstimmung der drei Konstrukte würde einer einfaktoriellen Struktur entsprechen, was in manchen Studien auch so umgesetzt wurde (Jonason, Li & Teicher, 2010; Sabouri et al., 2016). Andere Autor_innen nehmen hingegen an, dass es zwar einen gemeinsam zugrundeliegenden dunklen Kern gibt, der Abhängigkeiten zwischen den Konstrukten erklären könne, aber dass darüber hinaus auch konstruktspezifische Anteile existieren (Jones & Figueredo, 2013; Vize, Collison, Miller & Lynam, 2019). Demnach sollte der dunkle Kern Merkmale umfassen, die allen Konstrukten der DT zugrunde liegen, zum Beispiel eine geringe Verträglichkeit, Manipulation oder Gefühlslosigkeit (Furnham et al., 2013; Vize et al., 2019). Der dunkle Kern kann mit einem hierarchischen und einem Bifaktor-Modell statistisch geprüft werden. Im hierarchischen Modell werden die Konstrukte der DT als untergeordnete Merkmale des dunklen Kerns modelliert (Furnham et al., 2013). Bei Bifaktor-Modellen werden Indikatoren sowohl durch einen dunklen Kern als auch durch konstruktspezifische Faktoren beeinflusst (Savard, Simard & Jonason, 2017). Aufgrund von besonders hohen Korrelationen zwischen Machiavellismus und Psychopathie wurde auch eine zweifaktorielle Struktur diskutiert. Demnach sollten Machiavellismus und Psychopathie wegen starker konzeptueller Überschneidungen, beispielsweise der rücksichtslosen Ausbeutung anderer Menschen, in einem gemeinsamen Faktor kombiniert und Narzissmus separat betrachtet werden (Kajonius, Persson, Rosenberg & Garcia, 2016; Miller, Hyatt, Maples-Keller, Carter & Lynam, 2017). Jedoch fallen Korrelationen zwischen Machiavellismus und Psychopathie in Abhängigkeit der verwendeten Skalen unterschiedlich stark aus. Somit könnten Überlappungen zwischen Machiavellismus und Psychopathie auch darauf zurückzuführen sein, dass die verwendeten Items sich nicht dafür eignen, tatsächlich vorhandene konzeptuelle Unterschiede zwischen Machiavellismus und Psychopathie angemessen abzubilden (Grosz, Harms, Dufner, Kraft & Wetzel, 2020; Muris et al., 2017).

Vergleiche der verschiedenen Faktorstrukturen ergaben bisher, dass die theoretisch implizierte dreifaktorielle Struktur die DT besser abbildet als einfaktorielle, zweifaktorielle und hierarchische Modelle (Jonason & Webster, 2010; Pechorro et al., 2021; Persson, Kajonius & Garcia, 2019). Wurden dreifaktorielle Modelle mit Bifaktor-Modellen verglichen, waren häufig letztere überlegen (Kajonius et al., 2016; Savard et al., 2017). Zwei Studien betrachteten mit der Short Dark Triad zweifaktorielle Bifaktor-Modelle mit einem gemeinsamen Faktor für Machiavellismus und Psychopathie (Persson et al., 2019; Wehner, Maaß, Leckelt, Back & Ziegler, 2020). Persson et al. (2019) fanden eine leichte Überlegenheit dieses zweifaktoriellen Bifaktor-Modells gegenüber dem Bifaktor-Modell mit drei konstruktspezifischen Faktoren. Bei Wehner et al. (2020) musste dieses Modell aufgrund von negativen Faktorladungen ausgeschlossen werden.

Bifaktor-Modelle werden üblicherweise so spezifiziert, dass auf allen Indikatoren sowohl der allgemeine Faktor (hier: der dunkle Kern) als auch konstruktspezifische Faktoren laden (Reise, 2012). Aufgrund von methodischen Mängeln dieser Herangehensweise haben Eid, Geiser, Koch und Heene (2017) zwei Alternativen vorgeschlagenen: Bei dem Bifaktor-(S – 1)-Modell wird ein Referenzkonstrukt lediglich für den allgemeinen Faktor und nicht für den konstruktspezifischen Faktor spezifiziert. Beim Bifaktor-(S·I – 1)-Modell wird ein einzelner Indikator als Referenz für den dunklen Kern bestimmt, sodass für die verbleibenden Indikatoren des Referenzkonstrukts ebenfalls ein konstruktspezifischer Faktor spezifiziert wird. In beiden Fällen wird die Varianzaufklärung durch konstruktspezifische Faktoren in Relation zum Referenzkonstrukt bzw. -indikator interpretiert. Somit beeinflusst die Wahl der Referenz die inhaltliche Interpretation des dunklen Kerns. Zwei der oben genannten Studien haben das (S·I – 1)-Modell zur Berechnung von Bifaktor-Modellen für die DT verwendet, wobei jeweils unterschiedliche Referenzindikatoren gewählt wurden (Savard et al., 2017; Wehner et al., 2020). Items des Dreckigen Dutzends bzw. der Niederträchtigen Neun erfassen hauptsächlich Merkmale, die allen Konstrukten der DT zugrunde liegen könnten (Furnham et al., 2013; Vize et al., 2019). Dies betrifft insbesondere Manipulation für die Machiavellismus-Skala und Gefühlslosigkeit für die Psychopathie-Skala (Klimstra, Jeronimus, Sijtsema & Denissen, 2020). Aus diesem Grund ist es fraglich, ob der zusätzliche konstruktspezifische Faktor im (S·I – 1)-Modell einen nennenswerten Informationsgewinn gegenüber des (S – 1)-Modells bringt, wenn der dunkle Kern tatsächlich zu einem großen Teil durch diese Konstrukte charakterisiert wäre.

Trotz umfangreicher Literatur zur Faktorstruktur der DT existieren kaum Studien, die sämtliche in der Literatur diskutierten Faktorstrukturen für das Dreckige Dutzend oder die Niederträchtigen Neun kombiniert betrachten. Besonders für deutsche Stichproben ergibt sich eine Lücke in der Literatur, da verschiedene Faktorstrukturen bisher zwar für die Short Dark Triad (Malesza, Ostaszewski, Büchner & Kaczmarek, 2019; Wehner et al., 2020), nicht aber für das Dreckige Dutzend verglichen wurden. Um die angemessenste Interpretation des dunklen Kerns zu identifizieren, ist es außerdem notwendig, bei der Spezifikation der von Eid et al. (2017) empfohlenen Bifaktor-Modelle die Verwendung verschiedener Referenzen zu vergleichen. Mit der vorliegenden Studie werden folgende Faktorstrukturen mit einer deutschen Stichprobe verglichen, um diese offenen Punkte zu adressieren: Das einfaktorielle Modell, das zweifaktorielle Modell, das dreifaktorielle Modell, das hierarchische Modell, Bifaktor-(S – 1)-Modelle mit drei konstruktspezifischen Faktoren, jeweils mit allen drei spezifischen Konstrukten als Referenzkonstrukt, Bifaktor-(S·I – 1)-Modelle mit zwei konstruktspezifischen Faktoren, jeweils mit Referenzindikatoren für alle drei Konstrukte der DT sowie Bifaktor-(S·I – 1)-Modelle mit drei konstruktspezifischen Faktoren, jeweils mit Referenzindikatoren für alle drei Konstrukte der DT.

Messinvarianz

Häufig erzielen Männer höhere Werte für die DT als Frauen (Muris et al., 2017) und jüngere Personen höhere Werte als ältere Personen (Spurk & Hirschi, 2018). Um solche Gruppenvergleiche sinnvoll interpretieren zu können, sollte die verwendete Skala zwischen den betrachteten Gruppen messinvariant sein (Vandenberg & Lance, 2000). Für das Dreckige Dutzend wurde die Messinvarianz in der Vergangenheit untersucht: Über das Geschlecht konnte skalare Messinvarianz belegt werden (Jonason et al., 2020; Klimstra, Sijtsema, Henrichs & Cima, 2014; Pechorro et al., 2021; Rogoza et al., 2020). Klimstra et al. (2020) belegten skalare Messinvarianz über das Geschlecht nur für Jugendliche, über das gesamte Altersspektrum von 11 bis 77 Jahren hinweg belegten sie lediglich metrische Invarianz. Über das Alter fanden Klimstra et al. (2020) vollständige oder partielle skalare Messinvarianz zwischen je zwei angrenzenden Altersgruppen (z. B. 11 – 13 vs. 14 – 16), jedoch häufig nicht zwischen nicht-angrenzenden Altersgruppen (z. B. 11 – 13 vs. 55 – 77). Spurk und Hirschi (2018) belegten partielle metrische Invarianz in einer deutschen Stichprobe, betrachteten dabei jedoch lediglich zwei entfernte Altersgruppen (25 – 34 vs. 50 – 59).

Keine uns bekannte Studie hat in der Vergangenheit in einer deutschen Stichprobe untersucht, ob das Dreckige Dutzend oder die Niederträchtigen Neun über das Geschlecht messinvariant sind, und auch für das Alter gibt es keine Studie, die ein umfassendes Altersspektrum in einer deutschen Stichprobe betrachtet. Diese Lücken schließen wir mit der vorliegenden Studie.

Normwerte

Um von Rohwerten einer Person Aussagen über Merkmalsausprägungen ableiten zu können, eignen sich Normwerttabellen, die über die relative Position der Person innerhalb einer Bezugsgruppe informieren (Woerner, Müller & Hasselhorn, 2017). In der vorliegenden Studie stellen wir erstmals Normwerte für die Niederträchtigen Neun in einer deutschen Referenzpopulation zur Verfügung. Durch die hinreichende Größe und Repräsentativität der Stichprobe sowie Aktualität der verwendeten Daten werden die Voraussetzungen für Normwerte erfüllt (Schmidt-Atzert & Amelang, 2012).

Die vorliegende Studie

In dieser Studie betrachten wir psychometrische Eigenschaften der Niederträchtigen Neun in einer repräsentativen deutschen Stichprobe. Hierfür wurden (1) verschiedene Faktorstrukturen verglichen, (2) Messinvarianz über das Geschlecht und über das Alter untersucht und (3) Normwerte berechnet.

Methoden

Datenerhebung

Datengrundlage ist die längsschnittliche Studie Das Vermächtnis – die Welt, die wir erleben wollen (Die Zeit, infas Institut für angewandte Sozialwissenschaft GmbH & Wissenschaftszentrum Berlin für Sozialforschung, 2015). Hierfür wurden im Jahr 2015 in drei Wellen 3 104 Personen in persönlichen Interviews befragt. Teilnehmende wurden anhand von Adressregistern zufällig ausgewählter deutscher Gemeinden zur Studie eingeladen. Die Stichprobe ist in Hinblick auf Altersgruppen, soziale Schichten und Wohnregionen repräsentativ, allerdings gab es auch geringfügige Abweichungen bekannter Merkmalsverteilungen. Zur Kompensation dieser Abweichungen wurden Anpassungsgewichte berechnet. Die DT wurde in der dritten Welle der Studie mit der Niederträchtigen Neun (Küfner et al., 2014) anhand einer siebenstufigen Likert-Skala erfasst (für deskriptive Statistiken & Reliabilitäten siehe Tabelle 1). An der dritten Welle haben 1 369 Personen teilgenommen. Um die Repräsentativität trotz Studienabbrecher_innen sicherzustellen, wurden Panelgewichte zur Adjustierung für ausbleibende Antworten berechnet. Das Alter der vorliegenden Stichprobe bewegte sich im Bereich von 14 – 80 Jahren (M = 49.03, SD = 19.13), 52 % waren weiblich. Weitere stichprobenbeschreibende Merkmale können dem elektronischen Supplement (ESM 1, Tabelle S1) entnommen werden.

Tabelle 1 Deskriptive Statistiken, Reliabilität und Korrelationen der Niederträchtigen Neun

Analysen

Die Analysen1 erfolgten mit den R-Paketen lavaan (Rosseel, 2012), lavaan.survey (Oberski, 2014), MVN (Korkmaz, Goksuluk & Zararsiz, 2014), psych (Revelle, 2017), semTools (Jorgensen, Pornprasertmanit, Schoemann & Rosseel, 2019), sirt (Robitzsch, 2020) und survey (Lumley, 2004). Normwerte wurden mit SPSS 28 (IBM, 2021) berechnet.

Zur Untersuchung der Faktorstrukturen sowie für Messinvarianzanalysen wurden konfirmatorische Faktoranalysen verwendet. Mangels multivariater Normalverteilung haben wir den Maximum-Likelihood-Robust-Schätzer (Satorra & Bentler, 2001) sowie für Nichtnormalität korrigierte robuste Fit-Indizes verwendet (Brosseau-Liard & Savalei, 2014; Brosseau-Liard, Savalei & Li, 2013). Um die Robustheit der Ergebnisse abzusichern, haben wir die Gesamtstichprobe in zwei zufällige Hälften geteilt und die Analysen (mit Ausnahme von Messinvarianz über das Alter) in beiden Stichproben separat durchgeführt. Um für Abweichungen der Stichprobenverteilung von bekannten Verteilungen sowie für Studienabbrecher_innen in der dritten Welle zu kompensieren, wurden Anpassungs- und Panelgewichte verwendet. Alle Analysen wurden sowohl ungewichtet als auch unter Verwendung beider Gewichte durchgeführt. Um zu einer Gesamtschlussfolgerung zu gelangen, wurden die Ergebnisse über beide Stichprobenhälften und über die ungewichteten und gewichteten Stichproben hinweg zusammenfassend betrachtet.

Zur Identifikation der Faktorstruktur mit der besten Anpassung an die Daten haben wir ein einfaktorielles Modell, ein zweifaktorielles Modell mit korrelierten Faktoren, ein dreifaktorielles Modell mit korrelierten Faktoren, ein hierarchisches Modell sowie Bifaktor-(S – 1)-Modelle und Bifaktor-(S·I – 1)-Modelle geschätzt (Eid et al., 2017). Beide Typen von Bifaktor-Modellen wurden jeweils mit Machiavellismus, Psychopathie und Narzissmus als Referenz für den dunklen Kern geschätzt. Für Bifaktor-(S·I – 1)-Modelle wurde jeweils derjenige Indikator gewählt, für den die höchsten Korrelationen mit den anderen Indikatoren innerhalb eines Konstruktes beobachtet wurden (ESM 1, Tabelle S2). Das Bifaktor-(S·I – 1)-Modell haben wir sowohl mit drei als auch mit zwei konstruktspezifischen Faktoren berechnet, sodass beim letzteren Machiavellismus und Psychopathie in einem gemeinsamen Faktor kombiniert wurden. Zur Skalierung latenter Variablen wurden die Faktorvarianzen auf 1 fixiert. Die Beurteilung der Modellgüte erfolgte anhand von Fit-Indizes. Für eine gute Modellanpassung sollten RMSEA und SRMR ≤ .050 und für eine akzeptable Anpassung ≤ .080 sein (Browne & Cudeck, 1992; Hu & Bentler, 1995). CFI und TLI sollten für eine gute Anpassung ≥ 0.970 und für eine akzeptable Anpassung ≥ 0.950 sein (Bentler, 1990).

Messinvarianz über das Geschlecht wurde durch Multigruppenanalysen untersucht (van de Schoot, Lugtig & Hox, 2012; Vandenberg & Lance, 2000). Dafür wurden zunehmend restriktivere Modelle geschätzt und miteinander verglichen, um konfigurale (gleiche Faktorstruktur), metrische (gleiche Faktorladungen), skalare (gleiche Item-Intercepts) und strikte (gleiche Residualvarianzen) Messinvarianz zu testen. Wir haben uns an folgenden Schwellenwerten orientiert, die für eine Verschlechterung der Modellgüte infolge von Gleichheitsrestriktionen nicht überschritten werden sollten: ΔRMSEA > .015, ΔCFI < -.010, ΔGamma-Hat < -.001 und ΔMcDonald’s Noncentrality Index (NCI) < -.020 (Chen, 2007; Cheung & Rensvold, 2002). Hatten mindestens zwei der Fit-Indizes diese Schwelle überschritten, wurden anhand von Modifikationsindizes weiterführende Analysen durchgeführt, um einzelne problematische Indikatoren zu identifizieren und im nächsten Schritt partielle Messinvarianz zu testen (Byrne, Shavelson & Muthén, 1989).

Messinvarianz über das Alter wurde auf zwei Arten getestet: Für Multigruppenanalysen wurden Personen nach ihrem Alter in fünf Kategorien aufgeteilt (Jugendliche 14 – 17; junges Erwachsenenalter 18 – 29; mittleres Erwachsenenalter 30 – 49; spätes Erwachsenenalter 50 – 65; Ältere 66 – 80). Diese etablierte Herangehensweise zur Messinvarianzanalyse über das Alter ist jedoch aufgrund der willkürlichen Bildung von Altersgrenzen und dem Informationsverlust bei der Kategorisierung von kontinuierlichen Variablen problematisch. Aus diesem Grund wurden zusätzlich lokal gewichtete Strukturgleichungsmodelle geschätzt (Hildebrandt, Lüdtke, Robitzsch, Sommer & Wilhelm, 2016; Hildebrandt, Wilhelm & Robitzsch, 2009). Dabei wird das Alter als kontinuierliche nicht-pa‍rametrische Moderatorvariable sämtlicher Modellparameter betrachtet, sodass untersucht werden kann, wie sich die Modellparameter über das Alter hinweg verändern. Die Messmodelle werden für jede Ausprägung der Moderatorvariable geschätzt, wobei stets alle Beobachtungen in die Schätzung mit einfließen, aber je nach Abstand zur jeweils betrachteten Ausprägung der Moderatorvariable mit unterschiedlichem Gewicht. Für diese Gewichtung wurde eine Gaußsche Kernelfunktion mit einem Bandbreitenfaktor von h = 2 verwendet (Hildebrandt et al., 2016). Zusätzlich haben wir anhand von simultanen Schätzungen nach Robitzsch (2020) Messinvarianz über das Alter unter Verwendung von Bootstrapping mit 100 Resamples getestet. Hierfür wurden, wie auch bei der Multigruppenanalyse, Veränderungen der Modellanpassung in Folge von Gleichheitsrestriktionen betrachtet. Es wurden die gleichen Schwellen für ΔRMSEA, ΔCFI und ΔNCI verwendet wie auch für die Multigruppenanalysen.

Die Normwertberechnung beruht auf Intervallmitten-Prozentwerten (Woerner et al., 2017) und wurde mit der gewichteten Stichprobe durchgeführt. Dafür wurden Summenwerte der Niederträchtigen Neun in eine Rangreihe gebracht und jedem Wert die relative Position innerhalb dieser Rangreihe zugeordnet. Zusätzlich stellen wir Quartile und intervallskalierte z-Wert-Äquivalente zur Verfügung, die wir mit der von McCall (1939) vorgeschlagenen Flächentransformation erstellt haben. Es wurden sowohl Globalnormen als auch geschlechts- und altersspezifische Normen berechnet.

Ergebnisse

Faktorstruktur

Die beste Modellanpassung ergab sich für das zweifaktorielle Bifaktor-(S·I – 1)-Modell mit einem gemeinsamen Faktor für Machiavellismus und Psychopathie und einem Indikator für Machiavellismus als Referenz für den dunklen Kern. Generell hatten alle Typen von Bifaktor-Modellen mit Machiavellismus als Referenz eine gute Modellanpassung, wobei der Unterschied zwischen dem (S – 1)-Modell und dem dreifaktoriellen (S·I – 1)-Modell sehr gering war. In den verschiedenen Stichproben (Stichprobe 1 und 2 jeweils ungewichtet und gewichtet) traten für alle drei Modelle vereinzelt Schätzprobleme und Anomalien auf (z. B. negative Ladungen oder Varianzen).

Für alle Typen von Bifaktor-Modellen mit Machiavellismus als Referenz fielen die Faktorladungen für die konstruktspezifischen Faktoren Psychopathie und Narzissmus tendenziell etwas höher aus als für den dunklen Kern (Abbildung 1). Anders ist es bei Indikatoren für Machiavellismus im zweifaktoriellen und dreifaktoriellen (S·I – 1)-Modell: Hierbei waren die Faktorladungen für den konstruktspezifischen Faktor sehr gering, sodass dieser über den dunklen Kern hinaus wenig zur Varianzaufklärung beitrug. Ladungen für den dunklen Kern fielen stets am höchsten für Machiavellismus-Indikatoren und am geringsten für Psychopathie-Indikatoren aus (für Abbildungen der Modelle in allen Stichproben siehe ESM 2 – 5).

Abbildung 1 Anmerkungen: Es werden unstandardisierte Werte dargestellt; Mach = Machiavellismus; Psyc = Psychopathie; Narz = Narzissmus; DK = Dunkler Kern; m = Indikator für Machiavellismus; p = Indikator für Psychopathie; n = Indikator für Narzissmus; Die Itemnummerierung bezieht sich auf die Nummerierung in Küfner et al. (2014). Abbildung 1. (a) Dreifaktorielles Modell, (b) Bifaktor-(S – 1)-Modell, (c) Bifaktor-(S·I – 1)-Modell mit zwei konstruktspezifischen Faktoren und (d) Bifaktor-(S·I – 1)-Modell mit drei konstruktspezifischen Faktoren.

Eine akzeptable Modellanpassung ergab sich darüber hinaus auch für das dreifaktorielle Modell. Das hierarchische Modell konvergierte in den meisten Stichproben nicht. Das einfaktorielle Modell, das zweifaktorielle Modell und alle Typen von Bifaktor-Modellen mit Psychopathie und Narzissmus als Referenz hatten keine akzeptable Modellanpassung. Zudem gab es für diese beiden Gruppen von Bifaktor-Modellen gehäuft Schätzprobleme und Anomalien. Insgesamt fielen die Ergebnisse zwischen den verschiedenen Stichproben sehr ähnlich aus und werden hier daher nur für die ungewichtete Stichprobe 1 dargestellt (Tabelle 2; siehe ESM 1, Tabelle E3 für die restlichen Stichproben).

Tabelle 2 Untersuchung der Faktorstrukturen mit Stichprobe 1 (ungewichtet)

Messinvarianz über das Geschlecht

Messinvarianz über das Geschlecht wurde für das dreifaktorielle Modell und für Bifaktor-Modelle mit Machiavellismus als Referenz untersucht (ESM 1, Tabelle S4). Für das dreifaktorielle Modell konnte in Stichprobe 1 strikte Invarianz belegt werden. In Stichprobe 2 jedoch konnte metrische Invarianz nicht belegt werden. Durch die Freisetzung der Ladung von Item 82 in der ungewichteten und Item 9 in der gewichteten Stichprobe konnte partielle metrische Invarianz belegt werden. Für Bifaktor–Modelle konnte metrische Invarianz in den meisten Stichproben nicht belegt werden. Durch die Freisetzung einer Ladung des dunklen Kerns konnte partielle metrische Invarianz belegt werden. Dabei handelt es sich um Item 5 in Stichprobe 1 und Item 8 in Stichprobe 2, in beiden Fällen Indikatoren für Psychopathie.

Messinvarianz über das Alter

Messinvarianz über das Alter wurde für das dreifaktorielle Modell und das Bifaktor-(S – 1)-Modell mit Machiavellismus als Referenz untersucht, da andere Bifaktor-Modelle Schätzprobleme oder größere Anomalien erzeugten. Multigruppenanalysen (ESM 1, Tabelle S5) und lokal gewichtete Strukturgleichungsmodelle mit simultaner Schätzung (ESM 1, Tabelle S6) führten insgesamt zu denselben Ergebnissen: In der gewichteten Stichprobe ergab sich häufig bereits für das konfigurale Modell eine nicht-akzeptable Modellgüte, sodass andere Formen der Invarianz nicht untersucht wurden. In der ungewichteten Stichprobe konnte metrische Invarianz belegt werden, nicht jedoch skalare Invarianz. Durch die Freisetzung von jeweils zwei Intercepts konnte zwar für die Multigruppenanalysen partielle skalare Invarianz belegt werden, nicht jedoch für die lokal gewichteten Strukturgleichungsmodelle. Für die Multigruppenanalysen ergaben sich durch die Gleichsetzung von Residualvarianzen im partiell skalaren Modell zusätzlich Probleme mit der strikten Invarianz, die durch die Freisetzung von zwei (dreifaktorielles Modell) bzw. drei (Bifaktor-(S – 1)-Modell) Residualvarianzen behoben werden konnten.

Eine deskriptive Betrachtung des Zusammenhangs zwischen Fit-Indizes und dem Altersmoderator zeigte zudem auf, dass die Modellgüte mit steigendem Alter sinkt und etwa ab einem Alter von 65 keine akzeptablen Werte mehr erreicht (Abbildung 2). Während die Ladungen für das dreifaktorielle Modell und den dunklen Kern im Bifaktor-(S – 1)-Modell einigermaßen stabil waren, zeigten sich häufig größere Schwankungen und Veränderungen über das Alter für Ladungen der konstruktspezifischen Faktoren im Bifaktor-(S – 1)-Modell (ESM 6 – 9). Außerdem lassen sich U-förmige Altersverläufe der Intercepts für Psychopathie-Indikatoren sowie leichte Abwärtstrends für die meisten anderen Indikatoren beobachten (Abbildung 3, siehe ESM 7 & ESM 9 für die gewichtete Stichprobe). Bei den Residuen waren insbesondere U-förmige Verläufe für Indikatoren für Psychopathie sowie ein Aufwärtstrend für Item 3 und 6 als Indikatoren für Narzissmus auffällig (siehe Abbildung 4 für das Bifaktor-(S – 1)-Modell, ESM 6 für das dreifaktorielle Modell und ESM 7 & ESM 9 für die gewichtete Stichprobe). Während die Kovarianz zwischen Machiavellismus und Psychopathie über das Alter relativ stabil war, stieg sie sowohl zwischen Machiavellismus und Narzissmus als auch zwischen Psychopathie und Narzissmus über das Alter an (ESM 6 & 7).

Abbildung 2 Anmerkungen: RMSEA = Root Mean Square Error of Approximation; CFI = Comparative Fit Index. Abbildung 2. Modellgüte in Abhängigkeit verschiedener Ausprägungen der Moderatorvariable Alter.
Abbildung 3 Anmerkungen: Die Itemnummerierung bezieht sich auf die Nummerierung in Küfner et al. (2014). Abbildung 3. Intercepts in Abhängigkeit verschiedener Ausprägungen der Moderatorvariable Alter.
Abbildung 4 Anmerkungen: Die Itemnummerierung bezieht sich auf die Nummerierung in Küfner et al. (2014). Abbildung 4. Residuen in Abhängigkeit verschiedener Ausprägungen der Moderatorvariable Alter für das Bifaktor-(S – 1)-Modell.

Normwerte

Die Normwerte sind in ESM 10 dargestellt. Anhand der Intervallmitten-Prozentränge kann für jeden Rohwert bestimmt werden, wie groß der prozentuelle Anteil der Referenzpopulation ist, der diesen Wert unter- oder überschreitet. Die Quartile geben an, in welches Viertel der Verteilung ein bestimmter Rohwert fällt. Durch lineare Transformation können z-Wert-Äquivalente in normalverteilte Standardnorm-Äquivalente (z. B. T-Werte) überführt werden (Schmidt-Atzert & Amelang, 2012).

Diskussion

In dieser Studie haben wir diverse psychometrische Eigenschaften der Niederträchtigen Neun (Küfner et al., 2014) betrachtet. Ein Vergleich verschiedener Faktorstrukturen ergab, dass Bifaktor-Modelle mit Machiavellismus als inhaltlicher Anker des dunklen Kerns die Skala am besten repräsentieren. Aber auch das von Paulhus und Williams (2002) theoretisch implizierte dreifaktorielle Modell erreichte eine akzeptable Modellanpassung. Über das Geschlecht ergaben sich Einschränkungen der metrischen Invarianz, partielle metrische Invarianz konnte jedoch belegt werden. Über das Alter konnte metrische Invarianz belegt werden, jedoch ergaben sich Einschränkungen der skalaren und strikten Invarianz.

Faktorstruktur

Konsistent über alle Stichproben hinweg waren lediglich Bifaktor-Modelle mit Machiavellismus als Referenz sowie das dreifaktorielle Modell grundsätzlich dazu geeignet, die DT zu repräsentieren, sodass vorangegangene Studien zur Faktorstruktur der DT auch für die Niederträchtigen Neun in einer deutschen Stichrobe bestätigt werden können (Kajonius et al., 2016; Savard et al., 2017; Wehner et al., 2020). Die beste Modellanpassung hatte das zweifaktorielle Bifaktor-(S·I – 1)-Modell mit einem gemeinsamen konstruktspezifischen Faktor für Machiavellismus und Psychopathie, was von Persson et al. (2019) auch für die Short Dark Triad belegt wurde. Dieses Ergebnis spricht für eine konzeptuelle Überscheidung von Machiavellismus und Psychopathie (Kajonius et al., 2016; Miller et al., 2017). Jedoch trugen konstruktspezifische Faktoren für Machiavellismus-Indikatoren sowohl in dem zweifaktoriellen als auch in dem dreifaktoriellen Bifaktor-(S·I – 1)-Modell über den dunklen Kern hinaus zu keinem großen Informationsgewinn bei. Aus diesem Grund scheint es gerechtfertigt, das weniger komplexe Bifaktor-(S – 1)-Modell ohne einen konstruktspezifischen Faktor für die Machiavellismus-Indikatoren zu bevorzugen.

Unterschiede in der Modellanpassung innerhalb von Bifaktor-Modellen desselben Typs mit verschiedenen Referenzen verdeutlichen die methodische und inhaltliche Bedeutung der Wahl der Referenz für Bifaktor-Modelle nach Eid et al. (2017). Neben der besten Passung von Machiavellismus für den dunklen Kern zeigte sich außerdem, dass Indikatoren für Psychopathie am geringsten mit dem dunklen Kern in Beziehung standen. Somit scheint Gefühlslosigkeit als das Merkmal, das die Psychopathie-Skala des Dreckigen Dutzends bzw. der Niederträchtigen Neun charakterisiert, den dunklen Kern weniger stark zu prägen als das Merkmal Manipulation, das die Machiavellismus-Skala charakterisiert (Klimstra et al., 2020). Die Überlegenheit von Modellen mit Machiavellismus als inhaltlicher Anker des dunklen Kerns sowie die beobachteten Ladungsmuster deuten darauf hin, dass Manipulation eine wichtige Rolle für den dunklen Kern spielt, was in der Vergangenheit bereits so vorgeschlagen wurde (Furnham et al., 2013; Vize et al., 2019).

Jedoch sollten Ergebnisse dieser Studie sowohl in Hinblick auf konzeptuelle Überlappungen von Machiavellismus und Psychopathie als auch in Hinblick auf einen durch Machiavellismus geprägten dunklen Kern mit Vorsicht interpretiert werden. Korrelationen zwischen Machiavellismus und den anderen beiden Konstrukten – insbesondere Psychopathie – fallen für das Dreckige Dutzend höher aus als für andere Skalen zur Erfassung der DT (Grosz et al., 2020; Muris et al., 2017). Zudem erfassen andere Skalen, beispielsweise die Short Dark Triad (Jones & Paulhus, 2014), eine größere Spannweite an Merkmalen, die für die einzelnen Konstrukte charakteristisch sind. Aus diesen Gründen könnten die Ergebnisse zur Faktorstruktur auch darauf zurückzuführen sein, dass die Items des Dreckigen Dutzends und der Niederträchtigen Neun sich nicht dafür eignen, konzeptuelle Unterschiede zwischen den Konstrukten angemessen abzubilden (siehe Miller et al., 2012; Muris et al., 2017). Auch könnte die selektive Auswahl von unspezifischeren Items bei der Erstellung von Kurzskalen wie dem Dreckigen Dutzend dazu führen, dass die Varianzaufklärung durch einen dunklen Kern höher ausfällt und folglich zu einer Bevorzugung von Bifaktor-Modellen führt (Wehner et al., 2020). Somit bleibt die Frage offen, ob die Überlegenheit von Bifaktor-Modellen mit Machiavellismus als inhaltlicher Anker für den dunklen Kern sich auch für andere Skalen zur Erfassung der DT replizieren lässt.

Messinvarianz

Über verschiedene Messmodelle hinweg ergaben sich Einschränkungen der metrischen Invarianz über das Geschlecht. Dies steht im Widerspruch zu vorangegangenen Studien, die metrische (Klimstra et al., 2020) oder skalare (Jonason et al., 2020; Klimstra et al., 2014) Invarianz für verschiedene Sprachversionen des Dreckigen Dutzends belegen konnten. Jedoch konnte in dieser Studie durch die Freisetzung einer einzelnen Ladung partielle metrische Invarianz belegt werden. Als problematische Items wurden hauptsächlich Indikatoren für Psychopathie identifiziert, für die bei Frauen geringere Ladungen beobachtet wurden als bei Männern. Sowohl die inhaltliche Zusammensetzung des Psychopathie-Konstrukts im dreifaktoriellen Modell als auch die Überlappung von Psychopathie mit dem dunklen Kern in Bifaktor-Modellen scheint sich zwischen Männern und Frauen zu unterscheiden. Möglicherweise neigen Frauen aufgrund von Geschlechternormen dazu, insbesondere Items zu Psychopathie sozial erwünscht zu beantworten. Eine weitere mögliche Erklärung könnte in geschlechtsspezifischen Beziehungen zwischen bestimmten Merkmalen und Konstrukten der DT liegen. So zeigten Jonason et al. (2013), dass Empathie bei Männern mit Psychopathie in Beziehung steht, bei Frauen jedoch mit Narzissmus. Basierend auf unseren Ergebnissen empfehlen wir, für das Konstrukt Psychopathie Geschlechtervergleiche nur mit Vorsicht zu interpretieren, wenn die Niederträchtigen Neun bzw. das Dreckige Dutzend verwendet werden.

Über eine Altersspanne von 14 bis 80 hinweg ergaben sowohl Multigruppenanalysen als auch lokal gewichtete Strukturgleichungsmodelle Einschränkungen der skalaren und strikten Invarianz, sodass Itemschwierigkeiten und Messgenauigkeit in Abhängigkeit des Alters zu variieren scheinen. Auch Klimstra et al. (2020) konnten skalare Invarianz für nicht-angrenzende Altersgruppen nicht belegen. Durch die Freisetzung mehrerer Modellparameter aller drei Konstrukte konnte im Rahmen der Multigruppenanalyse partielle skalare und strikte Invarianz belegt werden. Außerdem sank die Modellgüte über das Alter, sodass ab einem Alter von etwa 65 Jahren die untersuchten Messmodelle die DT nicht mehr adäquat abzubilden scheinen. Aus diesem Grund sollte bei der Befragung von älteren Personen mit der Niederträchtigen Neun bzw. dem Dreckigen Dutzend die Ergebnisinterpretation nur mit großer Vorsicht und nicht ohne eine Überprüfung der psychometrischen Qualität in der jeweils verwendeten Stichprobe erfolgen. Für Altersvergleiche sollten die Skalen nicht bzw. nicht ohne eine Prüfung der Messinvarianz vorab erfolgen – vor allem, wenn Personen verglichen werden sollen, die bezüglich ihres Alters weiter auseinanderliegen.

Limitationen und Ausblick

Eine Limitation dieser Studie ist die Anzahl der Studienabbrecher_innen in der dritten Welle, was die Repräsentativität der Stichprobe einschränkt. Jedoch wurde versucht, dies durch die Verwendung von Gewichten zu kompensieren. Vereinzelte Abweichungen zwischen der ungewichteten und gewichteten Stichprobe schränken allerdings die Robustheit mancher Ergebnisse ein. Dies betrifft vor allem Messinvarianzanalysen über das Alter, wobei sich für die ungewichtete Stichprobe metrische Invarianz ergab, in der gewichteten jedoch konfigurale Invarianz nicht bestätigt werden konnte.

Eine weitere Limitation ist das querschnittliche Design. Eine längsschnittliche Betrachtung der DT wäre zukünftig in Hinblick auf das Alter interessant. Die aktuelle Studienlage lässt es selten zu, entwicklungsbedingte Verläufe von Kohortenunterschieden als mögliche Ursachen beobachteter Altersunterschiede der DT trennen zu können. Außerdem zeigen die Ergebnisse dieser Studie, dass auch Unterschiede der Itemschwierigkeiten beobachtete Altersunterschiede bedingt haben könnten. Längsschnittliche Studien würden eine Untersuchung der längsschnittlichen Messinvarianz ermöglichen und aufzeigen, ob Itemschwierigkeiten sich innerhalb von Personen mit steigendem Alter verändern oder ob Schwierigkeitsunterschiede zwischen verschiedenen Altersgruppen eher auf Kohortenunterschiede zurückzuführen sind.

Personen mit erhöhten Ausprägungen aversiver Persönlichkeitsmerkmale neigen besonders dazu, auf Fragen zu negativ besetzten Eigenschaften sozial erwünscht zu antworten (Muris et al., 2017; Pineda, Sandín & Muris, 2020). Dies stellt eine wichtige Limitation der vorliegenden Studie dar, insbesondere da die Daten anhand persönlicher Interviews erhoben wurden. Solche Antwortverzerrungen auf Items zur DT könnten sich auch systematisch in Abhängigkeit der in dieser Studie betrachteten Merkmale Geschlecht und Alter unterscheiden, was auch eine mögliche Erklärung für Einschränkungen der Messinvarianz sein könnte und zukünftig untersucht werden sollte.

Fazit

Mit der vorliegenden Studie wurden verschiedene psychometrische Eigenschaften der Niederträchtigen Neun mit einer repräsentativen deutschen Stichprobe untersucht, die zuvor auch für die Ursprungsversion der Skala, das Dreckige Dutzend, selten oder auf unzureichende Weise in deutschen Stichproben betrachtet wurden. Durch einen Vergleich verschiedener Faktorstrukturen wurde gezeigt, dass die Wahl des Referenzkonstrukts bei Bifaktor-Modellen entscheidend ist und dass Machiavellismus sich am besten als inhaltlicher Anker für den dunklen Kern eignet. Über das Geschlecht ergaben sich Einschränkungen der metrischen Invarianz, die hauptsächlich auf Indikatoren von Psychopathie zurückzuführen sind. Partielle metrische Invarianz konnte jedoch belegt werden. Über das Alter konnte metrische Invarianz belegt werden, jedoch ergaben sich Einschränkungen der skalaren und strikten Invarianz. Außerdem wurden erstmals Normwerte für die DT zur Verfügung gestellt, was eine individualdiagnostische Einordnung der Niederträchtigen Neun in Anwendungskontexten wie Coaching oder Interventionen ermöglicht.

Wir bedanken uns bei Jutta Allmendinger, Jan Wetzel sowie dem gesamten Team der Vermächtnisstudie für die Bereitstellung der Daten, bei Peter Hähner für wertvolle Hinweise zur Verständlichkeit dieses Manuskripts sowie bei Mahmoud Aldalati, Vivien Janowicz, Anne Neuber, Marilena Rüsberg und Melina Sostmann für ihre Unterstützung bei der Erstellung dieses Manuskripts.

Literatur

  • Bentler, P. M. (1990). Comparative Fit Indexes in Structural Models. Psychological Bulletin, 107, 238 – 246. https://doi.org/10.1037/0033-2909.107.2.238 First citation in articleCrossrefGoogle Scholar

  • Brosseau-Liard, P. E. & Savalei, V. (2014). Adjusting Incremental Fit Indices for Nonnormality. Multivariate Behavioral Research, 49, 460 – 470. https://doi.org/10.1080/00273171.2014.9336974 First citation in articleCrossrefGoogle Scholar

  • Brosseau-Liard, P. E., Savalei, V. & Li, L. (2013). An investigation of the sample performance of two nonnormality corrections for RMSEA. Multivariate Behavioral Research, 47, 904 – 930. https://doi.org/10.1080/00273171.2012.715252 First citation in articleCrossrefGoogle Scholar

  • Browne, M. W. & Cudeck, R. (1992). Alternative ways of assessing model fit. Sociological Methods & Research, 21, 230 – 258. https://doi.org/10.1177/0049124192021002005 First citation in articleCrossrefGoogle Scholar

  • Byrne, B. M., Shavelson, R. J. & Muthén, B. (1989). Testing for the equivalence of factor covariance and mean structures: The issue of partial measurement invariance. Psychological Bulletin, 105, 456 – 466. https://doi.org/10.1037/0033-2909.105.3.456 First citation in articleCrossrefGoogle Scholar

  • Chen, F. F. (2007). Sensitivity of goodness of fit indexes to lack of measurement invariance. Structural Equation Modeling, 14, 464 – 504. https://doi.org/10.1080/10705510701301834 First citation in articleCrossrefGoogle Scholar

  • Cheung, G. W. & Rensvold, R. B. (2002). Evaluating Goodness-of-Fit indexes for testing measurement invariance. Structural Equation Modeling, 9, 233 – 255. https://doi.org/10.1207/S15328007SEM0902_5 First citation in articleCrossrefGoogle Scholar

  • Die Zeit, X., infas Institut für angewandte Sozialwissenschaft GmbH, X. & Wissenschaftszentrum Berlin für Sozialforschung, X. (2015). Das Vermächtnis – die Welt, die wir erleben wollen. (Band 3. Welle). Verfügbar unter: https://www.infas.de/service/das-vermaechtnis/ First citation in articleGoogle Scholar

  • Eid, M., Geiser, C., Koch, T. & Heene, M. (2017). Anomalous results in G-factor models: Explanations and alternatives. Psychological Methods, 22, 541 – 562. https://doi.org/10.1037/met0000083 First citation in articleCrossrefGoogle Scholar

  • Furnham, A., Richards, S. C. & Paulhus, D. L. (2013). The Dark Triad of Personality: A 10 year review. Social and Personality Psychology Compass, 7, 199 – 216. https://doi.org/10.1111/spc3.12018 First citation in articleCrossrefGoogle Scholar

  • Grosz, M. P., Harms, P. D., Dufner, M., Kraft, L. & Wetzel, E. (2020). Reducing the overlap between machiavellianism and subclinical psychopathy: The M7 and P7 scales. Collabra: Psychology, 6 (1), 1 – 16. https://doi.org/10.1525/collabra.17799 First citation in articleCrossrefGoogle Scholar

  • Hildebrandt, A., Lüdtke, O., Robitzsch, A., Sommer, C. & Wilhelm, O. (2016). Exploring Factor Model Parameters across Continuous Variables with Local Structural Equation Models. Multivariate Behavioral Research, 51, 257 – 258. https://doi.org/10.1080/00273171.2016.1142856 First citation in articleCrossrefGoogle Scholar

  • Hildebrandt, A., Wilhelm, O. & Robitzsch, A. (2009). Complementary and competing factor analytic approaches for the investigation of measurement invariance. Review of Psychology, 16 (2), 87 – 102. First citation in articleGoogle Scholar

  • Hu, L.-T. & Bentler, P. M. (1995). Evaluating model fit. In R.H. Hoyle (Ed.), Structural equation modeling: Concepts, issues, and applications (pp. 76 – 99). London: Sage. First citation in articleGoogle Scholar

  • Corp., IBM (2021). IBM SPSS Statistics for Macintosh, Version 28.0. Armonk, NY: IBM. First citation in articleGoogle Scholar

  • Jonason, P. K., Li, N. P. & Teicher, E. A. (2010). Who is James Bond?: The dark triad as an agentic social style. Individual Differences Research, 8 (2), 111 – 120. First citation in articleGoogle Scholar

  • Jonason, P. K., Lyons, M., Bethell, E. J. & Ross, R. (2013). Different routes to limited empathy in the sexes: Examining the links between the Dark Triad and empathy. Personality and Individual Differences, 54, 572 – 576. https://doi.org/10.1016/j.paid.2012.11.009 First citation in articleCrossrefGoogle Scholar

  • Jonason, P. K. & Webster, G. D. (2010). The Dirty Dozen: A concise measure of the dark triad. Psychological Assessment, 22, 420 – 432. https://doi.org/10.1037/a0019265 First citation in articleCrossrefGoogle Scholar

  • Jonason, P. K., Żemojtel-Piotrowska, M., Piotrowski, J., Sedikides, C., Campbell, W. K., Gebauer, J. E. et al. (2020). Country-Level correlates of the Dark Triad traits in 49 countries. Journal of Personality, 88 (6), 1 – 16. https://doi.org/10.1111/jopy.12569 First citation in articleCrossrefGoogle Scholar

  • Jones, D. N. & Figueredo, A. J. (2013). The Core of Darkness: Uncovering the Heart of the Dark Triad. European Journal of Personality, 27, 521 – 531. https://doi.org/10.1002/per.1893 First citation in articleCrossrefGoogle Scholar

  • Jones, D. N. & Paulhus, D. L. (2014). Introducing the Short Dark Triad (SD3): A brief measure of dark personality traits. Assessment, 21 (1), 28 – 41. https://doi.org/10.1177/1073191113514105 First citation in articleCrossrefGoogle Scholar

  • Jorgensen, T. D., Pornprasertmanit, S., Schoemann, A. M. & Rosseel, Y. (2019). semTools: Useful tools for structural equation modeling, R package. Retrieved from https://CRAN.R-project.org/package=semTools First citation in articleGoogle Scholar

  • Kajonius, P. J., Persson, B. N., Rosenberg, P. & Garcia, D. (2016). The (mis)measurement of the Dark Triad Dirty Dozen: Exploitation at the core of the scale. PeerJ, 4, e1748. https://doi.org/10.7717/peerj.1748 First citation in articleCrossrefGoogle Scholar

  • Klimstra, T. A., Jeronimus, B. F., Sijtsema, J. J. & Denissen, J. J. A. (2020). The unfolding dark side: Age trends in dark personality features. Journal of Research in Personality, 85, 103915. https://doi.org/10.1016/j.jrp.2020.103915 First citation in articleGoogle Scholar

  • Klimstra, T. A., Sijtsema, J. J., Henrichs, J. & Cima, M. (2014). The Dark Triad of personality in adolescence: Psychometric proberties of a concise measure and associations with adolescent adjustment from a multi-informant perspective. Journal of Research in Personality, 53, 84 – 92. https://doi.org/10.1016/j.jrp.2014.09.001 First citation in articleCrossrefGoogle Scholar

  • Korkmaz, S., Goksuluk, D. & Zararsiz, G. (2014). MVN: An R package for assessing multivariate normality. The R Journal, 6, 151 – 162. First citation in articleCrossrefGoogle Scholar

  • Küfner, A. C. P., Dufner, M. & Back, M. D. (2014). Das Dreckige Dutzend und die Niederträchtigen Neun. Kurzskalen zur Erfassung von Narzissmus, Machiavellismus und Psychopathie. Diagnostica, 61, 2014. https://doi.org/10.1026/0012-1924/a000124 First citation in articleGoogle Scholar

  • Lumley, T. (2004). Analysis of complex survey samples. Journal of Statistical Software, 9, 1 – 19. https://doi.org/10.18637/jss.v009.i08 First citation in articleCrossrefGoogle Scholar

  • Malesza, M., Ostaszewski, P., Büchner, S. & Kaczmarek, M. C. (2019). The adaptation of the Short Dark Triad personality measure – psychometric properties of a German sample. Current Psychology, 38, 855 – 864. https://doi.org/10.1007/s12144-017-9662-0 First citation in articleCrossrefGoogle Scholar

  • McCall, W. A. (1939). Measurement. New York: Macmillan. First citation in articleGoogle Scholar

  • McDonald, R. P. (1999). Test theory: A unified treatment. Mahwah, NJ: Lawrence Erlbaum. First citation in articleGoogle Scholar

  • Miller, J. D., Few, L. R., Seibert, L. A., Watts, A., Zeichner, A. & Lynam, D. R. (2012). An examination of the Dirty Dozen measure of psychopathy: A cautionary tale about the costs of brief measures. Psychological Assessment, 24, 1048 – 1053. https://doi.org/10.1037/a0028583 First citation in articleCrossrefGoogle Scholar

  • Miller, J. D., Hyatt, C. S., Maples-Keller, J. L., Carter, N. T. & Lynam, D. R. (2017). Psychopathy and machiavellianism: A distinction without a difference? Journal of Personality, 85, 439 – 453. https://doi.org/10.1111/jopy.12251 First citation in articleCrossrefGoogle Scholar

  • Muris, P., Merckelbach, H., Otgaar, H. & Meijer, E. (2017). The malevolent side of human nature: A meta-analysis and critical review of the literature on the Dark Triad (Narcissism, Machiavellianism, and Psychopathy). Perspectives on Psychological Science, 12, 183 – 204. https://doi.org/10.1177/1745691616666070 First citation in articleCrossrefGoogle Scholar

  • Oberski, D. (2014). lavaan.survey: An R Package for Complex Survey Analysis of Structural Equation Models. Journal of Statistical Software, 57 (1), 1 – 27. First citation in articleCrossrefGoogle Scholar

  • Paulhus, D. L. & Jones, D. N. (2015). Measures of Dark Personalities. In G. J. BoyleD. H. SaklosfskeG. Matthews (Hrsg.), Measures of Personality and Social Psychological Constructs (S. 562 – 594). San Diego: Academic Press. https://doi.org/10.1016/B978-0-12-386915-9.00020-6 First citation in articleCrossrefGoogle Scholar

  • Paulhus, D. L. & Williams, K. M. (2002). The Dark Triad of personality: Narcissism, Machiavellianism, and psychopathy. Journal of Research in Personality, 36, 556 – 563. https://doi.org/10.1016/S0092-6566(02)00505-6 First citation in articleCrossrefGoogle Scholar

  • Pechorro, P., Jonason, P. K., Raposo, V. & Maroco, J. (2021). Dirty dozen: A concise measure of dark triad traits among at-risk youths. Current Psychology, 40, 3522 – 3531. https://doi.org/10.1007/s12144-019-00288-9 First citation in articleCrossrefGoogle Scholar

  • Persson, B. N., Kajonius, P. J. & Garcia, D. (2019). Revisiting the Structure of the Short Dark Triad. Assessment, 26 (1), 3 – 16. https://doi.org/10.1177/1073191117701192 First citation in articleCrossrefGoogle Scholar

  • Pineda, D., Sandín, B. & Muris, P. (2020). Psychometrics properties of the Spanish version of two Dark Triad scales: The Dirty Dozen and the Short Dark Triad. Current Psychology, 39, 1873 – 1881. https://doi.org/10.1007/s12144-018-9888-5 First citation in articleCrossrefGoogle Scholar

  • Reise, S. P. (2012). The Rediscovery of Bifactor Measurement Models. Multivariate Behavioral Research, 47, 667 – 696. https://doi.org/10.1080/00273171.2012.715555 First citation in articleCrossrefGoogle Scholar

  • Revelle, W. (2017). psych: Procedures for personality and psychological research. Evanston, Illinois: Northwestern University. Verfügbar unter: https://cran.r-project.org/package=psych Version = 1.7.8 First citation in articleGoogle Scholar

  • Robitzsch, A. (2020). sirt: Supplementary Item Response Theory Models. R package version 3.9 – 4. Verfügbar unter: https://cran.r-project.org/package=sirt First citation in articleGoogle Scholar

  • Rogoza, R., Żemojtel-Piotrowska, M., Jonason, P. K., Piotrowski, J., Campbell, K. W., Gebauer, J. E. et al. (2020). Structure of Dark Triad Dirty Dozen across eight world regions. Assessment. https://doi.org/10.1177/1073191120922611 First citation in articleGoogle Scholar

  • Rosseel, Y. (2012). lavaan: An R package for structural equation modeling. Journal of Statistical Software, 48 (2), 1 – 36. https://doi.org/10.18637/jss.v048.i02 First citation in articleCrossrefGoogle Scholar

  • Sabouri, S., Gerber, M., Bahmani, D. S., Lemola, S., Clough, P. J., Kalak, N. et al. (2016). Examining Dark Triad traits in relation to mental toughness and physical activity in young adults. Neuropsychiatric Disease and Treatment, 12, 229 – 235. https://doi.org/10.2147/NDT.S97267 First citation in articleGoogle Scholar

  • Satorra, A. & Bentler, P. (2001). A scaled difference chi-square test statistic for moment structure analysis. Psychometrika, 66, 507 – 514. First citation in articleCrossrefGoogle Scholar

  • Savard, C., Simard, C. & Jonason, P. K. (2017). Psychometric properties of the French-Canadian version of the Dark Triad Dirty Dozen. Personality and Individual Differences, 119, 122 – 128. https://doi.org/10.1016/j.paid.2017.06.044 First citation in articleCrossrefGoogle Scholar

  • Schmidt-Atzert, L. & Amelang, M. (2012). Grundlagen diagnostischer Verfahren. Psychologische Diagnostik (5. Auflage, S. 35 – 174). Berlin Heidelberg: Springer. https://doi.org/10.1007/978-3-642-17001-0_2 First citation in articleGoogle Scholar

  • Spurk, D. & Hirschi, A. (2018). The Dark Triad and competitive psychological climate at work: A model of reciprocal relationships in dependence of age and organization change. European Journal of Work and Organizational Psychology, 27, 736 – 751. https://doi.org/10.1080/1359432X.2018.1515200 First citation in articleGoogle Scholar

  • Van de Schoot, R., Lugtig, P. & Hox, J. (2012). A checklist for testing measurement invariance. European Journal of Developmental Psychology, 9 (4), 37 – 41. https://doi.org/10.1080/17405629.2012.686740 First citation in articleCrossrefGoogle Scholar

  • Vandenberg, R. J. & Lance, C. E. (2000). A review and synthesis of the measurement invariance literature: Suggestions, practices, and recommendations for organizational research. Organizational Research Methods, 3 (1), 4 – 69. https://doi.org/10.1177/109442810031002 First citation in articleCrossrefGoogle Scholar

  • Vize, C. E., Collison, K. L., Miller, J. D. & Lynam, D. R. (2019). The „Core“ of the Dark Triad: A Test of Competing Hypotheses. Personality Disorders: Theory, Research, and Treatment, 11 (2), 91 – 99. https://doi.org/10.1037/per0000386 First citation in articleCrossrefGoogle Scholar

  • Wehner, C., Maaß, U., Leckelt, M., Back, M. D. & Ziegler, M. (2020). Validation of the Short Dark Triad in a German sample: Structure, nomological network, and an ultrashort version. European Journal of Psychological Assessment. https://doi.org/10.1027/1015-5759/a000617 First citation in articleLinkGoogle Scholar

  • Woerner, W., Müller, C. & Hasselhorn, M. (2017). Bedeutung und Berechnung der Prozentränge und T-Werte beim Erstellen von Testnormen: Anmerkungen und Empfehlungen. In U. TrautweinM. Hasselhorn (Hrsg.), Begabungen und Talente. Jahrbuch der pädagogisch-psychologischen Diagnostik. Tests und Trends (Bd. 15) (S. 245 – 267). Göttingen: Hogrefe. First citation in articleGoogle Scholar

1Die Präregistrierung (https://osf.io/r927t), eine Übersicht der Abweichungen von der Präregistrierung (https://osf.io/s5hnf) sowie die Analyseskripte (https://osf.io/cjx32/) können auf OSF aufgerufen werden.

2Die Itemnummerierung bezieht sich auf Küfner et al. (2014).