Skip to main content
Open Access

Entwicklung und Validierung einer deutschen Kurzversion des Volunteer Functions Inventory (VFI)

Published Online:https://doi.org/10.1026/0012-1924/a000328

Abstract

Zusammenfassung: Das Volunteer Functions Inventory (VFI, Clary et al., 1998) erfasst mit 6 Skalen (Karriere-‍, Selbstwert-‍, Schutz-‍, Soziale Anpassungs-‍, Erfahrungs- und Wertefunktion) die Motivation von Freiwilligenarbeit. Das Inventar, das auch in einer deutschen Adaptation vorliegt (Oostlander et al., 2014), umfasst jedoch insgesamt 30 Items, was seinem Einsatz entgegenstehen kann. Daher wurde eine deutsche Kurzversion des VFI, die zwei Items pro Funktion umfasst, entwickelt und validiert. Anhand von zwei unterschiedlichen Stichproben freiwillig Tätiger (N1 = 2 576 und N2 = 202) wurden Itemanalysen durchgeführt, die Faktorenstruktur überprüft und die Kriterien der lokalen Anpassungsgüte betrachtet. Die Ergebnisse dieser Analysen sprechen für eine hohe Reliabilität und faktorielle, konvergente sowie diskriminante Validität der Kurzversion. Hohe Zusammenhänge zwischen der Kurzversion und der deutschen Adaptation in einer weiteren Stichprobe (N3 = 573) sowie dem englischsprachigen Pendant der Kurzversion und der englischsprachigen Langversion (N4 = 101) bestätigen, dass die Skalen der Kurzversion jene des VFI angemessen repräsentieren. Die entwickelte Kurzversion eignet sich somit zur ökonomischen Messung der Motive von Freiwilligenarbeit.

The Development and Validation of a German Short Version of the Volunteer Functions Inventory (VFI)

Abstract: The Volunteer Functions Inventory (VFI, Clary et al., 1998) assesses the motivation of volunteering. It assesses six functions served by volunteering: (1) career, (2) enhancement, (3) protection, (4) social, (5) understanding, and (6) values. In 2014, the VFI was adapted in German (Oostlander et al., 2014). Comprising 30 items, the inventory is relatively long, which may be a barrier to its use in science and practice. Therefore, we developed and validated a German short version of the VFI consisting of two items per function. Two samples of volunteers (N1 = 2 576 and N2 = 202) served as a basis for item analysis, to examine factor structure, and to determine local adaptation. The results of these analyses suggest high reliability as well as factorial, convergent, and discriminative validity of the short version. High correlations between the scales of the short version and the German adaptation in a third sample (N3 = 573) as well as between the English equivalent of the short version and the original English long version (N4 = 101) confirm that the short version adequately represents the scales of the VFI. The newly developed short version is thus an appropriate instrument to economically measure the motives for volunteering.

Knapp 40 % der Personen ab 14 Jahren in Deutschland sind freiwillig tätig (Simonson, Kelle, Kausmann & Tesch-Römer, 2022). Ihre Freiwilligenarbeit ermöglicht Partizipation, fördert gesellschaftliche Integration und stärkt die Demokratie (Alscher, Priller & Burkhardt, 2021). Freiwilligenarbeit findet in der Regel über einen längeren Zeitraum und in einem organisierten Rahmen statt, ist gemeinwohlorientiert und, abgesehen von möglichen kleineren Entschädigungen, unbezahlt (Simonson et al., 2022; Wehner, Güntert, Neufeind & Mieg, 2015; Wilson, 2000). Ein weiteres wichtiges Merkmal ist, dass die Tätigkeit auf einer freiwilligen Entscheidung sich zu engagieren beruht, losgelöst von der Notwendigkeit zur Sicherung des Lebensunterhalts (Simonson et al., 2022; Wehner et al., 2015; Wilson, 2000). Die Frage, warum Menschen diese Entscheidung treffen und ihre Freiwilligenarbeit über einen längeren Zeitraum fortführen, ist zentral für das Verständnis von Freiwilligenarbeit.

Zur Erklärung dieser Motivation hat sich der sogenannte funktionale Ansatz als aufschlussreich erwiesen. In diesem Ansatz werden die Beweggründe für Freiwilligenarbeit als multidimensionale Einstellungen aufgefasst. Es wird davon ausgegangen, dass menschliche Handlungen unterschiedliche Funktionen erfüllen und dadurch motiviert sind (Clary et al., 1998).

Im Volunteer Functions Inventory (VFI) (Clary et al., 1998) werden sechs zentrale Funktionen, die Freiwilligenarbeit für die Freiwilligen erfüllen kann, operationalisiert. Dieses Messinstrument hat sich über viele Kontexte (z. B. Sport, Ökologie oder Karitatives) hinweg für diesen Zweck bewährt (Chacón, Gutiérrez, Sauto, Vecina & Pérez, 2017) und gilt mittlerweile als Standardinstrument hierfür (Gage & Thapa, 2012). Dies wird auf seine gute theoretische Fundierung und seine psychometrische Qualität, aber auch auf die Verfügbarkeit zahlreicher Übersetzungen der ursprünglich englischsprachigen Skala zurückgeführt (Chacón et al., 2017). Solche Übersetzungen liegen unter anderem in Chinesisch (Wu, Wing Lo & Liu, 2009), Spanisch (Chacón & Dávila, 2005) und Deutsch vor (Oostlander, Güntert, van Schie & Wehner, 2014).

In der Forschung zu Freiwilligenarbeit konnte gezeigt werden, dass die Passung zwischen den mit dem VFI erfassten Motiven und den Möglichkeiten und Anforderungen der Freiwilligenarbeit ein wichtiger Faktor für die Zufriedenheit mit und die Weiterführung von Freiwilligenarbeit sind (Clary et al., 1998). Freiwilligenarbeit kann somit erfolgreich gestaltet werden, wenn Freiwilligenorganisationen die Motive ihrer Freiwilligen kennen. Daraus ergibt sich neben der hohen wissenschaftlichen Bedeutung des VFI auch eine unmittelbare praktische Relevanz des Messinstruments.

Allerdings ist das VFI mit seinen insgesamt 30 Items ein vergleichsweise langes Messinstrument und mit der in Fragebogenstudien oftmals notwendigen ökonomischen Messung nicht immer vereinbar. Auch für den Einsatz in der Praxis ist die Länge ein potenzielles Hindernis. Zum Teil wird dies gelöst, indem eine geringere Anzahl von Items pro Dimension eingesetzt wird (z. B. Kals & Strubel, 2017; Güntert, Neufeind & Wehner, 2015). Die Validität solcher ad-hoc-Kurzversionen kann in der Regel jedoch nicht umfänglich geprüft werden. Zudem besteht die Gefahr, dass unterschiedliche Forschende verschiedene Teilmengen von Items verwenden und somit die Vergleichbarkeit der Studien leidet. Eine Kurzversion liegt bislang weder für das englische Original noch für die deutsche Adaptation vor. Das Ziel der vorliegenden Studie ist daher die Entwicklung und Validierung einer deutschsprachigen Kurzversion des VFI.

Das Volunteer Functions Inventory

Das VFI basiert auf dem sogenannten funktionalen Ansatz. Dieser widmet sich der Frage, welche Funktionen bestimmte Einstellungen für das Individuum erfüllen (Katz, 1960; Smith, Bruner & White, 1956). Von Clary, Snyder und Ridge (1992) wurde dieser Ansatz auf die Motivation von Freiwilligenarbeit übertragen. Die Antwort auf die Frage, welche Funktionen Freiwilligenarbeit für den Einzelnen erfüllt, soll dazu dienen, die individuelle Motivation für diese Tätigkeit zu verstehen. Ein und dasselbe Verhalten kann bei verschiedenen Individuen unterschiedliche Funktionen erfüllen, so dass die gleiche Freiwilligenarbeit bei verschiedenen Individuen unterschiedlich motiviert sein kann (Clary et al., 1992). Außerdem kann Freiwilligenarbeit beim Einzelnen gleichzeitig mehrere Funktionen in unterschiedlicher Gewichtung erfüllen (Clary et al., 1992).

Basierend auf den Funktionen, die bei Katz (1960) und Smith et al. (1956) genannt werden, und Forschungsergebnissen zur Motivation von Freiwilligenarbeit entwickelten Clary et al. (1998) mit dem VFI ein Inventar zur Messung der potenziellen Funktionen von Freiwilligenarbeit. Es enthält sechs Funktionen, operationalisiert durch je fünf Items, deren Wichtigkeit für die Freiwilligenarbeit auf einer siebenstufigen Skala als Selbstauskunft abgefragt wird. Diese Funktionen werden im Folgenden entsprechend der Konzeption von Clary et al. (1992) dargestellt:

Die Karrierefunktion thematisiert die Möglichkeit von Lernerfahrungen, wobei die Motivation instrumentell in Hinblick auf die berufliche Weiterentwicklung und die Karrierechancen ist. Die Items sprechen die positive Wirkung der Freiwilligenarbeit im eigenen Lebenslauf, den Erwerb karriereförderlicher Kontakte, das Erkunden beruflicher Möglichkeiten und die Erleichterung eines spezifischen beruflichen Einstiegs ebenso an, wie die Chance, dass die Freiwilligenarbeit den beruflichen Erfolg allgemein unterstützt.

Die Selbstwertfunktion bezieht sich auf die Möglichkeit, durch die Freiwilligenarbeit ein positives Selbstbild aufzubauen und zu stabilisieren sowie das eigene Selbstwertgefühl zu verbessern. Entsprechende Items erfassen, dass man durch die Freiwilligenarbeit neue Leute kennenlernen kann, sich durch die Freiwilligenarbeit besser fühlt und das Gefühl hat, gebraucht zu werden und wichtig zu sein.

Mit der Schutzfunktion werden ebenfalls mögliche Auswirkungen der Freiwilligenarbeit auf das Selbst aufgegriffen. Dabei geht es jedoch um die Abwehr negativer Einflüsse, um die Möglichkeit, das eigene Selbst durch die Freiwilligenarbeit vor als unangenehm empfundenen Emotionen bezogen auf die eigene Person und anderen belastenden Einflüssen zu schützen. Entsprechende Items thematisieren das Vergessen und die Ablenkung von Sorgen, die Unterstützung bei der Bewältigung von Problemen sowie die Reduktion von Einsamkeit und existenzieller Schuld.

Als soziale Anpassungsfunktion wird die Möglichkeit bezeichnet, durch die Freiwilligenarbeit sozialen Erwartungen zu entsprechen. Damit wird der normative Einfluss von Freund_innen, Familie und persönlich bedeutsamen sozialen Gruppen auf Freiwilligenarbeit aufgegriffen. In den Items werden in erster Linie deskriptive Normen thematisiert: Es geht darum, ob Menschen aus dem Freundeskreis freiwillig tätig sind, der Bekanntenkreis das Interesse an der Freiwilligenarbeit teilt, nahestehende Menschen der Freiwilligenarbeit einen hohen Stellenwert beimessen und ob Freiwilligenarbeit für Menschen aus dem engsten Bekanntenkreis eine wichtige Tätigkeit ist. Ein Item bezieht sich auf die präskriptive Norm, indem es abfragt, inwiefern Menschen, die einem nahe stehen, möchten, dass man freiwillig tätig ist.

Die Erfahrungsfunktion bezieht sich auf die Möglichkeit, dass Individuen aus intrinsischer Motivation, etwas dazulernen zu wollen, freiwillig tätig werden. Sie umfasst das Interesse daran, die Welt und andere Menschen besser zu verstehen, mehr über die eigene Person zu erfahren und Lernerfahrungen zu machen. Die Freiwilligenarbeit wird als Gelegenheit angesehen, um Wissen, Fähigkeiten und Fertigkeiten zu erwerben und anzuwenden. In den Items werden Lernerfahrungen aufgegriffen, die auf den Themenbereich selbst, den Umgang mit verschiedenen Menschen und die eigenen Stärken bezogen sind. Zudem wird mit Lernen durch praktische Erfahrung eine konkrete Art des Lernens thematisiert und die Möglichkeit genannt, durch die Freiwilligenarbeit eine neue Sichtweise auf Dinge zu gewinnen.

Bei der Wertefunktion geht es um die Möglichkeit, altruistische und humanistische Werte durch die Freiwilligenarbeit auszudrücken. Dies schließt auch ein, für eine bestimmte Sache, die einem persönlich wichtig ist, Fürsprache zu leisten (Clary et al., 1992). In den fünf Items wird zweimal Besorgnis um und einmal Mitgefühl für andere Menschen bzw. diejenigen, denen die Freiwilligenarbeit zugutekommt, thematisiert; außerdem die Wichtigkeit, anderen zu helfen, sowie die Möglichkeit, etwas für eine Sache zu tun, die einem persönlich wichtig ist.

Das englischsprachige Original wurde anhand einer sozial-karitativen Stichprobe entwickelt und validiert (Clary et al., 1998). Zur Validierung der deutschen Adaptation des VFI diente eine ähnliche Stichprobe (Oostlander et al., 2014).

Die psychometrischen Eigenschaften des VFI erweisen sich als mindestens zufriedenstellend: Die Reliabilitäten (Cronbachs Alpha) liegen für das Original-VFI zwischen .80 (Wertefunktion) und .89 (Karrierefunktion) (Clary et al., 1998). Auch die mittleren Werte, die sich in einem Review zahlreicher Studien, die das VFI verwendet haben, ergeben, entsprechen diesem Muster. Auch hier ergibt sich für die Wertefunktion mit .78 das niedrigste Alpha, während dieses für die weiteren Funktionen zwischen .82 und .84 liegt (Chacón et al., 2017). Die sechsfaktorielle Struktur bestätigt sich in unterschiedlichen Stichproben (Chacón et al., 2017). Gemäß Clary et al. (1992) korreliert keine der Funktionen mit einem expliziten Maß der sozialen Erwünschtheit. Dies bestätigt sich zwar in weiteren Studien (z. B. Chapman & Morley, 1999), wurde jedoch bisher nicht systematisch untersucht.

Die mittleren Ausprägungen der Skalen variieren abhängig von der Zusammensetzung der Stichprobe, wobei u. a. Alter, Geschlecht und Engagementbereich eine Rolle spielen (Chacón et al., 2017). Dennoch zeigen sich über Stichproben hinweg klare Muster: So ist die Werteskala nahezu immer am höchsten ausgeprägt, gefolgt von der Erfahrungs- und der Selbstwertfunktion (Chacón et al., 2017; Clary et al., 1998; Oostlander et al., 2014). Die Schutz- und Karrierefunktion sind durchschnittlich eher gering ausgeprägt (Chacón et al., 2017; Clary et al., 1998; Oostlander et al., 2014). Jüngeres Alter geht mit höheren Ausprägungen von Karriere- und Erfahrungsfunktion einher (Chacón et al., 2017).

Methode: Entwicklung und Validierung einer Kurzversion des VFI

Entwicklung der Kurzversion

Mit dem Ziel, eine ökonomische Messung der Funktionen freiwilligen Engagements zu gewährleisten, wurde ausgehend von der deutschen Adaptation des VFI (zur besseren Verständlichkeit nachfolgend als deutsch adaptierte Langversion bezeichnet) eine Kurzversion entwickelt. Um bei größtmöglicher Ökonomie dennoch die Güte der Skala erfassen und ihre faktorielle Struktur prüfen zu können, wurden zwei Items pro Skala ausgewählt. Für die Auswahl der Items wurden sowohl semantische als auch statistische Kriterien herangezogen: Zum ersten sollten die zwei Items die jeweilige Funktion möglichst in ihrer inhaltlichen Breite repräsentieren. Zum zweiten sollten die Items hohe Faktorladungen auf der entsprechenden Funktion und hohe Trennschärfen aufweisen und sich empirisch eindeutig der jeweiligen Funktion zuordnen lassen.

Hierfür wurden die Items des VFI in mehr als 20 Forschungsarbeiten, die am eigenen Institut entstanden sind, analysiert. In diesen waren Freiwillige aus den unterschiedlichsten Bereichen wie Sport, Kultur, Soziales, Elternarbeit, Umweltschutz, Politik und Bevölkerungsschutz befragt worden. Für jedes Item wurden in allen Studien Faktorladungen, Trennschärfe, Streuung und Mittelwert berechnet. Aufgrund dieser Werte, die in der Reihenfolge ihrer Nennung gewichtet wurden, wurde für jede Motivfunktion in jeder Studie eine Rangfolge der Items nach ihrer Güte gebildet. Die Items, die in der größten Zahl von Studien die höchste und zweithöchste Güte erreichten, wurden als statistisch beste Kandidaten ausgewählt. Im nächsten Schritt wurde auf semantischer Ebene kritisch überprüft, ob diese beiden Items den gesamten Inhalt der Skala repräsentierten. Im Zweifelsfall wurde dieses semantische Kriterium gegenüber den statistischen Kriterien inklusive der Homogenität der Kurzskalen höher gewichtet, um die Inhaltsvalidität der Messung zu gewährleisten (Cortina et al., 2020; Heggestad et al., 2019).

Dieses Verfahren wurde einer rein psychometrischen Auswahl der Items vorgezogen, um eine möglichst gute Eignung der Kurzversion für unterschiedlichste Stichproben zu erreichen. In einem gepoolten Datensatz hingegen wären Strukturen, die sich innerhalb der einzelnen Stichproben abgebildet haben, verloren gegangen.

Die Instruktion wurde unverändert von der deutsch adaptierten Langversion übernommen. Abweichend von dieser wurden die Antworten jedoch auf einer sechsstufigen statt auf einer fünfstufigen Likert-Skala von „überhaupt nicht wichtig“ bis „sehr wichtig“ erfasst. Da eine mittlere Kategorie sowohl zum Ausdruck eines mittleren Urteils als auch zur Enthaltung genutzt werden kann, wurde eine gerade Anzahl von Stufen bevorzugt.

Bei den Items zur sozialen Anpassungsfunktion wurden die verschiedenen Akteur_innen (Freunde, Bekanntenkreis, nahestehende Menschen) mit der Formulierung „mein Umfeld‟ zusammengefasst.

Vorgehen zur Validierung der Kurzversion

Die Validierung der Kurzversion erfolgte in drei Schritten anhand von vier Stichproben. Im ersten Schritt wurden die Reliabilität und Validität der Kurzversion mittels konfirmatorischer Faktorenanalyse anhand einer großen Stichprobe von Mitgliedern der freiwilligen Feuerwehr (N1 = 2 576) geprüft. Ein entscheidender Vorteil dieser Stichprobe liegt in ihrer Größe, die eine asymptotisch verteilungsfreie Schätzmethode (ADF) ermöglicht. Da es sich jedoch um eine sehr spezifische Stichprobe handelt, wurde die Prüfung im zweiten Schritt anhand einer zweiten, studentischen Stichprobe (N2 = 202) wiederholt; in dieser waren viele unterschiedliche Engagementbereiche (siehe Stichprobenbeschreibungen) vertreten. Zudem wurde die Äquivalenz des Messmodells über beide Stichproben hinweg mit Hilfe einer Mehrgruppenfaktorenanalyse überprüft. In einem dritten und letzten Schritt wurden die Zusammenhänge zwischen Lang- und Kurzversion analysiert. Hierzu wurde eine dritte Stichprobe (N3 = 573) herangezogen, die vorrangig Engagierte aus dem sozialen Bereich umfasste. Sie diente dazu, die deutsch adaptierte Kurzversion mit der deutsch adaptierten Langversion in Bezug zu setzen. Außerdem wurde eine vierte internationale Stichprobe (N4 = 101) auf Englisch befragt, um erste Anhaltspunkte hinsichtlich einer möglichen Eignung der Anwendung der Kurzversion auf die englische Originalversion zu gewinnen. Für diese Stichprobe wurde die englische Langversion mit einer englisch adaptierten Kurzversion verglichen, die der deutsch adaptierten Kurzversion entsprach.

Stichproben und Datenerhebung

Alle Datensätze sind zusammengefasst im elektronischen Supplement ESM 1 zu finden.

Stichprobe und Datensatz 1

Stichprobe 1 umfasste 2 576 freiwillige Feuerwehrleute, die mittels eines Online-Fragebogens befragt wurden. Der Anteil der weiblichen Teilnehmenden lag bei 6 % gegenüber 93 % männlichen Teilnehmenden (bei 1 % fehlenden Angaben). Das mittlere Alter betrug 37.51 Jahre (SD = 11.60). Die Befragten übten die Tätigkeit im Mittel seit 19.79 Jahren aus (SD = 11.12) und investierten durchschnittlich 27.12 Stunden im Monat (SD = 20.39). Dieser Stichprobe wurde die deutsch adaptierte Kurzversion des VFI entsprechend Tabelle 1 vorgelegt.

Stichprobe und Datensatz 2

Stichprobe 2 umfasste 202 freiwillig engagierte Studierende, die mittels eines Online-Fragebogens befragt wurden. Ein Anteil von 64 % der Teilnehmenden identifizierte sich als weiblich, 31 % als männlich und 0.5 % als divers (bei 5 % fehlenden Angaben). Das mittlere Alter betrug 23.71 Jahre (SD = 3.08). Die Befragten engagierten sich durchschnittlich während 22.89 Stunden im Monat (SD = 19.29) in diversen Bereichen: u. a. sozialer Bereich (39 %), Sport und Bewegung (9 %), kirchlicher Bereich (6 %), Umwelt- und Naturschutz (5 %) und kultureller Bereich (5 %). Diese Stichprobe bearbeitete die deutsch adaptierte Kurzversion des VFI (vgl. Tabelle 1). Die beiden Items der sozialen Anpassungsfunktion, die das persönliche Umfeld ansprechen, wurden zusätzlich in der Formulierung der deutsch adaptierten Langversion vorgelegt.

Stichprobe und Datensatz 3

Stichprobe 3 setzte sich aus 573 Personen zusammen, die ebenfalls überwiegend mittels eines Online-Fragebogens befragt wurden. Der Link hierzu wurde in der Allgemeinbevölkerung und über zwei große Freiwilligenorganisationen verbreitet. Über eine der beiden Freiwilligenorganisation wurde zusätzlich derselbe Fragenbogen in Papierform verteilt. Der Anteil der weiblichen Befragten lag bei 71 % gegenüber 25 % männlichen Befragten (bei 4 % fehlenden Angaben). Das mittlere Alter betrug 44.26 Jahre (SD = 19.90). Die Befragten übten ihre Freiwilligentätigkeit im Mittel seit 8.27 Jahren aus (SD = 8.49) und investierten durchschnittlich 19.11 Stunden im Monat (SD = 25.97). Das Engagement fand überwiegend im sozialen (46 %), humanitären (23 %) und kirchlichen (6 %) Bereich statt. In dieser Stichprobe wurde die deutsch adaptierte Langversion des VFI erfasst. Die soziale Anpassungsfunktion wurde hierbei aufgrund der Erfordernisse des Forschungsprojekts, in dem die Daten erhoben wurden, durch eine Variable zur Messung der sozialen Norm ersetzt.

Tabelle 1 Ergebnisse der Itemanalyse und Kriterien der lokalen Anpassungsgüte

Stichprobe und Datensatz 4

Stichprobe 4 bestand aus 101 Personen, die mittels eines Online- oder identischen Papier-Fragebogens befragt wurden. Der Fragebogen beziehungsweise der Link zu diesem wurde über eine gemeinnützige Organisation, die sich um benachteiligte Kinder in Afrika kümmert und internationale Freiwilligendienste anbietet, verteilt. Nur Personen, die angaben, zum Befragungszeitpunkt Freiwilligenarbeit in dieser Organisation zu leisten, wurden in die Stichprobe aufgenommen. Die überwiegend junge Stichprobe (M = 28.32 Jahre; SD = 10.06) umfasste vor allem Menschen mit deutscher (n = 44), US-amerikanischer (n = 24), südafrikanischer (n = 17) und anderer europäischer Nationalität (n = 9). Die Befragten waren im Mittel seit 3.60 (SD = 4.43) Jahren Mitglied der Freiwilligenorganisation und wendeten für ihre Freiwilligenarbeit durchschnittlich 58.14 (SD = 53.66) Stunden im Monat auf. Dieser hohe Zeiteinsatz ergibt sich dadurch, dass die Freiwilligenarbeit zum Teil in Form von Freiwilligendiensten in Voll- oder Teilzeit ausgeführt wurde. Die Befragung wurde in englischer Sprache durchgeführt, wobei die englische Langversion des VFI (Clary et al., 1998) zum Einsatz kam.

Analyse der Daten

Zur Überprüfung der Validität der Kurzversion wurden in einem ersten Schritt in den Datensätzen 1 und 2 die Itemkennwerte sowie – aufgrund ihrer Eignung für Zwei-Item-Skalen (Eisinga, te Grotenhuis & Pelzer, 2013) – die Spearman-Brown-Koeffizienten als Maß der Reliabilität für jede Skala berechnet. Die Faktorstruktur wurde mittels konfirmatorischer Faktorenanalysen mit AMOS 26 überprüft. Dabei kam in Datensatz 2 das Maximum-Likelihood-Verfahren zum Einsatz. Dieses setzt jedoch die multivariate Normalverteilung der Daten voraus (Browne, 1982), eine Voraussetzung, die in Datensatz 1 verletzt ist. Entsprechend wurde in Datensatz 1 das asymptotisch verteilungsfreie Schätzverfahren (ADF; Browne, 1984) eingesetzt. Die bei 12 Indikatoren und mäßiger Kurtosis erforderliche Mindeststichprobengröße von 1 200 bis 1 600 Personen (Boomsa & Hoogsland, 2001) ist gegeben. Für die Bewertung der Modellpassung wurden der Root Mean Square Error of Approximation (RMSEA, Cut-Off ≤ .06, Hu & Bentler, 1999) als inferenzstatistisches Gütekriterium, das Standardized Root Mean Square Residual (SRMR, Cut-Off ≤ .08, Hu & Bentler, 1999) als absolutes Fitmaß sowie der Comparative Fit Index (CFI, Cut-Off ≥ .95, Hu & Bentler, 1999) als inkrementelles Fitmaß herangezogen. Zudem wird die Irrtumswahrscheinlichkeit für die Nullhypothese, dass der RMSEA maximal 0.05 beträgt (PCLOSE), betrachtet. Liegt deren Wert unter 0.05, wird die Hypothese, dass der RMSEA für einen guten Fit spricht, abgelehnt.

Zusätzlich zum generellen Modellfit wurden Kriterien der lokalen Anpassungsgüte betrachtet. Zur Reliabilitätsprüfung wurden die Indikatorreliabilität ( Cut-Off ≥ 0.4; Bagozzi & Baumgartner, 1994), die Faktorreliabilität ( Cut-Off ≥ .60; Bagozzi & Yi, 1988) sowie die durchschnittlich extrahierte Varianz (DEV; Cut-Off ≥ .50; Fornell & Larcker, 1981) herangezogen. Die Faktorreliabilität dient zusätzlich der Prüfung der konvergenten Validität. Das Fornell-Larcker-Kriterium (FLK; Fornell & Larcker, 1981) wurde betrachtet, um die diskriminante Validität zu prüfen. Dabei wird die DEV eines Faktors mit den quadrierten Korrelationen zwischen diesem Faktor und den anderen Faktoren verglichen. Es kann von diskriminanter Validität ausgegangen werden, wenn die DEV jeweils größer ist als die quadrierten Korrelationen.

Da sich Stichprobe 1 und 2 in ihrer Zusammensetzung deutlich unterscheiden, wurde mittels einer Mehrgruppen-Faktorenanalyse zusätzlich die Messinvarianz der VFI-Kurzversion überprüft. Hierzu wurden neben dem unrestringierten Modell, in dem die Parameter in beiden Gruppen unabhängig voneinander geschätzt werden, drei weitere Modelle berechnet. In diesen wurden (1) die Höhe der Faktorladungen, (2) zusätzlich die Konstanten der Indikatoren und (3) zusätzlich die Messfehler zwischen den Gruppen gleichgesetzt. Für alle Modelle wurden RMSEA, CFI und SRMR berechnet.

Um den Zusammenhang zwischen den Skalen der Kurzversion und den Originalskalen zu untersuchen, wurden in den Datensätzen 3 und 4 jeweils entsprechende Korrelationen berechnet. Hierzu wurden jeweils sowohl die fünf Items umfassenden Skalen als auch die jeweils zwei Items umfassenden Skalen gebildet und miteinander korreliert. In Datensatz 2 wurden zudem Korrelationen zwischen den beiden verschiedenen Versionen der sozialen Anpassungsfunktion berechnet.

Ergebnisse

Itemanalysen

Eine Übersicht über die Mittelwerte, Standardabweichungen und Itemschwierigkeiten ( der Items der Kurzversion bietet Tabelle 1.

Die Reliabilitäten in Datensatz 1 (.71 ≤ ρy1y2 ≤ .89) sind größtenteils sehr gut, mindestens jedoch zufriedenstellend. Mit Ausnahme der Wertefunktion (deutsch adaptierte Kurzversion: ρy1y2 = .71; deutsch adaptierte Langversion: α = .78 liegen die Spearman-Brown-Koeffizienten der Kurzversion sehr nahe an den Werten für Cronbachs Alpha in der deutsch adaptierten Langversion. In Datensatz 2 reichen sie von sehr guten Werten für die Karriere- und Selbstwertfunktion (ρy1y2 = .90 und bis zu Werten für die Schutz- und Erfahrungsfunktion (ρy1y2 = .65 und ., die die Grenze von .70 unterschreiten und somit deutlich niedriger als in Datensatz 1 sind.

In Datensatz 1 umfassten, wie auch in der deutsch adaptierten Langversion, die Schutz- und Karrierefunktion die schwierigsten Items (.34 ≤ pm ≤ .36). In Datensatz 2 galt dies für die Schutz- und die soziale Anpassungsfunktion (.39 ≤ pm ≤ .49). Die Erfahrungs- und Wertefunktion enthielten in Übereinstimmung mit vorherigen Studien (Chacón et al., 2017; Oostlander et al., 2014) jeweils die leichtesten Items (.65 ≤ pm ≤ .89). Die unterschiedlichen Formulierungen der Items der sozialen Anpassungsfunktion wirkten sich kaum auf die Itemschwierigkeit aus. Die Korrelationen zwischen den einzelnen Funktionen sind niedrig bis moderat (.02 ≤ |r| ≤ .47; siehe Tabelle 2). Die unterschiedlich formulierten sozialen Anpassungsfunktionen korrelieren erwartungsgemäß hoch (r = .83) und unterscheiden sich untereinander kaum hinsichtlich ihrer Korrelationen mit den anderen Funktionen.

Tabelle 2 Interkorrelationen der aggregierten Skalen der Funktionen der Kurzversion

Modellfit und Messinvarianz

Analog zum Vorgehen bei Oostlander et al. (2014) wurde ein Sechs-Faktoren-Modell mit unkorrelierten Fehlertermen überprüft (vgl. ESM 2). Es wurden sechs latente untereinander korrelierte Faktoren festgelegt, auf denen jeweils nur die beiden entsprechenden Items luden. Dies entspricht auch dem multidimensionalen Modell der Motivation von Freiwilligenarbeit von Clary et al. (1998). Dieses Modell konnte für die Kurzversion bestätigt werden: In Datensatz 1 ergeben sich sehr gute Kennwerte (SRMR = .020, RMSEA = .033, CFI = .975; vgl. Tabelle 3). Das signifikante χ2 ist angesichts der Stichprobengröße wenig aussagekräftig (Bentler & Bonnet, 1980). In Datensatz 2 mit der veränderten sozialen Anpassungsfunktion, die auch in der Befragung von Stichprobe 1 verwendet wurde, sprechen ebenfalls alle Kennwerte für eine gute Modellpassung (SRMR = .051, RMSEA = .043, CFI = .984; vgl. Tabelle 3). In diesem Fall ist nicht signifikant. Beim Modell, für das die beiden Items der sozialen Anpassungsfunktion in Originalformulierung aufgenommen wurden, sprechen SRMR und CFI mit Werten von .054 und .966 für eine gute, der RMSEA mit .062 jedoch lediglich für eine akzeptable Passung. Die schlechten Modellfits für ein einfaktorielles sowie vierfaktorielles Modell (vgl. Tabelle 3) unterstreichen, dass es keine plausiblen Modelle mit besserer Passung gibt.

Tabelle 3 Modellfit unterschiedlicher Modelle

Die Überprüfung der Messinvarianz des Modells zwischen den Stichproben 1 und 2 mittels Mehrgruppenfaktorenanalyse bestätigt, dass mindestens skalare Invarianz vorliegt, denn SRMR, CFI und RMSEA unterscheiden sich zwischen den Modellen 0, 1 und 2 um maximal 0.005 (vgl. Tabelle 4). Die Unterschiede zwischen dem unrestringierten Modell und Modell 3 sind etwas größer. Die Kennwerte deuten jedoch auch für Modell 3 auf eine sehr gute Modellpassung hin (SRMR = .020, RMSEA = .032, CFI = .978; vgl. Tabelle 4), was für das Vorliegen strikter faktorieller Invarianz spricht (Steenkamp & Baumgartner, 1998). Das bedeutet, dass die Messung unabhängig von der Stichprobe auf die gleiche Weise und mit derselben Güte erfolgt.

Tabelle 4 Überprüfung der Messinvarianz für Stichprobe 1 und Stichprobe 2

Kriterien der lokalen Anpassungsgüte

Auch die Kriterien der lokalen Anpassungsgüte deuten auf eine hohe Güte der VFI-Kurzversion hin (siehe Tabelle 1). Die Indikatorreliabilität lag in Datensatz 1 in allen Fällen über .40, überwiegend sogar deutlich höher. In Datensatz 2 wiesen lediglich das zweite Item der Schutzfunktion (ρi = .37) und das erste Item der Erfahrungsfunktion (ρi = .25) eine geringe, aber noch akzeptable Indikatorreliabilität auf (Balderjahn, 1986). Die Faktorreliabilitäten der Skalen liegen zwischen ρc = .71 und ρc = .90 und somit durchgehend über dem Richtwert. Dies gilt auch für die DEV (.56 ≤ DEV ≤ .82), deren Werte zudem über jenen der deutsch adaptierten Langversion liegen. Diese Befunde sprechen für eine angemessene Reliabilität und konvergente Validität. Das Fornell-Larcker-Kriterium ist durchgängig erfüllt, was auf ausreichende diskriminante Validität hinweist.

Zusammenhänge zwischen Kurz- und Langversion

Die Skalen der deutsch bzw. englisch adaptierten Kurzversion korrelieren überwiegend sehr hoch mit den Skalen der deutsch adaptierten Langversion (Datensatz 3) bzw. mit der englischsprachigen Langversion (Datensatz 4): Sehr hohe Zusammenhänge ergeben sich in beiden Datensätzen für die Karriere-‍, die Selbstwert- sowie die Schutzfunktion (.92 ≤ r ≤ .95). Für die soziale Anpassungsfunktion liegt nur in Datensatz 4 eine Korrelation vor, die mit r = .94 ebenfalls sehr hoch ist. Hierbei handelt es sich um die soziale Anpassungsfunktion in der englischsprachigen Originalformulierung. Für die Erfahrungsfunktion und die Wertefunktion ergeben sich je nach Stichprobe mittlere oder hohe Korrelationen. Während in Datensatz 3 die beiden Skalen der Erfahrungsfunktion mit r = .87 korrelieren, sind es in Datensatz 4 lediglich r = .71. Für die beiden Skalen der Wertefunktion ergeben sich Korrelationen von r = .56 (Datensatz 3) bzw. von r = .83 (Datensatz 4). Diese Befunde sprechen für eine hohe konvergente Validität. In jedem Fall liegen die Korrelationen zwischen der jeweiligen Funktion in der Lang- und in der zugehörigen Kurzversion deutlich über den anderen Korrelationen zwischen Kurz- und Langskalen, was die diskriminante Validität untermauert. Dies gilt insbesondere auch im Fall der Wertefunktion in Datensatz 3, wo die Korrelationen zu den anderen Langskalen maximal r = .24 erreichen. Eine detaillierte Übersicht bietet Tabelle 5. Um mögliche Verzerrungen durch die Überschneidung zwischen Kurz- und Langversion um zwei Items abschätzen zu können, werden in Tabelle 5 zudem die Korrelationen zwischen der Kurzversion und den jeweils aus den übrigen drei Items gebildeten „Restskalen“ berichtet. Die Zusammenhänge mit der jeweiligen Restskala sind erwartungsgemäß durchgängig niedriger als mit der jeweiligen Langskala, jedoch, mit einer Ausnahme bei der Erfahrungsfunktion in Datensatz 4, höher als mit den anderen Restskalen.

Tabelle 5 Korrelationen zwischen den Skalen der Kurzversion des VFI (deutsch adaptiert in Datensatz 3; englisch adaptiert in Datensatz 4) und den aus fünf Items bestehenden Skalen der deutschen Adaptation in Datensatz 3 und den englischen Langskalen in Datensatz 4 (lang) bzw. den aus den drei für die Kurzversion jeweils nicht verwendeten Items gebildeten Skalen (Rest) in den Datensätzen 3 und 4

Diskussion

Das Ziel der vorliegenden Studie war die Entwicklung und Validierung einer deutschsprachigen Kurzversion des VFI. Die Itemanalysen, die Faktorenstruktur, die Kriterien der lokalen Anpassungsgüte und die Korrelationen zwischen Kurz- und Langversion sprechen für eine hohe Reliabilität und Validität der Kurzversion. Die Kurzversion eignet sich somit gut zur ökonomischen Messung der Funktionen von Freiwilligenarbeit. Die Befunde aus Datensatz 4 deuten zusätzlich darauf hin, dass sich die Auswahl der Items für die Kurzversion auch auf das englischsprachige VFI übertragen lässt.

Das Vorgehen und die Befunde werfen einige Diskussionspunkte auf bezüglich der Itemauswahl, der psychometrischen Eigenschaften und der verwendeten Datensätze.

Bei der Itemauswahl für die Erfahrungs-‍, Werte- und Schutzfunktion musste mehr als bei den anderen Funktionen zwischen hoher interner Konsistenz sowie hohen Zusammenhängen zur Langversion einerseits und einer inhaltsvaliden Repräsentation des Konstrukts andererseits abgewogen werden. So wird bei der Erfahrungsfunktion in der Langversion in vier Items das Lernen thematisiert, während sich ein Item auf die Möglichkeit bezieht, durch die Freiwilligenarbeit andere Perspektiven zu gewinnen. Bei der Wertefunktion steht vier Items, die Sorge, Mitgefühl und Hilfe für andere Menschen erfassen, ein Item gegenüber, in dem es um eine „Sache“ geht. Bei der Schutzfunktion schließlich beschreiben vier Items emotionsorientierte und ein Item problemorientierte Bewältigungsstrategien. Jeweils zwei Items aus den je vier ähnlichen auszuwählen, hätte höhere interne Konsistenzen und Zusammenhänge zur Langversion versprochen. Um zu gewährleisten, dass das gesamte Konstrukt abgebildet wird, wurde jedoch jeweils eines der sich stärker unterscheidenden Items in die Kurzversion aufgenommen. Bei der Wertefunktion wurde zudem darauf geachtet, dass die Items auch für Freiwilligenarbeit ohne einen direkten Bezug zu Menschen beantwortet werden können. Die vergleichsweise niedrigeren Zusammenhänge zwischen Kurz- und Langversion für die Erfahrungs- und Wertefunktion müssen somit vor diesem Hintergrund eingeordnet werden. Dass der Zusammenhang für die Wertefunktion in der überwiegend sozial-karitativen Stichprobe 3 besonders gering ist, spiegelt wider, dass in diesem Fall der Einsatz für eine Sache und Sorge, Mitgefühl und Hilfe für Menschen relativ unterschiedlich gewichtet werden. Es steht auch in Einklang mit den Befunden von Oostlander et al. (2014), wo sich die Indikatorreliabilität des sachbezogenen Werteitems deutlich von jener der anderen unterscheidet. Gewichtet man das sachbezogene Item eins zu eins zu den übrigen, erhöht sich der Zusammenhang zwischen Kurz- und Langversion in Datensatz 3 auf r = .87. Dies sollte bei möglichen Vergleichen zwischen Befunden, die auf der Lang- bzw. der Kurzversion der Wertefunktion beruhen, berücksichtigt werden, insbesondere in sozial-karitativen Stichproben.

Die geringeren Reliabilitäten der Werte-‍, Schutz- und Erfahrungsfunktion dürften mindestens zum Teil ebenfalls der an der Inhaltsvalidität orientierten Itemauswahl geschuldet sein, was eine grundsätzliche Schwierigkeit bei der Abwägung zwischen Inhaltsvalidität und Reliabilität spiegelt (vgl. Cortina et al., 2020; Heggestad et al., 2019). Dass die Reliabilitäten von Schutz- bzw. Erfahrungsfunktion in Datensatz 2 besonders niedrig sind, deutet darauf hin, dass diese Skalen in Stichprobe 2 auf individueller Ebene besonders differenziert und damit wenig homogen wahrgenommen wurden. Dies könnte durch den sehr hohen Bildungsstand, den Befragungszeitraum während der Pandemie, als Bewältigungsstrategien besonders salient waren, oder durch das junge Alter der Stichprobe, das mit einer hohen Bedeutung der Erfahrungsfunktion einhergeht (Oostlander et al., 2014), erklärt werden. Diese geringe Homogenität spiegelt sich auch darin wider, dass in Datensatz 2 die beiden Items der Schutz- und Erfahrungsfunktion, die sich jeweils am stärksten von den anderen vier der Langversion unterscheiden, eine niedrige Indikatorreliabilität aufweisen. Wird im Strukturgleichungsmodell hier jeweils auf die gleiche Faktorladung restringiert, ergeben sich bei einer noch akzeptablen Modellpassung (CFI = .953; RMSEA = .072; SRMR = .060) Indikatorreliabilitäten zwischen .44 und .56.

Wie problematisch geringe Reliabilität ist, hängt letztlich vom Ziel ab, das mit der Messung verfolgt wird: Während sie für Fragestellungen, die eher orientierenden Charakter haben, ausreichend sein kann, sollten Alternativen erwogen werden, wenn es um Entscheidungen von größerer Tragweite geht (Cho & Kim, 2015). Bei spezifischem Erkenntnisinteresse kann es angezeigt sein, die Langversion zu verwenden.

Trotz der genannten Abstriche, was die Güte der Kurzskalen in Datensatz 2 betrifft, ist die nachgewiesene Messinvarianz des Instruments bemerkenswert.

Die Formulierung der Items der sozialen Anpassungsfunktion wurde für die Kurzversion als einzige verändert, um die verschiedenen in den ursprünglichen Items genannten Personen zusammenzufassen. Folglich stellt sich für diese Items ganz besonders die Frage, wie sie sich empirisch bewährt haben. Die umformulierten Items und die daraus gebildete Skala weisen durchgängig gute Kennwerte auf. In Datensatz 2 sind Modellpassung und Reliabilität für diese sogar besser. Gleichzeitig unterscheiden sich die beiden Skalenvarianten nicht bedeutsam in Mittelwert und Streuung und weisen mit r = .83 einen hohen Zusammenhang auf. Führt man für diesen Zusammenhang eine Minderungskorrektur anhand der niedrigeren Reliabilität der beiden Skalen durch, so entspricht dies mit r = .95 einem sehr hohen Zusammenhang. Im Rahmen dieser Studie lag kein Datensatz vor, in dem der Zusammenhang zwischen der umformulierten sozialen Anpassungsfunktion in Kurzversion und der Langversion dieser Skala hätte berechnet werden können. Der hohe Zusammenhang zwischen den beiden Formulierungen der Kurzversion in Datensatz 2 sowie die hohen Zusammenhänge zwischen der Langversion und der Kurzversion mit den Originalitems in Datensatz 4 sprechen jedoch dafür, dass auch die Kurzversion mit den veränderten Items die ursprüngliche Skala der sozialen Anpassungsfunktion gut repräsentiert.

Für die Studie wurden insgesamt vier Datensätze herangezogen, um zum ersten die Stabilität des Instruments und zum zweiten die Zusammenhänge mit der deutsch adaptierten Langversion für verschiedene Stichproben zu zeigen. Dabei konnten Vorteile der einzelnen Datensätze genutzt und Nachteile ausgeglichen und insgesamt eine hohe Validität bestätigt werden. So liegt die Stärke von Datensatz 1 in seiner Größe, die auch eine verteilungsfreie Schätzung der konfirmatorischen Faktorenanalyse erlaubt. Die Einschränkungen der zugrundeliegenden Stichprobe 1 (ein Engagementbereich, geringer Frauenanteil) wurden durch Stichprobe 2 mit einem geringeren Alter, hohem Frauenanteil und heterogenen Engagementbereichen kompensiert. Dass sich für beide Stichproben eine äquivalente Messung zeigt, spricht für eine hohe Validität des Instruments. Damit die Faktorenstruktur der Items der Kurzversion nicht durch die Darbietung der jeweils anderen Items verzerrt wird, wurden in den Stichproben 1 und 2 neben den Items der Kurzversion keine weiteren Items des VFIs abgefragt. Die Zusammenhänge zwischen Lang- und Kurzversion mussten daher anhand zweier weiterer Datensätze überprüft werden, in denen die Langversion zum Einsatz gekommen war. Auch hier wurden zwei Datensätze ausgewählt, um Schwächen der einzelnen Datensätze kompensieren zu können. Datensatz 3 basiert auf einer großen Stichprobe, die jener, mit der die deutsch adaptierte Langversion des VFI validiert wurde, recht nahekommt. Durch die Größe der Stichprobe konnte die Faktorenstruktur der Kurzversion mittels konfirmatorischer Faktorenanalyse überprüft werden. Allerdings wurde in dieser Stichprobe die soziale Anpassungsfunktion nicht erfasst und durch eine soziale Norm ersetzt. Ersetzt man auch in der Kurzversion die soziale Anpassungsfunktion durch zwei soziale Norm Items, ergibt sich für das sechsfaktorielle Modell ein guter Fit (SRMR = .035, RMSEA = .048, PCLOSE = .591, CFI = .973), ohne die Norm Items weist ein entsprechendes fünffaktorielles Modell eine gute Passung auf (SRMR = .033, RMSEA = .052, PCLOSE = .408, CFI = .978). Die geringe Größe von Datensatz 4 ermöglicht keine Überprüfung der Struktur mittels konfirmatorischer Faktorenanalysen. Dafür wurden in diesem alle 30 Items des VFI erfasst, so dass für jede Funktion die Zusammenhänge zwischen Kurz- und Langversion berechnet werden können. Eine Besonderheit liegt darin, dass in Stichprobe 4 die englische Langversion des VFI verwendet wurde. Während die Aussagekraft der entsprechenden Befunde für die vorliegende deutsch adaptierte Kurzversion dadurch etwas eingeschränkt wird, geben die Befunde erste Anhaltspunkte dafür, dass sich die Kurzversion auch auf die englischsprachige Fassung des VFI übertragen ließe. Für die Zukunft lohnt es sich, zu untersuchen, inwiefern eine noch sparsamere Lösung mit nur einem Item möglich ist (vgl. Matthews, Pineault & Hong, 2022). Eine erste Exploration zu dieser Frage findet sich in ESM 3. Sie deutet daraufhin, dass eine Messung mit einem Item für die Karriere-‍, die Selbstwert-‍, die Schutz- und die soziale Anpassungsfunktion gut möglich sein dürfte. Bei der Erfahrungsfunktion erweist sich nur ein Item als geeigneter Kandidat für eine Ein-Item-Fassung. Sowohl inhaltliche Aspekte als auch die Ergebnisse der explorativen Analysen stehen einer Messung der Wertefunktion mit nur einem der bestehenden Items entgegen.

In der Gesamtschau sprechen die Ergebnisse dafür, dass mit der deutschen VFI-Kurzversion ein reliables und valides Messinstrument vorliegt, das in Fällen, die eine besonders ökonomische Messung erfordern, einen adäquaten Ersatz für die 30 Items umfassende deutsch adaptierte Langversion darstellt. Dies ermöglicht es, das VFI leichter in Studien einzubinden. Erkenntnisse, die dabei zum Messinstrument gewonnen werden, können wiederum für eine weitere Validierung der Kurzversion herangezogen werden. Darüber hinaus kann die Kurzversion auch in der Praxis der Freiwilligenarbeit von Nutzen sein. Eine relevante praktische Anwendung ist der Einsatz der Kurzversion als Screening-Instrument. Als solches können Freiwilligenorganisationen es nutzen, um die Passung zwischen den Motiven der Engagierten und den Möglichkeiten der Freiwilligenarbeit zu verbessern, um so langfristige Zufriedenheit mit dem Engagement und dessen Fortführung zu fördern.

Elektronische Supplemente (ESM)

Die elektronischen Supplemente sind mit der Online-Version dieses Artikels verfügbar unter https://doi.org/10.1026/0012-1924/a000328

Literatur

  • Alscher, M., Priller, E. & Burkhardt, L. (2021). Zivilgesellschaftliches Engagement. In Statistisches Bundesamt, Wissenschaftszentrum Berlin für Sozialforschung & Bundesinstitut für Bevölkerungsforschung (Hrsg.), Datenreport 2021. Ein Sozialbericht für die Bundesrepublik Deutschland (S. 399 – 407). Bonn: Bundeszentrale für politische Bildung. First citation in articleGoogle Scholar

  • Bagozzi, R. P. & Baumgartner, H. (1994). The evaluation of structural equation models and hypotheses testing. In R. P. Bagozzi (Ed.), Principles of marketing research (pp. 386 – 422). Cambridge: Blackwell. First citation in articleGoogle Scholar

  • Bagozzi, R. P. & Yi, Y. (1988). On the evaluation of structural equation models. Journal of the Academy of Marketing Science, 16, 74 – 94. https://doi.org/10.1007/BF02723327 First citation in articleCrossrefGoogle Scholar

  • Balderjahn, I. (1986). Das umweltbewusste Konsumentenverhalten: Eine empirische Studie. Berlin: Duncker & Humblot. First citation in articleCrossrefGoogle Scholar

  • Bentler, P. M. & Bonnet, D. G. (1980). Significance tests and goodness of fit in the analysis of covariance structures. Psychological Bulletin, 88, 588 – 606. https://doi.org/10.1037/0033-2909.88.3.588 First citation in articleCrossrefGoogle Scholar

  • Boomsa, A. & Hoogland, J. J. (2001). The robustness of LISREL modeling revisited. In R. CudeckS. du ToitD. Sörbom (Eds.), Structural equation models: Present and future. A Festschrift in honor of Karl Jöreskog (pp. 139 – 168). Lincolnwood: Scientific Software International. First citation in articleGoogle Scholar

  • Browne, M. W. (1982). Covariance structures. In D. M. Hawkins (Ed.), Topics in applied multivariate analysis (pp. 72 – 141). Cambridge: Cambridge University Press. First citation in articleGoogle Scholar

  • Browne, M. W. (1984). Asymptotically distribution-free methods for the analysis of covariance structures. British Journal of Mathematical and Statistical Psychology, 7, 1, 62 – 83. https://doi.org/10.1111/j.2044-8317.1984.tb00789.x First citation in articleCrossrefGoogle Scholar

  • Cho, E. & Kim, S. (2015). Cronbach’s coefficient alpha: Well known but poorly understood. Organizational Research Methods, 18 (2), 207 – 230. https://doi.org/10.1177/1094428114555994 First citation in articleCrossrefGoogle Scholar

  • Clary, E. G., Snyder, M. & Ridge, R. D. (1992). Volunteers’ motivations: A functional strategy for the recruitment, placement, and retention of volunteers. Nonprofit Management and Leadership, 2, 333 – 350. https://doi.org/10.1002/nml.4130020403 First citation in articleCrossrefGoogle Scholar

  • Clary, E. G., Snyder, M., Ridge, R. D., Copeland, J., Stukas, A. A., Haugen, J. & Miene, P. (1998). Understanding and assessing the motivations of volunteers: A functional approach. Journal of Personality and Social Psychology, 74, 1516 – 1530. https://doi.org/10.1037/0022-3514.74.6.1516 First citation in articleCrossrefGoogle Scholar

  • Chacón, F. & Dávila, M. C. (2005). Adaptación del inventario de funciones del voluntariado al voluntariado español. Iberpsicología: Revista Electrónica de la Federación Española de Asociaciones de Psicología, 10 (1), 2. First citation in articleGoogle Scholar

  • Chacón, F., Gutiérrez, G., Sauto, V., Vecina, M. L. & Pérez, A. (2017). Volunteer Functions Inventory: A systematic review. Psicothema, 29 (3), 306 – 316. https://doi.org/10.7334/psicothema2016.371 First citation in articleCrossrefGoogle Scholar

  • Chapman, J. G. & Morley, R. (1999). Collegiate service-learning: Motives underlying volunteerism and satisfaction with volunteer service. Journal of Prevention & Intervention in the Community, 18, 19 – 33. https://doi.org/10.1300/J005v18n01_03 First citation in articleCrossrefGoogle Scholar

  • Cortina, J. M., Sheng, Z., Keener, S. K., Keeler, K. R., Grubb, L. K., Schmitt, N., Tonidandel, S., Summerville, K. M., Heggestad, E. D. & Banks, G. C. (2020). From alpha to omega and beyond! A look at the past, present, and (possible) future of psychometric soundness in the journal of applied psychology. Journal of Applied Psychology, 105 (12), 1351 – 1381. https://doi.org/10.1037/apl0000815 First citation in articleCrossrefGoogle Scholar

  • Eisinga, R., te Grotenhuis, M. & Pelzer, B. (2013). The reliability of a two-item scale: Pearson, Cronbach, or Spearman-Brown? International Journal of Public Health, 58, 637 – 642. https://doi.org/10.1007/s00038-012-0416-3 First citation in articleCrossrefGoogle Scholar

  • Fornell, C. & Larcker, D. F. (1981). Evaluating structural equation models with unobservable variables and measurement error. Journal of Marketing Research, 18, 39 – 50. https://doi.org/10.1177/002224378101800104 First citation in articleCrossrefGoogle Scholar

  • Gage, R. L. & Thapa, B. (2012). Volunteer motivations and constraints among college students: Analysis of the volunteer function inventory and leisure constraints models. Nonprofit and Voluntary Sector Quarterly, 41 (3), 405 – 430. https://doi.org/10.1177/0899764011406738 First citation in articleCrossrefGoogle Scholar

  • Güntert, S. T., Neufeind, M. & Wehner, T. (2015). Motives for event volunteering: Extending the functional approach. Nonprofit and Voluntary Sector Quarterly, 44 (4), 686 – 707. https://doi.org/10.1177/0899764014527797 First citation in articleCrossrefGoogle Scholar

  • Heggestad, E. D., Scheaf, D. J., Banks, G. C., Monroe Hausfeld, M., Tonidandel, S. & Williams, E. B. (2019). Scale adaptation in organizational science research: A review and best-practice recommendations. Journal of Management, 45 (6), 2596 – 2627. https://doi.org/10.1177/0149206319850280 First citation in articleCrossrefGoogle Scholar

  • Hu, L. & Bentler, P. (1999). Cutoff criteria for fit indexes in covariance structure analysis: Conventional criteria versus new alternatives. Structural Equation Modeling: A Multidisciplinary Journal, 6, 1 – 55. https://doi.org/10.1080/10705519909540118 First citation in articleCrossrefGoogle Scholar

  • Kals, E. & Strubel, I. T. (2017). Volunteering to support refugees: A question of one‘s scope of justice. Refuge, 33 (2), 66 – 77. https://doi.org/10.7202/1043064ar First citation in articleCrossrefGoogle Scholar

  • Katz, D. (1960). The functional approach to the study of attitudes. Public Opinion Quarterly, 24, 163 – 204. https://doi.org/10.1086/266945 First citation in articleCrossrefGoogle Scholar

  • Matthews, R. A., Pineault, L. & Hong, Y.-H. (2022). Normalizing the use of single-item measures: Validation of the single-item compendium for organizational psychology. Journal of Business and Psychology, 37, 639 – 673. https://doi.org/10.1007/s10869-022-09813-3 First citation in articleCrossrefGoogle Scholar

  • Oostlander, J., Güntert, S. T, van Schie, S. & Wehner, T. (2014). Volunteer Functions Inventory (VFI): Konstruktvalidität und psychometrische Eigenschaften der deutschen Adaptation. Diagnostica, 60, 73 – 85. https://doi.org/10.1026/0012-1924/a000098 First citation in articleLinkGoogle Scholar

  • Simonson, J., Kelle, N., Kausmann, C. & Tesch-Römer, C. (2022). Einleitung: Zwanzig Jahre Deutscher Freiwilligensurvey. In J. SimonsonN. KelleC. KausmannC. Tesch-Römer (Hrsg.), Freiwilliges Engagement in Deutschland: Empirische Studien zum bürgerschaftlichen Engagement (S. 11 – 23). Wiesbaden: Springer. https://doi.org/10.1007/978-3-658-35317-9_2 First citation in articleCrossrefGoogle Scholar

  • Steenkamp, J. B. & Baumgartner, H. (1998). Assessing measurement invariance in cross-national consumer research. Journal of Consumer Research, 25, 78 – 90. https://doi.org/10.1086/209528 First citation in articleCrossrefGoogle Scholar

  • Smith, M., Bruner, J. & White, R. (1956). Opinions and personality. New York: Wiley. First citation in articleGoogle Scholar

  • Wehner, T., Güntert, S. T., Neufeind, M. & Mieg, H. A. (2015). Frei-gemeinnützige Tätigkeit: Freiwilligenarbeit als Forschungs- und Gestaltungsfeld der Arbeits- und Organisationspsychologie. In T. WehnerS. T. Güntert (Hrsg.), Psychologie der Freiwilligenarbeit. Motivation, Gestaltung und Organisation (S. 3 – 22). Berlin: Springer. First citation in articleGoogle Scholar

  • Wilson, J. (2000). Volunteering. Annual Review of Sociology, 26, 215 – 240. https://doi.org/10.1146/annurev.soc.26.1.215 First citation in articleCrossrefGoogle Scholar

  • Wu, J., Wing Lo, T. & Liu, E. S. (2009). Psychometric properties of the volunteer functions inventory with Chinese students. Journal of Community Psychology, 37 (6), 769 – 780. https://doi.org/10.1002/ jcop.20330 First citation in articleCrossrefGoogle Scholar