Skip to main content
Free AccessPositionspapier

Die Beziehung zwischen sprachlicher und nicht-sprachlicher Kognition

Die Bedeutung von Repräsentationsformaten

Published Online:https://doi.org/10.1026/0033-3042/a000354

Abstract

Zusammenfassung. Die Beziehung zwischen sprachlicher und nicht-sprachlicher Kognition ist wenig verstanden. In der Vergangenheit wurden einige Arbeiten veröffentlicht, deren Ergebnisse in der Regel so interpretiert wurden, dass die sprachliche Kognition kaum oder gar nicht die nicht-sprachliche Kognition beeinflusst. Dies hat unseres Erachtens in der Vergangenheit dazu geführt, dass sprachliche und nicht-sprachliche Kognition eher separat beforscht wurden und zu der Vorstellung beigetragen, dass Sprache ein eigenständiges Modul innerhalb des kognitiven Systems besitzt, das funktional unabhängig von nicht-sprachlichen Prozessen ist. In jüngerer Zeit werden diese beiden Bereiche der Kognition im Rahmen des Grounded-Cognition-Ansatzes zusammengeführt, wobei allerdings linguistische Gesichtspunkte unberücksichtigt bleiben (z. B. die kompositionale Struktur sprachlicher Bedeutung). Daher sind die theoretischen Grenzen dieses Ansatzes als umfassendes Modell des menschlichen Sprachverstehens schon jetzt erkennbar. Nicht ganz unabhängig davon, erlebt die Forschung über das Verhältnis von Sprache und Denken in den letzten Jahren eine Wiederbelebung, die im Gegensatz zum Grounded-Cognition-Ansatz eher für die Vorstellung einer funktionalen Trennung von sprachlicher und nicht-sprachlicher Kognition spricht. Wir vertreten hier die These, dass das Verhältnis von sprachlicher und nicht-sprachlicher Kognition stark davon abhängt, welche Repräsentationsformen die beiden Bereiche involvieren. Wir diskutieren dabei zwei Sichtweisen (eine Zwei-Format-Sichtweise und eine Ein-Format-Sichtweise) und analysieren deren Implikationen für das theoretische Verständnis über den Zusammenhang von und sprachlicher und nicht-sprachlicher Kognition. Wir verdeutlichen diese Konzepte anhand aktueller Forschungsergebnisse. Unserer Meinung nach generiert die Ein–Format-Hypothese derzeit mehr Fragen als sie beantwortet. Im Gegensatz dazu erscheint uns die Zwei-Format-Hypothese als Forschungsansatz für die Kognitionspsychologie vielversprechender.

The Relationship Between Linguistic and Nonlinguistic Cognition: The Meaning of Representational Formats

Abstract. The relationship between linguistic and nonlinguistic cognition is poorly understood. Nevertheless, results of previous research on this relationship led to the view that linguistic cognition has no or only minor effects on nonlinguistic cognition. We believe this view promoted the notion that linguistic and nonlinguistic cognition can be independently investigated and, moreover, that language resides in a functionally specialized module within the cognitive system. In recent years, the two domains of linguistic and nonlinguistic cognition have been brought together within the framework of grounded cognition. This framework, however, ignores basic linguistic principles such as the principle of compositionality of meaning. Therefore, the theoretical limits of this framework can be anticipated. Independently, to some extent, from research in grounded cognition, research on language and thought is enjoying a renaissance, which in contrast to grounded cognition is reviving the notion that linguistic and nonlinguistic cognition are functionally independent. In this paper we propose that the relationship between the two domains of cognition strongly depends on the representational formats involved in these two domains. We describe two possible views (the two-format view and the one-format view) and discuss the theoretical implications of these views for achieving a better understanding of the relationship between linguistic and nonlinguistic cognition. We illustrate these concepts by means of current research results. We believe that the one-format view raises more questions than it can answer. Conversely, the two-format view seems to offer a promising research approach for cognitive psychology.

Die Beziehung zwischen sprachlicher und nicht-sprachlicher Kognition ist komplex und somit auch wenig verstanden. Historisch hat man sich vornehmlich mit dem möglichen Einfluss sprachlicher Kognition auf nicht-sprachliche Prozesse wie etwa auf die Wahrnehmung beschäftigt (Whorf’sche Hypothese, siehe unten). Da sich ein solcher Einfluss empirisch jedoch nicht nachweisen ließ, entstand zunächst die Sichtweise, dass sprachliche Kognition isoliert von anderen kognitiven Prozessen betrachtet werden muss und so eher als Teilbereich der Linguistik zu sehen ist. Im Gegensatz dazu nimmt in jüngster Zeit eine radikal andere Sichtweise (Embodied-Cognition Ansatz) an, dass sprachliche Prozesse auf nicht-sprachlichen Prozessen basieren und daher nicht isoliert von nicht-sprachlichen Prozessen analysiert werden können. Im Zuge dieser Umorientierung schenkt man inzwischen auch wieder der Vorstellung Aufmerksamkeit, dass die sprachliche Kognition einen Einfluss auf die nicht-sprachliche Kognition haben könnte (Neo-Whorf’scher Ansatz). Sowohl der Embodied-Cognition Ansatz als auch der Neo-Whorf’sche Ansatz postulieren also eine Verknüpfung von sprachlichen und nicht-sprachlichen Prozessen, allerdings unterscheiden sich die Annahmen, wie diese Prozesse verknüpft sind, erheblich zwischen beiden Ansätzen. Daher fehlt derzeit eine integrierte Sichtweise zur Beziehung und zum Zusammenspiel zwischen sprachlicher und nicht-sprachlicher Kognition.

Das Ziel unseres Aufsatzes ist es, auf diese theoretische Lücke hinzuweisen und einen Überblick über den derzeitigen Stand der Forschung zu den beiden Forschungsansätzen zu geben. Zudem diskutieren wir verschiedene Möglichkeiten, wie sich sprachliche und nicht-sprachliche Kognition in einen gemeinsamen theoretischen Rahmen integrieren lassen. Ein solcher Rahmen erscheint uns als notwendig, um überhaupt spezifischere Theorien über die Interaktion zwischen sprachlicher und nicht-sprachlicher Kognition entwickeln zu können. Natürlich kann ein solcher Rahmen nicht gleich dazu führen, dass detaillierte Mechanismen postuliert werden, die so konkret sind, dass sie einer rigorosen empirischen Überprüfung zugeführt werden könnten.

Der Aufsatz gliedert sich wie folgt. In einem ersten Abschnitt geben wir einen knappen Überblick über den Aufstieg und Fall der Whorf’schen Hypothese. In einem nächsten Abschnitt stellen wir zwei Sichtweisen über Repräsentationsformate vor, die sich teilweise historisch weit zurückverfolgen lassen, aber unseres Erachtens nie in dieser Form gegenübergestellt wurden. Wir denken aber, dass für eine integrierte Sichtweise Annahmen über die beteiligten Repräsentationsformate notwendig sind. Danach geben wir einen Überblick über die zwei Forschungsbereiche, die sich mit der Interaktion zwischen sprachlicher und nicht-sprachlicher Kognition auseinandersetzen. Aufgrund der Befundlage bewerten wir am Ende die zuvor dargestellten Sichtweisen über Repräsentationsformate dahingehend, wie sich die Interaktion zwischen sprachlicher und nicht-sprachlicher Kognition am besten in einem theoretischen Rahmen integrieren lässt und welche Bedeutung das Format von Repräsentationen hierbei spielen könnte. Abgesehen von der theoretischen Bedeutung dieser Frage, ist die Beziehung zwischen sprachlicher und nicht-sprachlicher Kognition sicherlich auch von praktischem Interesse, beispielsweise bei der Gestaltung von Unterrichtsmaterialien und der Interaktion zwischen Mensch und Maschine.

Sapir-Whorf Hypothese

Eine verbreitete Sichtweise über Sprache ist, dass sie lediglich der Kommunikation zwischen Individuen dient. Danach werden Gedanken des Sprechers in sprachliche Codes transformiert und an den Hörer übermittelt, der diese dann wieder in Gedanken umwandelt. Sprache wäre somit vom Denken getrennt. Eine andere Sichtweise geht davon aus, dass sprachliche Kompetenz eine wichtige Grundlage für das Denken darstellt (Davidson, 1975; Malt & Wolff, 2010). Eine extreme Version nimmt sogar an: „Denken ist Reden mit sich selbst“ (Kant, n.d., S. 192). Diese Kant’sche Behauptung entspricht der Intuition vieler Menschen, wonach Sprache das Medium für Denken ist und so auch die Grenze unserer Erkenntnisfähigkeit bestimmt, „Die Grenzen meiner Sprache bedeuten die Grenzen meiner Welt“, (Wittgenstein, 1922, Satz 5.6). Keine dieser Extrempositionen hatte oder hat viele Anhänger in der Psychologie.

Die Frage nach der Beziehung zwischen Sprache und Denken ist jedoch ein klassischer Gegenstand der Kognitionspsychologie. Ursprünglich wurde diese Frage von Sapir und Whorf aufgebracht (Whorf, 1956). Sie waren der Ansicht, dass die Art und Weise, wie Menschen die Welt wahrnehmen und konzeptualisieren, durch ihre Muttersprache beeinflusst wird. Diese Sichtweise wird oft als Sapir-Whorf-Hypothese oder Sprachlicher Determinismus1 bezeichnet. Illustriert wird diese Hypothese häufig am Beispiel der Eskimosprache, die nach Ansicht von Whorf (1956, S. 216) mehrere Begriffe für Schneesorten besitzt. Diese sprachliche Ausdifferenzierung sollte die Muttersprachler dann in die Lage versetzen, eine differenzierte Wahrnehmung in diesem Bereich zu entwickeln. Allerdings hat Whorf diese Hypothese selbst nie empirisch überprüft, was außerdem gar nicht möglich wäre, da die Grundannahme, dass Eskimos über einen besonders differenzierten Wortschatz von Schneesorten verfügen, gar nicht zutrifft (Martin, 2014; Pullum, 1991).

Nichtsdestotrotz regte diese Hypothese zu zahlreichen Studien an, die zusammengenommen allerdings eher als Belege gegen diese Hypothese gewertet wurden (Gleitman & Papafragou, 2013; Wolff & Holmes, 2011). In einer bekannten klassischen Studie untersuchte Rosch (vormals Eleanor Rosch Heider; Rosch Heider, 1972; Rosch Heider & Oliver, 1972) die Farbdifferenzierung bei Dani, ein Stamm in Neu Guinea, die nur über zwei Farbwörter verfügen (mili und mola). Diese zwei Farbwörter decken das ganze Farbspektrum ab. Rosch argumentierte daher, dass nach der Sapir-Whorf-Hypothese die Danis eine weniger differenzierte Farbwahrnehmung haben sollten als Personen, deren Muttersprache viele Farbwörter beinhaltet. In einer Assoziationslernaufgabe sollten bestimmte Kunstwörter mit bestimmten Farbkärtchen verknüpft werden. Die Farben auf den Kärtchen waren entweder fokale Farben (typisches Rot, typisches Blau, typisches Grün etc.) oder nicht fokale Farben (untypisches Rot etc.). Entgegen der Hypothese lernten sowohl die Danis als auch eine Kontrollgruppe von englisch sprechenden Probanden die Assoziation deutlich schneller für fokale als für nicht fokale Farben (Rosch Heider, 1972). Wäre die Farbdifferenzierung von der Art und Anzahl der Farbwörter in der Sprache abhängig, so hätte man einen Unterschied zwischen den beiden Sprachgruppen erwartet.

Derartige Befunde haben dazu geführt, dass das Forschungsinteresse an der Beziehung zwischen Sprache und Denken nachließ. Möglicherweise wurde hierdurch sogar die Sichtweise gestärkt, dass Sprache im Kopf als eigenständiges Modul realisiert ist und so auch isoliert von nicht-sprachlichen kognitiven Fähigkeiten untersucht werden kann. Dies hat unseres Erachtens in der Folge dazu geführt, dass die Untersuchung der Sprache sich besonders stark an der Linguistik orientiert und sich somit von der psychologischen Forschung zu anderen kognitiven Bereichen abgekoppelt hat. Erst in neuester Zeit erlebt die Beziehung zwischen sprachlicher und nicht-sprachlicher Kognition eine Renaissance in der Kognitionspsychologie, allerdings in einer schwächeren Form, wonach vermutet wird, dass sprachliche Kognition nicht gänzlich unabhängig von anderen kognitiven Prozessen ist.2

Repräsentationsformen bei der sprachlichen und nichtsprachlichen Kognition: Zwei Sichtweisen

Die Frage nach dem Verhältnis zwischen sprachlicher und nicht-sprachlicher Kognition hängt unserer Meinung nach stark mit der Frage zusammen, welche Repräsentationsformen bei diesen beiden Bereichen der Kognition involviert sind. Wir denken, dass hierbei zwei Arten von Sichtweisen zu unterscheiden sind, die wir im Folgenden darstellen.

Zwei-Format-Sichtweise: Modale und amodale Repräsentationen

Eine prominente Sichtweise, die zu einer schwächeren Form der Sapir-Whorf-Hypothese passt, wonach Sprache ein kognitives Hilfsmittel für höhere kognitive Prozesse darstellt, nimmt an, dass kognitive Prozesse auf verschiedenen Repräsentationsformaten operieren (Baddely & Hitch, 1974; Paivio, 1986). Dabei lassen sich modale und amodale Repräsentationsformate unterscheiden, eine Idee, die schon bei William James (1890, Kapitel 18) formuliert wird (verbal vs. visual images) und auch neuerdings wieder vertreten wird (Binder & Desai, 2011; Dove, 2009; Markman & Dietrich, 2000;Zwaan, 2014). Innerhalb dieser Zwei-Formate-Sichtweise der Kognition wird üblicherweise angenommen, dass die Struktur der modalen Repräsentation ein Ebenbild der Struktur des zu Repräsentierenden ist und daher manchmal auch als „analoge Repräsentation“ bezeichnet wird. Vorstellungsbilder sind ein gutes Beispiel für diese Repräsentationsart. Im Gegensatz zu modalen Repräsentationen sind amodale Repräsentationen abstrakt, das heißt ihr Format orientiert sich nicht an Repräsentationen von Wahrnehmung oder Handlung. Propositionale Repräsentationen sind ein typisches Beispiel für diese Art von Repräsentation; sie bestehen aus symbolischen Codes, die sich auf elementare Bausteine von Bedeutung beziehen. Diese Repräsentationen können wiederum selbst zu komplexeren propositionalen Repräsentationen zusammengesetzt werden, ähnlich wie aus Wortbedeutungen Satzbedeutung gebildet werden können (Frege, 1892). Propositionale Repräsentationen sind demnach kompositional, ähnlich zu sprachlicher Bedeutung. In diesem Sinne können propositionale Repräsentationen im Vergleich zu modalen Repräsentationen als sprachnah angesehen werden. In der Zwei-Formate-Sichtweise werden propositionale Repräsentationen dementsprechend als Sprache des Denkens angesehen (Fodor, 2008; Pinker, 1999).

Die kompositionale Eigenschaft dieser amodalen Repräsentation erlaubt insbesondere durch Rekombination elementarer Bausteine über direkt Erfahrbares hinauszugehen. In der Zwei-Formate-Sichtweise wird üblicherweise angenommen, dass Sprachverarbeitung in der Manipulation von arbiträren amodalen Symbolen besteht, die sich im kognitiven System unabhängig von den sensomotorischen Erfahrungen entwickelt haben (Kintsch & Dijk, 1978). Diese Sichtweise legt natürlich nahe, dass sprachliche und nicht-sprachliche Prozesse fundamentale Eigenschaften teilen, nämlich solche, die auf amodalen propositionalen Repräsentationen operieren.

Ein-Format-Sichtweise: Sensomotorische (modale) Repräsentationen

Eine alternative Sichtweise zweifelt neuerdings an, dass Denken auf amodalen Repräsentationen basiert. Diese Sichtweise betont die Wichtigkeit sensomotorischer Erfahrungen bei Sprache und Denken, eine Idee, die schon Piaget (1923) vertrat. Insbesondere wird hier angenommen, dass mentale Simulation und Reaktivierung sensomotorischer Erfahrungen eine herausragende Rolle spielt (Barsalou, 2008). Immer mehr Ergebnisse scheinen zu belegen, dass diese sensomotorischen Repräsentationen vom gleichen Typ sind wie die Repräsentationen, die üblicherweise in der Forschung zur nicht-sprachlichen Kognition untersucht werden (Bub, Masson & Cree, 2008; Rueschemeyer, Glenberg, Kaschak, Mueller & Friederici, 2010; Hauk & Pulvermüller, 2011;Rueschemeyer et al., 2010; Zwaan, Taylor & Boer, 2010). Eine zentrale Annahme dieser Sichtweise ist, dass allen kognitiven Funktionen dieselbe Repräsentationsform zugrunde liegt. Daher greifen auch höhere kognitive Funktionen bei der Repräsentation von Objekten, Handlungen, Situationen und Ereignissen auf dieses einheitliche Repräsentationsformat zurück. Nach dieser Ein-Format-Sichtweise wirken bei der Entstehung der Repräsentation einer Entität (z. B. Zug) verschiedene Sinnesmodalitäten mit (auditiv, visuell, olfaktorisch). Das gesamte Aktivierungsmuster in den verschiedenen Modalitäten repräsentiert dann die Entität. Wird nur eine Modalität stimuliert (z. B. der Zug wird nur gehört) so wird das Aktivierungsmuster in den anderen beteiligten Modalitäten ergänzt, so dass die Repräsentation der Entität insgesamt reaktiviert wird. In anderen Worten, nach dieser Auffassung ist die Repräsentation einer Entität über verschiedene Sinnesmodalitäten verteilt. Zentral ist die Annahme, dass sowohl sprachliche als auch nicht-sprachliche Prozesse diese modale Repräsentationsform rekrutieren.

Als Zwischenbilanz lässt sich festhalten, dass aktuelle Forschung in der Kognitionspsychologie zwei Sichtweisen nahelegt, wie sprachliche und nicht-sprachliche Kognition aufeinander bezogen sind (d. h. die Ein- vs. Zwei-Format Sichtweise). Obgleich die konzeptuellen Unterschiede zwischen den beiden Sichtweisen groß sind, implizieren beide, dass sprachliche und nicht-sprachliche Kognition fundamentale Prozesse und Repräsentationen gemeinsam haben. Forschung, die ausschließlich den einen oder anderen Bereich adressiert, kann daher nicht zu einem umfassenden Verständnis von Kognition führen.

Im Folgenden werden wir auf zwei aktuelle Forschungsfelder eingehen, die sich mit dem Zusammenspiel von sprachlicher und nicht-sprachlicher Kognition beschäftigen und sich im Rahmen der beiden oben genannten Sichtweisen bewerten lassen. Die erste Forschungsrichtung fragt nach der Funktion von sprachlicher Kognition für die nicht-sprachliche Kognition ohne jedoch die unterschiedlichen Konzeptionen zu kognitiven Repräsentationsformaten in Betracht zu ziehen. Die andere Forschungsrichtung beschäftigt sich speziell mit dem Sprachverstehen und der Annahme, dass beim Sprachverstehen ähnliche Repräsentationsformate involviert sind wie bei der nicht-sprachlichen Kognition. Diese Forschungsrichtung bezieht sich allerdings fast ausschließlich auf die Implikationen der Ein-Format-Sichtweise und lässt Erklärungsmöglichkeiten auf der Basis der Zwei-Formate-Sichtweise weitgehend außer Acht.

Die Rolle sprachlicher Kognition bei der Lösung nicht-sprachlicher Aufgaben

Wie oben bereits erwähnt, geht heutzutage kaum ein Wissenschaftler mehr von einem sprachlichen Determinismus aus, wonach die Art und Weise, wie Menschen die Welt wahrnehmen, durch ihre Muttersprache bestimmt wird. Zwar gibt es Studien, die einen deutlichen Einfluss der Muttersprache auch bei nicht-sprachlichen Aufgaben nachweisen können, jedoch kann hier in den allermeisten Fällen nicht ausgeschlossen werden, dass die Probanden bei der Lösung der nicht-sprachlichen Aufgabe spontan und ohne Aufforderung auf sprachliche Prozesse zurückgegriffen haben. Dies könnte zum einen daran liegen, dass die Probanden erwarteten, später über die Aufgabe befragt zu werden und deshalb bereits während der Verarbeitung die nicht-sprachliche Aufgabe verbalisierten („thinking for speaking“, vgl. Slobin, 2003) oder aber auch nur ein spontanes Zurückgreifen auf sprachliche Prozesse reflektieren (siehe unten). Eine Ausnahme bilden vermutlich Studien zur perzeptuellen Kategorisierung, denen wir deshalb einen separaten Abschnitt widmen (z. B. Lupyan, Rakison & McClelland, 2007; Thierry, Athanasopoulos, Wiggett, Dering & Kuipers, 2009; Winawer et al., 2007).

Generell gehen die meisten Autoren mittlerweile von einer etwas loseren Verbindung zwischen sprachlicher und nicht-sprachlicher Kognition aus. In anderen Worten, man geht heute eher davon aus, dass sich die Struktur unseres Denkens durch die Struktur der Welt anstatt durch die Struktur der Sprache geprägt ist und somit die Beziehung zwischen Sprache und Denken weniger eng ist als ursprünglich vermutet (Wolff & Holmes, 2011). Allerdings heißt das natürlich nicht, dass die sprachliche Kognition für die nicht-sprachliche Kognition irrelevant ist. Wie oben argumentiert, sagen ja auch beide Sichtweisen vorher, dass sprachliche und nicht-sprachliche Kognition Prozesse und Repräsentationsformen gemeinsam haben und es deshalb viele Möglichkeiten zur Interaktion gibt. Passend zu dieser Annahme wurden in der Forschung zur Funktion sprachlicher auf nicht-sprachliche Kognition unterschiedliche Einflüsse gefunden. Die Einflüsse reichen von kurzfristigen Effekten während der Verarbeitung, die darauf schließen lassen, dass sich sprachliche Prozesse in nicht-sprachliche Prozesse „einmischen“ (siehe Abschnitt 3.1), zu eher langfristigen Effekten. Bei den langfristigen Effekten kann unterschieden werden zwischen solchen, die einen Effekt einer bestimmten beherrschten Einzelsprache reflektieren (siehe Abschnitt 3.2 und 3.3) und solchen, die die Sprachkompetenz an sich widerspiegeln (siehe Abschnitt 3.4).

Kurzfristige Effekte sprachlicher Prozesse auf nicht-sprachliche Prozesse

Kurzfristige Effekte sprachlicher Prozesse bei nicht-sprachlichen Aufgaben ergeben sich häufig schon alleine deshalb, weil eine Person sich während der Aufgabenbearbeitung bewusst oder unbewusst darauf vorbereitet, zu einem späteren Zeitpunkt die nicht-sprachliche Tätigkeit verbal zu beschreiben. Ein solcher „Thinking for speaking“-Einfluss von Sprache auf Denken (Slobin, 2003) zeigte sich beispielsweise in der Studie von Papafragou, Hulbert und Trueswell, (2008), in der die Augenbewegungen von englischen und griechischen Muttersprachlern aufgezeichnet wurden während sie Bewegungsereignisse beobachteten. Bewegungsverben im Englischen drücken in der Regel die Bewegungsart aus (z. B. slide, skip, walk), in selteneren Fällen beziehen sich englische Bewegungsverben auf die Bewegungsrichtung (z. B. approach, ascend). Im Griechischen ist dies umgekehrt. Beim Betrachten eines Bewegungsereignisses wäre demnach zu erwarten, dass Englische und Griechische Muttersprachler auf unterschiedliche Komponenten von Bewegungsereignissen achten, jedenfalls wenn sie eine verbale Beschreibung derselben vorbereiten. Tatsächlich zeigten sich entsprechende Unterschiede in den Augenbewegungen der Probanden nur, wenn sie vor dem Betrachten der Videos angewiesen wurden, die gesehenen Ereignisse im Anschluss verbal zu beschreiben. Betrachteten die Probanden die Ereignisse mit der Anweisung, sie im Gedächtnis zu behalten, zeigten sich keine Unterschiede während der Betrachtung der Bewegungsereignisse.

Ähnliche Ergebnisse zeigten sich auch in einer Studie von Gennari, Sloman, Malt und Fitch (2002), in der englische Muttersprachler mit Muttersprachlern des Spanischen verglichen wurden, wobei das Spanische hinsichtlich der Bewegungsverben mit dem Griechischen vergleichbar ist. In dieser Studie wurden den Probanden in einer ersten Phase des Experiments Filme von Bewegungsereignissen präsentiert, die sie entweder gleichzeitig verbal beschreiben sollten oder nicht. In einer zweiten Phase bearbeiteten die Probanden dann zwei nicht-sprachliche Aufgaben, eine Wiedererkennungsaufgabe und eine Ähnlichkeitsbeurteilung. Ein Unterschied zwischen den beiden Gruppen zeigte sich nur bei der Ähnlichkeitsbeurteilung und zwar nur dann, wenn die Probanden die Ereignisse beim Betrachten verbal beschrieben hatten. In diesem Fall beurteilten englische Muttersprachler zwei Ereignisse als ähnlich, wenn sie sich hinsichtlich der Bewegungsart glichen, während spanische Muttersprachler eher auf Ähnlichkeiten hinsichtlich der Bewegungsrichtung achteten. Die sprachlichen Repräsentationen, die während der Enkodierung der Ereignisse aktiviert waren, mischten sich hier also ähnlich wie in der Studie zuvor in die nicht-sprachlichen Prozesse (Ähnlichkeitsbeurteilung) ein, nur dass es sich hier um einen Einfluss nach der Verbalisierung handelte (thinking after language, vgl. Wolff & Holmes, 2011).

Nicht in allen Fällen ist die Interpretation der Befunde jedoch so klar. In einer Studie von Fausey und Boroditsky (2011) beispielsweise wurde untersucht, ob sich englische und spanische Muttersprachler darin unterscheiden, wie gut sie sich an den Agens in willentlichen und versehentlichen Handlungen erinnern können. Während im Englischen agentive Konstruktionen für beide Sorten von Handlungen verwendet werden (z. B. „She broke the vase“) werden im Spanischen agentive Konstruktionen vornehmlich für willentliche Handlungen verwendet. Für versehentliche Handlungen werden im Spanischen eher non-agentive Konstruktionen mit „se“ verwendet (z. B. „Se rompió el florero“ – „The vase broke itself“). Tatsächlich zeigte sich in einem nachfolgenden Wiedererkennungstest, dass sich spanische und englische Muttersprachler gleich gut an den Agens in willentlichen Handlungen erinnern konnten und auch gleich gut an die Details der beteiligten Objekte. Unterschiede zwischen den beiden Sprechergruppen zeigten sich jedoch bei den versehentlichen Handlungen. Hier konnten sich englische Muttersprachler besser an den jeweiligen Agens erinnern als spanische Muttersprachler, was gut zu der Hypothese passt, dass sprachliche Prozesse bei der Enkodierung der Handlungen eine gewisse Rolle gespielt haben: Wenn die Probanden nämlich die dargestellte Handlung bei der Enkodierung im Kopf verbal beschrieben hatten, dann wurde dabei der jeweilige Agens von versehentlichen Handlungen nur bei den englischsprachigen Muttersprachlern versprachlicht. Bei den spanischen Muttersprachlern wurde bei versehentlichen Handlungen hingegen eine non-agentive Konstruktion verwendet, in der kein Agens benannt wurde. Es könnte also gut sein, dass diese mentale Versprachlichung der dargestellten Handlungen den Fokus der Aufmerksamkeit bei den spanischen Sprechern weg vom Agens der Handlung gelenkt hat. Entsprechend ließe sich dann auch erklären, warum sich die spanischen Muttersprachler schlecht an den jeweiligen Agens von versehentlichen Handlungen erinnern konnten. Natürlich ist auf der Basis der vorliegenden Befunde nicht auszuschließen, dass es sich hierbei um einen generellen langfristigen Effekt der Muttersprache auf die Interpretation von Handlungen handelt, da die Probanden in keiner Bedingung daran gehindert wurden, die dargestellten Handlungen im Kopf zu verbalisieren.

Ein weiteres und letztes Beispiel für kurzfristige Effekte der Muttersprache auf die nicht-sprachliche Kognition stammt aus dem Bereich der numerischen Kognition. Beim Größenvergleich zweier zweistelliger Zahlen lässt sich zwischen kompatiblen und inkompatiblen Vergleichen unterscheiden, wobei in kompatiblen Vergleichen die kleinere Zahl sowohl den kleineren Zehner als auch den kleineren Einer aufweist (42 vs. 57), während in inkompatiblen Vergleichen der Einer bei der kleineren Zahl größer ist als der Einer der größeren Zahl (47 vs. 62). Inkompatible Vergleiche benötigen typischerweise mehr Zeit und sind fehleranfälliger als kompatible Vergleiche (Nuerk, Weger & Willmes, 2001).

In einer Studie von Pixner, Moeller, Hermanova, Nuerk und Kaufmann (2011) wurde nun untersucht, ob dieser Kompatibilitätseffekt unterschiedlich stark ausgeprägt ist bei Kindern mit unterschiedlichen Muttersprachen. Verglichen wurden unter anderem österreichische und italienische Erstklässler, weil sich Deutsch und Italienisch hinsichtlich der Zahlwortsystematik stark unterscheiden: Das Deutsche ist durch eine Inversion der Zehner und Einer in den Zahlwörtern gegenüber der numerischen Notation charakterisiert („21“ → „Einundzwanzig“), während Italienische Zahlwörter grundsätzlich nicht invertieren. Wenn sprachliche Prozesse beim numerischen Größenvergleich herangezogen werden, so ließe sich erwarten, dass der Kompatibilitätseffekt besonders ausgeprägt ist, wenn die Muttersprache ein invertierendes Zahlwortsystem aufweist: Wird bei den Vergleichen nämlich manchmal der Zehner mit dem Einer verwechselt (ein Fehler, den die Inversion begünstigt) so ist es nicht verwunderlich, dass es insbesondere in inkompatiblen Vergleichen zu erhöhten Fehlerzahlen kommt. Tatsächlich war der Kompatibilitätseffekt bei den österreichischen Kindern besonders ausgeprägt, sowohl hinsichtlich der Reaktionszeiten als auch hinsichtlich der Fehlerraten. Natürlich ist auch hier wieder unklar, ob die Unterschiede zwischen den beiden Gruppen eher kurzfristige Effekte widerspiegeln, die darauf zurückzuführen sind, dass sich sprachliche Prozesse auch in vermeintlich nicht-sprachliche Aufgaben (numerischer Größenvergleich) einmischen, oder aber eher langfristige Effekte widerspiegeln, die auf die langjährige Erfahrung mit der jeweiligen Muttersprache zurückzuführen sind. Die Tatsache, dass sich die Unterschiede in der Studie von Pixner et al. (2011) bereits bei Erstklässlern zeigten, die noch vergleichsweise wenig Erfahrung mit zweistelligen Zahlen und den dazu passenden Zahlwörtern haben, spricht unseres Erachtens eher gegen das Vorliegen langfristiger Effekte. Klarheit könnte wiederum eine Untersuchung schaffen, die die Kinder während des Größenvergleichs daran hindert, die Zahlen zu verbalisieren.

Langfristige Effekte der konkreten Muttersprache durch Hervorheben bestimmter Eigenschaften und Unterscheidungen

Wie oben bereits erwähnt, wurden in der Forschung zum Einfluss von Sprache auf Denken bislang keine Hinweise auf eine starke Form des sprachlichen Determinismus gefunden, wonach die Muttersprache einer Person ihr Denken bestimmt und somit Eigenschaften und Unterscheidungen, die in der Muttersprache keine Rolle spielen, auch bei der Wahrnehmung und Konzeptualisierung und dem Schlussfolgern über die Welt unberücksichtigt bleiben. Dies heißt aber nicht, dass die Muttersprache keinerlei langfristigen Einfluss auf die nicht-sprachliche Kognition hat. Langfristige Effekte konnten insbesondere in zwei Bereichen gefunden werden – in Untersuchungen zum grammatischen Geschlecht und in Untersuchungen zu räumlichen Referenzrahmen. Der Einfluss der Muttersprache auf die nicht-sprachliche Kognition scheint hier vornehmlich darauf zurückzuführen zu sein, dass Eigenschaften und Unterscheidungen, die in der Muttersprache relevant sind, durch die häufige Beachtung besonders salient gemacht werden und dadurch auch bei der Konzeptualisierung der Welt gegenüber anderen Eigenschaften und Unterscheidungen, die zwar im konzeptuellen System einer Person vorhanden sind, aber in der Muttersprache keine Rolle spielen, in den Vordergrund treten. Im Folgenden werden zunächst die Untersuchungen zum grammatischen Geschlecht und dann die zu räumlichen Referenzrahmen geschildert.

Sprachen unterscheiden sich zum Teil drastisch hinsichtlich des grammatischen Geschlechts ihrer Substantive. In romanischen Sprachen beispielsweise besitzen alle Substantive entweder ein männliches oder ein weibliches Geschlecht, wobei die Zuordnung zu den jeweiligen Geschlechtern in den einzelnen Sprachen unterschiedlich ist. Im Spanischen etwa ist das Wort für „Brücke“ dem männlichen Geschlecht zugeordnet, während es im Deutschen weiblich ist. Das grammatische Geschlecht muss bei der Sprachproduktion ständig beachtet werden, denn es müssen nicht nur die Artikel, sondern auch diverse andere Wörter im Satz an das grammatische Geschlecht der Substantive angepasst werden (z. B. Adjektive: „Dort steht ein blonder Mann“ vs. „Dort steht eine blonde Frau“). Es stellt sich somit die Frage, ob diese Unterscheidung, die uns durch unsere Muttersprache tagtäglich beschäftigt, auch unsere Konzeptualisierung der entsprechenden Objekte und Ereignisse beeinflusst. Tatsächlich zeigte sich in Studien von Boroditsky, Schmidt und Phillips (2003), dass sich Personen mit unterschiedlichen Muttersprachen zum Teil drastisch in ihrer Konzeptualisierung von alltäglichen Objekten und Ereignissen unterscheiden: Fordert man beispielsweise spanische Probanden auf, eine Brücke zu beschreiben, so werden Adjektive wie „groß“, „kräftig“ und „solide“ verwendet, während deutsche Probanden eher weibliche Adjektive wie „elegant“, „zierlich“, „friedlich“ und „hübsch“ zur Beschreibung verwenden. Ähnliche Unterscheide zeigten sich auch bei rein nicht-sprachlichen Aufgaben, beispielweise wenn die Ähnlichkeit zwischen Bildern der entsprechenden Objekte beurteilt werden sollten. Interessanterweise lässt sich auch in der Kunst die Muttersprache der jeweiligen Künstler erkennen. In etwa 80 % der Personifizierungen abstrakter Begriffe wie „Tod“ oder „Sieg“ bestimmt das grammatische Geschlecht in der Muttersprache des Künstlers, ob der Künstler diesen abstrakten Begriff als Mann oder als Frau darstellt (Boroditsky, 2010). Auch Studien, die sich mit der Verarbeitung des generischen Maskulinums beschäftigen, legen einen solchen Einfluss des grammatischen Geschlechts auf die Konzeptualisierung nahe (Irmen & Schumann, 2011; Rothermund, 1998). Allerdings gibt es auch Studien, die zeigen, dass der Einfluss des grammatikalischen Geschlechts auf die Konzeptualisierung nicht in allen Sprachen gleich stark ausgeprägt ist (z. B. Koch, Zimmermann & Garcia-Retamero, 2007).

Ein weiterer Aspekt, in dem sich die Sprachen der Welt stark unterscheiden, betrifft die lexikalischen Kategorien, mit denen räumliche Verhältnisse beschrieben werden. Im Englischen, Deutschen und Niederländischen beispielsweise werden hauptsächlich intrinsische und egozentrische Referenzrahmen verwendet (z. B. „Der Ball liegt vor dem Haus“, „Der Ball liegt links [von mir]“) während beispielsweise in Tzeltal, einer Maya-Sprache in Mexiko, vornehmlich absolute Referenzrahmen verwendet werden (z. B. „Der Ball rollt nach Osten“). In einer klassischen und viel-zitierten Studie von Levinson und Kollegen (beschrieben in Brown & Levinson, 1993) wurde untersucht, ob sich diese Unterschiede hinsichtlich des sprachlich präferierten Referenzrahmens auch bei nicht-sprachlichen räumlichen Aufgaben bemerkbar machen, in denen ein Referenzrahmen ausgewählt werden muss. Personen mit Niederländisch bzw. Tzeltal als Muttersprache sahen drei Objekte (A, B, C), die eins neben dem anderen auf einem Tisch in einer Reihe angeordnet waren (z. B. A – B – C). Dann wurden die Personen um 180° gedreht und sie wurden instruiert, die eben gesehene Anordnung auf dem neuen Tisch nachzubilden. Wie erwartet ordneten die Niederländer die Objekte entsprechend eines egozentrischen Referenzrahmens neu an (aus der Sicht der Probanden: A – B – C), während die Personen mit Tzeltal als Muttersprache ein absolutes Referenzsystem verwendeten (aus der Sicht des Probanden: C – B – A). Der Referenzrahmen, der in der Muttersprache präferiert verwendet wird, scheint also auch bei nicht-sprachlichen Aufgaben herangezogen zu werden, wenn die eine Wahl eines Referenzrahmens erfordern.

Natürlich kann hier auf der Basis dieser Befunde nicht ausgeschlossen werden, dass es sich um eher kurzfristige Effekte der Muttersprache auf die nicht-sprachliche Kognition handelt, die dadurch zustande kommen, dass die Probanden die Anordnung beim Enkodieren spontan verbalisierten. Gegen diese Interpretation sprechen jedoch die Ergebnisse von Nachfolgestudien, die von Li und Gleitman (2002) durchgeführt wurden und zeigen, dass die Probanden unter bestimmten Bedingungen auch das nicht präferierte Referenzsystem verwenden, selbst wenn sie nicht aktiv an der Verbalisierung gehindert werden. Die Tatsache, dass sie dies ebenso mühelos zu beherrschen scheinen, spricht auch gegen die Hypothese, dass es sich hier um einen starken Einfluss der Muttersprache auf die nicht-sprachlichen Kognition handelt, wonach Personen nur in denjenigen Kategorien denken können, die in der jeweiligen Muttersprache lexikalisiert sind. Vielmehr scheint die langjährige Erfahrung mit der Muttersprache bestimmte Unterscheidungen besonders salient zu machen (z. B. die zwischen Nord und Süd und Ost und West), so dass diese gegenüber anderen Unterscheidungen (z. B. die zwischen Links und Rechts vom Körper) in den Vordergrund treten. Als Folge werden diese sprachlich realisierten und damit häufig beachteten Eigenschaften und Unterscheidungen auch bei nicht-sprachlichen Aufgaben präferiert verwendet.

Vermeintlich kurzfristige Einflüsse auf die perzeptuelle Kategorisierung

Im Gegensatz zu den oben erwähnten Studien gibt es im Bereich der Wahrnehmung starke Hinweise darauf, dass Sprache sogar sehr frühe perzeptuelle Prozesse langfristig beeinflussen kann. Diese Effekte werden oft im Rahmen der sogenannten Label-Feedback-Hypothese (Lupyan, 2012) diskutiert, wonach Sprache durch einen Top-down-Einfluss frühe perzeptuelle Prozesse moduliert. Bevor wir diese Hypothese näher erläutern, beschreiben wir zunächst beispielhaft eine Reihe von Phänomenen, die im Rahmen dieser Hypothese erklärt werden.

In der Studie von Thierry et al. (2009) wurden englische und griechische Muttersprachler in einer „oddball shape discrimination task“ verglichen, in der in einer Sequenz von nacheinander präsentierten Kreisen ein Quadrat auftauchte, auf welches die Probanden zu reagieren hatten. Die Kreise hatten alle die gleiche Farbe, nur ab und zu tauchte ein Kreis in einer anderen Farbe auf (oddball). Je nach Experimentalbedingung handelte es sich hier um eine Abweichung innerhalb der Farbe Grün (hell oder dunkel), die in beiden Sprachen lexikalisch nicht unterschieden wird (Englisch: green; Griechisch: prasino), oder aber um eine Abweichung innerhalb der Farbe Blau (hell oder dunkel), die im Englischen nicht, aber im Griechischen mit zwei unterschiedlichen lexikalischen Einträgen einhergeht (ble und ghalazio). Tatsächlich zeigte sich als Reaktion auf die farblich abweichenden Kreise ein Unterschied zwischen den beiden Probandengruppen in der sogenannten Visual Mismatch Negativity, einer EEG-Komponente, die üblicherweise mit sehr frühen und basalen visuellen Wahrnehmungsprozessen in Verbindung gebracht wird, ein Befund der sich in analoger Weise auf die Objektwahrnehmung verallgemeinern ließ (Boutonnet, Dering, Viñas-Guasch & Thierry, 2013). Es ist daher naheliegend anzunehmen, dass ein fundmentaler Unterschied in der perzeptuellen Verarbeitung hinsichtlich der Farbe Blau zwischen den beiden Sprechergruppen besteht.

In einer ähnlichen Studie von Winawer et al. (2007) wurden englische und russische Muttersprachler in einer Farbdiskriminierungsaufgabe verglichen. Ausgenutzt wurde in dieser Studie, dass das Russische anders als das Englische zwei eigenständige Farbwörter für helle und dunkle Blautöne besitzt („goluboy“ vs. „siniy“). Im Russischen verläuft also innerhalb der Farbkategorie, die im Englischen mit „blue“ bezeichnet wird, eine lexikalische Kategoriengrenze. Getestet wurde nun die Farbdiskriminierungsleistung für blaue Farbtöne, die im Russischen in derselben bzw. in verschiedenen lexikalischen Farbkategorien liegen. Tatsächlich zeigte sich, dass russische Muttersprachler, anders als englische Muttersprachler, schneller zwischen blauen Farbtönen unterscheiden konnten, die im Russischen in unterschiedlichen lexikalischen Kategorien liegen als zwischen blauen Farbtönen, die im Russischen in der gleichen lexikalischen Kategorie liegen. Allerdings verschwanden die Unterschiede zwischen den beiden Sprechergruppen, wenn die Probanden während der Farbdiskriminierung eine Folge von Zahlen vor sich hinsagen mussten (verbale Doppelaufgabe). Versuchten sie hingegen während der Farbdiskriminierung ein räumliches Muster im Gedächtnis zu behalten (räumliche Doppelaufgabe), blieben die Unterschiede zwischen den Sprechergruppen unbeeinflusst.

Solche Einflüsse von Sprache zeigen sich nicht nur bei basalen Wahrnehmungsprozessen, sondern auch bei der visuellen Kategorisierung von Objekten. In einer Arbeit von Lupyan et al. (2007) wurden Versuchspersonen nacheinander Bilder von artifiziellen Objekten präsentiert und ihre Aufgabe bestand darin, diese jeweils in eine von zwei Kategorien einzuteilen. Nach jedem Durchgang erhielten die Versuchspersonen Rückmeldung, ob die Zuordnung falsch oder richtig war. Für die Hälfte der Versuchspersonen erschien nach der Rückmeldung ein für die Bewältigung der Aufgabe irrelevantes sprachliches Label für die jeweilige Kategorie („leebish“ oder „grecious“). Die andere Hälfte bekam nur die Rückmeldung. Interessanterweise lernte die Gruppe mit Label schneller und besser die Kategorien als die Gruppe ohne Label und schnitt auch in einer Generalisierungsaufgabe mit zuvor nicht gezeigten Exemplaren der beiden Kategorien besser ab. Diese Ergebnisse deuten darauf hin, dass sprachliche Information offensichtlich nicht nur der Kommunikation dient, sondern die perzeptuelle Kategorisierung von Objekten unterstützt.

Ein solcher Redundant-Label-Effekt wurde in diversen weiteren Studien gefunden (für einen Überblick siehe Lupyan, 2012). Interessanterweise wird dieser Effekt zudem nicht durch eine semantische Anreicherung der kategorialen Information verstärkt, was nahelegt, dass schlichte redundante verbale Labels hinreichend sind, um die Kategorisierung zu induzieren (Maier, Glage, Hohlfeld & Abdel Rahman, 2014). Dieser Redundant-Label-Effekt lässt sich allerdings nur dann nachweisen, wenn die redundanten Labels möglichst zeitnah mit den Objekten präsentiert werden, was zunächst kurzfristige Effekte von Sprache auf nicht-sprachliche Prozesse suggeriert, anstatt eine langanhaltende Modulation der Wahrnehmung durch Sprache.

Nach der Label-Feedback-Hypothese (Lupyan, 2012) sind diese vermeintlich kurzfristigen Effekte aber durchaus konsistent mit der Annahme, dass Sprache die Wahrnehmung anhaltend beeinflusst. Diese Hypothese geht davon aus, dass die sprachliche Information (Labels) in höheren kognitiven Regionen verarbeitet wird und diese Information auf perzeptuelle Prozesse zurückwirkt. Es handelt sich hier also um Top-Down-Einflüsse auf die Wahrnehmung, die eine dauerhafte Veränderung perzeptueller Prozesse zur Folge haben. Durch verbale Zusatzaufgaben wie etwa in der Studie von Winawer et al. (2007) wird dieser Top-Down-Einfluss verhindert, so dass Sprache dann nicht mehr auf frühe perzeptuelle Prozesse wirken kann, mit dem Resultat, dass der sprachliche Einfluss auf nicht-sprachliche Prozesse verschwindet. Im Gegensatz dazu würden zusätzliche Labels wie in der Studie von Lupyan et al. (2007) diese Top-Down-Wirkung sogar noch verstärken. Diese Hypothese ist also durchaus mit einer langanhaltenden Modulation der Wahrnehmung durch Sprache konsistent. Vermeintlich kurzfristige Effekte von Sprache auf Wahrnehmung lassen sich danach durch eine temporäre Verstärkung oder Abschwächung dieses Top-Down-Einflusses interpretieren.

Langfristige Effekte von Sprache an sich: Unterstützende Funktion sprachlicher Kognition

Wie in den letzten drei Abschnitten deutlich geworden sein sollte, spielen sprachliche Prozesse und Repräsentationen eine wesentliche Rolle in der Kognition. Eigenschaften und Unterscheidungen, die in der Muttersprache relevant sind, spielen auch über die sprachliche Kognition hinaus eine herausgehobene Rolle. Dies legt demnach die Hypothese nahe, dass sprachliche Prozesse eine unterstützende Funktion haben, etwa um die Gedächtnisleistung zu verbessern oder Schlussfolgerungsprozesse zu erleichtern. Tatsächlich liegen in der Literatur eine ganze Reihe von Studien vor, die diese Hypothese stützen, wonach Sprache diverse kognitive Prozesse, die nicht direkt sprachlicher Natur sind, unterstützt. Im Unterschied zu den Untersuchungen in den letzten beiden Abschnitten geht es hier vornehmlich nicht um den Einfluss einer bestimmten Muttersprache und deren Besonderheiten, sondern um den Einfluss von Sprache an sich. In anderen Worten, es geht hier um die positive Wirkung, die von der Möglichkeit ausgeht, bestimmte Sachverhalte sprachlich enkodieren zu können.

Interessant in diesem Zusammenhang sind Studien mit dem Pirahã Stamm aus dem Amazonas-Gebiet in Brasilien, dessen Mitglieder, wenn überhaupt, nur ein äußerst eingeschränktes Zahlwort-Vokabular verwenden. Dies steht im Gegensatz zu den meisten anderen Sprachen, die über ein rekursives Zahlwortsystem verfügen, mit dem beliebige Kardinalitäten verbal ausgedrückt werden können (z. B. „Vierhunderteinunddreißig“). Den Pirahã fehlt im Bereich der numerischen Kognition also gewissermaßen die Möglichkeit, sprachliche Repräsentationen und Prozesse zu Hilfe zu ziehen, und es stellt sich somit die Frage, wie dies die numerische Kognition der Pirahã beeinflusst. Frühe Studien zeigen, dass die Pirahã bei numerischen Aufgaben, in denen es um exakte Kardinalitäten von Mengen geht, umso mehr Fehler machten, je größer die Mengen wurden (Gordon, 2004). Die Ergebnisse dieser Studien lassen sich insgesamt so interpretieren, dass die Pirahã eine analoge approximative Größenschätzungs-Strategie verwenden. Dies legt nahe, dass die Pirahã eine völlig andere Repräsentation von großen Zahlen haben als Sprecher von Sprachen mit einem rekursiven Zahlwortsystem. Möglicherweise haben sie auch einfach gar kein Konzept für die genaue Kardinalität einer Menge. („exact quantities“)3.

Dieser Frage wurde in einer Studie von Frank, Everett, Fedorenko und Gibson (2008) nachgegangen. Sie ließen Pirahã verschiedene Aufgaben durchführen, in denen es darum ging, eine vom Experimentator vorgelegte Menge an Garnspulen mit einer Menge von nicht aufgeblasenen Luftballons nachzubilden. Legte der Experimentator beispielswiese sieben Garnrollen in einer unregelmäßigen Reihe auf den Tisch, so bestand die Aufgabe des Probanden darin, eine Menge von sieben Ballons auf dem Tisch auszubreiten. Die Aufgaben unterschieden sich hinsichtlich der Anforderungen an Wahrnehmung und Gedächtnis. In der „one-to-one matching task“ legte der Experimentator die Garnrollen regelmäßig in einer Reihe vor den Probanden auf den Tisch. Der Proband konnte in diesem Fall zu jeder einzelnen Garnrolle einen Luftballon legen, um die Aufgabe zu lösen. In der „uneven matching task“ war die Reihe hingegen unregelmäßig; die Rollen waren in kleinen Gruppen von bis zu vier Rollen angeordnet. In der „orthogonal-matching task“ lag die Reihe des Experimentators in einem 90° Winkel vom Probanden weg, so dass die zu legende Reihe nicht parallel zur vorgelegten Reihe gelegt werden konnte. In der „hidden matching task“ legte der Experimentator eine Reihe von Garnrollen auf den Tisch, verdeckte sie dann aber mithilfe eines undurchsichtigen Schirms, was zur Folge hatte, dass der Proband zur Lösung der Aufgabe die Anzahl der Garnrollen im Gedächtnis behalten musste. In der „nuts-in-a-can-task“ schließlich legte der Experimentator eine Garnrolle nach der anderen in einen Behälter und die Aufgabe des Probanden bestand darin, dieselbe Menge an Luftballons auf den Tisch zu legen. Die Ergebnisse waren recht eindeutig. Die one-to-one matching task und auch die uneven-matching task beherrschten die Pirahã perfekt, was zeigt, dass sie durchaus ein Konzept für exakte Kardinalität von Mengen besitzen. Sie hatten offenbar realisiert, dass für jede Garnrolle ein Luftballon auf den Tisch zu legen war und es auch bei größeren Mengen nicht ausreichte, die ungefähre Kardinalität nachzubilden. Dies spricht gegen die starke Version der Whorf’schen Hypothese, wonach numerisches Vokabular eine Vorrausetzung für das Ausbilden numerischer Konzepte ist. In den anderen Aufgaben, insbesondere in der „hidden-matching-task“ und der „nuts-in-a-can-task“ verschlechterte sich jedoch die Leistung der Pirahã drastisch mit größer werdenden Kardinalitäten. Was diese Aufgaben von den anderen unterscheidet, sind die Anforderungen an das Gedächtnis: Um diese Aufgaben lösen zu können, muss die genaue Anzahl der vorgelegten Gegenstände repräsentiert und im Gedächtnis gehalten werden. Hiermit hatten die Pirahã offenbar Schwierigkeiten. Zusammengenommen sprechen die Ergebnisse dieser Studie also dafür, dass numerisches Vokabular zwar keine Voraussetzung für die Entwicklung numerischer Konzepte ist, dass es aber ein praktisches kognitives Hilfsmittel darstellt, mit dessen Hilfe auch größere Anzahlen repräsentiert und im Gedächtnis gespeichert werden können, was wiederum als eine Vorrausetzung für komplexere numerische Prozesse angesehen werden kann, in denen größere Anzahlen mental manipuliert werden müssen.

Ein weiteres Beispiel für eine unterstützende Funktion von sprachlicher für nicht-sprachliche Kognition stammt aus dem Bereich des False Belief Understandings. In einer Studie von Pyers und Senghas (2009) wurden zwei Gruppen von nigerianischen Taubstummen untersucht, die dieselbe Schule besuchten und denselben soziokulturellen Hintergrund aufwiesen. Der Unterschied zwischen den beiden Gruppen bestand darin, dass die erste Gruppe im Schnitt etwa zehn Jahre älter war und eine frühe und rudimentäre Form der nigerianischen Zeichensprache (NSL) gelernt hatte, die sich von der späteren vollständigen Version unter anderem darin unterschied, dass sie weniger Vokabular zur Verfügung stellte, mit dem auf mentale Zustände von Personen referiert werden kann („mental state vocabulary“). Beide Gruppen wurden nun hinsichtlich ihres False Belief Understandings getestet. Ihnen wurden Bildergeschichten vorgelegt, in denen zwei Personen einen Gegenstand an einem bestimmten Ort betrachten (Ort A). Dann verlässt die erste Person den Raum und die zweite Person verlegt den Gegenstand, ohne dass dies die erste Person mitbekommt (von Ort A nach Ort B). Am Ende der Geschichte kommt die erste Person wieder in den Raum. Die Aufgabe der Probanden bestand nun darin, die richtige von zwei End-Karten der Bildergeschichte auszuwählen – die Karte, in der die Person den Gegenstand an Ort A sucht (richtige Antwort: false-belief Karte) oder die Karte, in der die Person an Ort B sucht (falsche Antwort). Es zeigte sich, dass die Probanden der älteren Kohorte deutlich schlechter in dieser Aufgabe abschnitten als die Probanden der jüngeren Kohorte, die ein entsprechendes Vokabular zur Verbalisierung mentale Zustände zur Verfügung hatte, und das obwohl die ältere Kohorte ein Jahrzehnt mehr an sozial-interaktiven Erfahrungen aufzuweisen hatte. Die Ergebnisse dieser Studie sprechen demnach recht deutlich dafür, dass sprachliche Prozesse und Repräsentationen im Bereich des False Belief Understandings eine unterstützende Funktion haben. Die Möglichkeit, mentale Zustände anderer Personen verbal enkodieren zu können, scheint Schlussfolgerungsprozesse im sozial-kognitiven Bereich stark zu begünstigen.

Auch eine Reihe von entwicklungspsychologischen Studien belegt die unterstützende Funktion sprachlicher Kognition für nicht-sprachliche Prozesse. Dessalegn und Landau (2008) beispielsweise untersuchten die unterstützende Funktion sprachlicher Prozesse auf die visuelle Kognition im frühen Kindeshalter, speziell das Binding von Eigenschaften in Farb-Ort-Konjunktionen. Vierjährige sahen zunächst ein Zielobjekt (z. B. ein Quadrat, das links rot und rechts blau war) und wurden dann nach einer kurzen Verzögerung aufgefordert, dieses Zielobjekt in einer Ansammlung von ähnlichen Objekten zu finden, die auch das genaue Spiegelbild des Zielobjekts enthielten (links blau, rechts rot). Die Kinder machten viele Fehler bei dieser Aufgabe, insbesondere dadurch, dass sie versehentlich die Spiegelbilder des Zielobjektes aussuchten. Die Leistung bei dieser Aufgabe konnte nun entscheidend verbessert werden, wenn die Zielobjekte für die Kinder zusätzlich sprachlich beschrieben wurden (z. B. „Rot ist links“), nicht aber wenn Eigenschaften des Zielobjekts nicht-sprachlich hervorgehoben wurden (z. B. durch Blinken oder durch bestimmte Pfeile). Die positive Wirkung sprachlicher Beschreibung verschwand auch, wenn die sprachlichen Beschreibungen nicht auf die Relation zwischen Farbe und Richtung Bezug nahmen, sondern einen anderen Aspekt betonten (z. B. „Rot grenzt an Blau an“). Die Autoren interpretieren diese Ergebnisse als Beleg für die Hypothese, dass Sprache ein nützliches kognitives Hilfsmittel darstellt, insbesondere wenn es darum geht, komplexe visuelle Inhalte im Gedächtnis zu behalten. Bei vierjährigen Kindern kommt es offensichtlich zumindest bei diesen komplexen geometrischen Formen nicht automatisch zur korrekten Versprachlichung, so dass sich die Hilfestellung in diesem Aspekt als nützlich erwies. Für die Hypothese, dass die korrekte Versprachlichung im Erwachsenenalter automatisch aktiviert wird, spricht auch, dass die Leistung erwachsener Probanden bei derselben Aufgabe dramatisch absinkt, wenn sie nebenher sinnlose Silben vor sich hinsagen müssen und dadurch die mentale Versprachlichung unterdrückt wird.

Zusammenfassend lässt sich festhalten, dass die sprachliche Kognition offenbar eine wichtige Rolle für die nicht-sprachliche Kognition spielen kann. Sprachliche Repräsentationen werden herangezogen, selbst wenn es die experimentelle Aufgabe nicht erfordert, und in vielen Fällen lassen sich Leistungseinbußen verzeichnen, wenn eine sprachliche Enkodierung der relevanten Sachverhalte unmöglich ist, sei es weil das Sprachsystem durch eine verbale Doppelaufgabe bereits ausgelastet ist, oder weil die Probanden nicht über die entsprechenden sprachlichen Mittel verfügen.

Wie lassen sich nun aber diese Befunde zu den Überlegungen hinsichtlich der unterschiedlichen kognitiven Repräsentationsformate bei sprachlicher und nicht-sprachlicher Kognition in Bezug setzen? Bedauerlicherweise sind Überlegungen zum Repräsentationsformat in der Forschung zur Funktion von Sprache beim Denken weitestgehend unbeachtet geblieben. Unserer Meinung nach sprechen die in diesem Abschnitt berichteten Befunde jedoch eher für die Zwei-Format-Sichtweise, wonach sprachliche Repräsentationen grundsätzlich von einer anderen Art sind als nicht-sprachliche Repräsentationen. Denn warum sollten sprachliche Bedeutungsrepräsentationen eine so wichtige unterstützende Funktion für nicht-sprachliche kognitive Prozesse besitzen, wenn sie nicht ein neues, möglicherweise stabileres und effizienteres Repräsentationsformat zur Verfügung stellen würden?

Wir wollen uns nun der zweiten Forschungsrichtung zuwenden, die sich in der aktuellen sprachpsychologischen Literatur mit dem Zusammenspiel von sprachlicher und nicht-sprachlicher Kognition beschäftigt. Hier geht es nun vornehmlich um die Implikationen der Ein-Format-Sichtweise und um die Annahme, dass beim Sprachverstehen ähnliche Repräsentationsformate involviert sind wie bei der nicht-sprachlichen Kognition. Erklärungsmöglichkeiten auf der Basis der Zwei-Formate-Sichtweise werden in der aktuellen Forschung bedauerlicherweise weitgehend außer Acht gelassen.

Die Rolle basaler nicht-sprachlicher Prozesse beim Sprachverstehen

Die Art und Weise wie Bedeutung von sprachlichen Ausdrücken erfasst wird, unterscheidet sich drastisch zwischen den beiden Sichtweisen, die im dritten Abschnitt dargestellt wurden. Wie oben schon betont, geht die traditionelle Zwei-Formate-Sichtweise davon aus, dass das modale System für die Verarbeitung von sprachlicher Bedeutung unwesentlich ist; die symbolischen Bedeutungsrepräsentationen, auf denen kompositionale Regeln operieren, werden als amodal angesehen. Dies steht im Gegensatz zur Ein-Format-Sichtweise, wonach alle höheren kognitiven Prozesse einschließlich der Berechnung von sprachlicher Bedeutung innerhalb des modalen Systems ablaufen. Obgleich beide Sichtweisen sicherlich prinzipiell plausibel sind, betrachten derzeit viele Wissenschaftler die Ein-Format-Sichtweise als besonders attraktiv, um die Entstehung von sprachlicher Bedeutung innerhalb des kognitiven Systems zu untersuchen. Die Attraktivität dieser Sichtweise kommt sicherlich teilweise dadurch zustande, dass die Annahme nur eines, generell verwendeten Repräsentationsformats als besonders sparsam angesehen wird. Diese Sichtweise erlaubt es außerdem, Konzepte und Methoden von der nicht-sprachlichen Domäne auf die sprachliche Domäne zu übertragen und somit neue wissenschaftliche Perspektiven zu eröffnen (Ulrich, Maienborn & Kaup, 2015). Ein Nachteil dieser psychologisch attraktiven Sichtweise ist allerdings, dass sich somit die psychologische Forschung zu Sprache vollkommen von der linguistischen Forschung abwendet und hierbei insbesondere die strukturellen Aspekte von Sprache außen vorgelassen werden. Um bei der Ein-Format-Sichtweise die Potentiale und Grenzen auszuloten, ist es unserer Meinung nach notwendig, die linguistische Forschung weiterhin zu integrieren.

Bedeutungskonstitution

Nach der Ein-Format-Sichtweise kommt sprachliche Bedeutung dadurch zustande, dass Gedächtnisspuren von Entitäten reaktiviert werden, wenn wir Wörter hören oder lesen, die sich auf diese Entitäten beziehen. So werden beispielsweise beim Lesen von Bewegungsverben wie „greifen“ oder „pusten“ ähnliche Gebiete des prämotorischen Cortex aktiviert wie beim Ausführen der entsprechenden Bewegungen (z. B. Hauk, Johnsrude & Pulvermüller, 2004) und nach dem Lesen eines Wortes wie „Bleistift“ oder „Tasse können bestimmte Handbewegungen leichter ausgeführt werden als andere, nämlich solche, die kompatibel zu den Bewegungen sind, mit denen der Referent typischerweise assoziiert ist (z. B. Bub et al., 2008). Wenn Wörter im Kontext von Phrasen oder Sätzen auftreten, so wird vermutet, dass die aktivierten Gedächtnisspuren so kombiniert werden, dass die entstehende Bedeutungsrepräsentation zur Bedeutung der Phrasen und Sätze passt – ein Sachverhalt der auch als Erfahrungssimulation (experiential simulation) bezeichnet wird (Kaup, Yaxley, Madden, Zwaan & Lüdtke, 2007). Tatsächlich zeigen sich Simulationseffekte auch beim Verstehen von Phrasen und Sätzen. Nach dem Lesen eines Satzes wie „Liza opened the pickle jar“ können Probanden beispielsweise schneller eine Drehung im Uhrzeigersinn vornehmen als ein Drehen entgegen dem Uhrzeigersinn, während das für Sätze wie „Louis sharpened the pencil“ genau umgekehrt ist (Zwaan & Taylor, 2006). Dieses Ergebnis passt gut zu der Annahme, dass die Probanden beim Lesen der Sätze die implizierte Bewegung mental simuliert haben und diese Simulation die nachfolgende Bewegung dann erleichtert oder erschwert, je nachdem ob es sich um kompatible oder inkompatible Bewegungen handelt.

Allerdings ist bei den meisten dieser Effekte nicht klar, ob sie tatsächlich auf satzbasierten Verstehensprozessen beruhen oder nur eine Reaktivierung von Gedächtnisspuren auf Wortebene reflektieren. Es kann also nicht zwingend geschlussfolgert werden, dass die Rezipienten tatsächlich beim Satzverstehen reaktivierte Gedächtnisspuren zu einer komplexen Simulation kombiniert haben. Darüber hinaus hat sich die Forschung bislang kaum mit den Mechanismen beschäftigt, die diesem Kompositionsprozess zugrunde liegen könnten. Entsprechend sind diese Mechanismen nach wie vor weitgehend ungeklärt. In anderen Worten, es ist nach wie vor unklar, wie nach der Ein-Format-Sichtweise Bedeutung auf Satzebene zustande kommt. Damit die Ein-Format-Sichtweise den Anspruch einer umfassenden Theorie der Kognition, insbesondere der sprachlichen Kognition einlösen kann, muss diese Sichtweise hinsichtlich der Mechanismen der Bedeutungskomposition ausgebaut werden. Außerdem muss die Kernhypothese dieser Sichtweise empirisch untermauert werden, wonach modale Repräsentationen die einzige Art der Bedeutungsrepräsentation sind. Ohne die entsprechende empirische Evidenz ist und bleibt die Annahme, dass der Kompositionsprozess exklusiv auf modalen Repräsentationen operiert, eine Spekulation. Bislang haben empirische Studien lediglich nachgewiesen, dass modale Repräsentationen bei der Sprachverarbeitung möglicherweise ko-involviert sind. Ungeklärt dabei ist, welche Rolle diese Repräsentationen für das Verstehen spielen. Prinzipiell können die meisten Ergebnisse auch innerhalb der Zwei-Formate-Sichtweise erklärt werden, wenn man annimmt, dass die Aktivierung modaler Repräsentationen ein Epi-Phänomen des Sprachverstehens ist, und so zum Verstehen funktional keine Relevanz besitzt. Dieser Gedanke wird häufig auch als motorische Resonanz bezeichnet (Taylor & Zwaan, 2008).

Abstrakte Konzepte

Ein Gegenstandsbereich, der für die Ein-Format-Sichtweise eine Herausforderung darstellt, sind abstrakte Konzepte. Zunächst ist schwer vorstellbar, wie abstrakte Konzepte, wie etwa Gerechtigkeit, Entropie, imaginäre Zahlen oder Bruttosozialprodukt, sich in modalen Repräsentationen darstellen lassen. In der Zwei-Format-Sichtweise (Anderson, 1996; Newell, 1990) wird angenommen, dass abstrakte Konzepte durch Relation zu anderen Konzepten in einem vom modalen System getrennten amodalen Gedächtnissystem spezifiziert werden. Eine solche Vorstellung führt allerdings schnell zu dem Problem eines „infiniten Regresses“ und zur Zirkularität. Manche Wissenschaftler gehen daher davon aus, dass abstrakte Konzepte in sensomotorischen und räumlichen Erfahrungen, die auf Interaktionen in der Umwelt beruhen, verknüpft sein müssen, um Bedeutung erlangen zu können (Barsalou, 2008). In anderen Worten, abstrakte Konzepte bauen auf konkreten Konzepten auf.

Ein prominentes Beispiel hierfür ist die Annahme, dass unsere Vorstellungen über Zeit, was die Drosophila für abstrakte Konzepte darstellt, an unsere räumlichen Erfahrungen anknüpfen und darauf aufbauen, da räumliche Erfahrungen reichhaltig und konkret sind (Bender & Beller, 2014; Clark, 1973;Núñez & Cooperrider, 2013). In der angelsächsischen Literatur wird diese Hypothese oft als space-time metaphor bezeichnet (Gentner, Imai & Boroditsky, 2002). Es gibt mittlerweile tatsächlich viele Anhaltspunkte dafür, dass unsere Repräsentation von Zeit auf der Repräsentation von Raum aufbaut und beide stark miteinander verknüpft sind (Eikmeier, Schröter, Maienborn, Alex-Ruf & Ulrich, 2013).

Ein Hinweis ist, dass in den meisten, vielleicht sogar in allen Sprachen der Welt das zeitbezogene Vokabular aus dem räumlichen Vokabular hervorgeht (Haspelmath, 1997; Lakoff & Johnson, 1980;Núñez & Cooperrider, 2013). Beispielsweise bezeichnet der Ausdruck „nach vorne“ im Satz „Claudia schiebt die Kommode nach vorne“ eine räumliche Veränderung, die sich beobachten lässt. Im Satz „Claudia verschiebt den Termin nach vorne“ hingegen beschreibt „nach vorne“ eine zeitliche Veränderung, die sich zwar vorstellen aber nicht beobachten lässt. Im temporalen Fall stellen wir uns die Terminverschiebung als eine räumliche Veränderung auf einem eindimensionalen Zeitstrahl vor (vgl. dazu Kleins Annahmen zum sogenannten basic time concept, Klein, 1994). Auch konnten Boroditsky und Kollegen in einer Reihe von Untersuchungen nachweisen, dass räumliche Erfahrungen die Verarbeitung von zeitlicher Information beeinflussen (Boroditsky, 2000; Boroditsky & Ramscar, 2002; Gentner et al., 2002). Eine solche Interferenz zwischen räumlichen und zeitlichen Vorstellungen lässt sich gut im Rahmen der Ein-Format-Sichtweise verstehen.

Allerdings lässt sich aufgrund solcher Befunde nicht folgern, dass zeitliche Gegebenheiten sich nicht auch ohne eine mentale Abbildung auf räumliche Gegebenheiten verstehen lassen. Daher ist es wichtig herauszufinden, ob das Verstehen von abstrakter Information funktional an die Aktivierung konkreter räumlicher Erfahrungen gebunden ist. Bisherige Untersuchungen, die auf diese Frage beim Satzverstehen abzielen, zeigen zwar Interaktionseffekte zwischen Raum und Zeit, jedoch verschwinden diese Effekte, wenn die zeitliche Dimension relevant für das Verstehen der Sätze, jedoch irrelevant für die experimentelle Aufgabe ist. Dies deutet darauf hin, dass die räumliche Dimension nicht automatisch bei der Verarbeitung von Sätzen mit zeitlichem Bezug aktiviert wird und lässt daher Zweifel aufkommen, ob Raum für das Verständnis von Zeit funktional relevant ist (Ulrich & Maienborn, 2010; Ulrich et al., 2012; siehe jedoch Sell & Kaschak, 2011). Zudem zeigt eine neuere Studie (De la Fuente, Santiago, Román, Dumitrache, & Casasanto, 2014), dass sich die räumliche Vorstellung über Zeit nicht zwangsläufig mit unseren sprachlichen Raum-Zeit-Metaphern übereinstimmt, sondern vielmehr durch unsere Aufmerksamkeit geprägt wird (z. B. nicht die Zukunft liegt „vorne“, sondern die zeitlichen Sachverhalte – vergangene oder zukünftige – auf die unsere Aufmerksamkeit gerade gerichtet ist).

Ein anderes abstraktes Konzept, für das sich ähnliche Ergebnisse ergeben, ist Valenz. Nach der body-specificity Hypothese (Casasanto, 2009) ist „positiv“ bei Rechtshändern mit der rechten Seite und „negativ“ mit der linken Seite assoziiert. Untersuchungen beim Wortverständnis zeigen, dass eine Interaktion zwischen Valenz und Körperseite auftritt, wenn Personen die Valenz sprachlicher Stimuli beurteilen sollen. Dieser Effekt tritt jedoch nicht auf, wenn die experimentelle Aufgabe nur eine lexikalische Entscheidung erfordert, wobei die Valenz nicht mehr handlungsrelevant ist (De la Vega, Dudschig, De Filippis, Lachmair & Kaup, 2013; De la Vega, De Filippis, Lachmair, Dudschig & Kaup, 2012). Auch hier zeigt sich, dass diese Verknüpfung zwischen Raum und Valenz nicht automatisch bei der Verarbeitung entsprechender sprachlicher Stimuli aktiviert wird und somit ebenfalls die funktionale Relevanz der räumlichen Dimension in Frage gestellt ist. Eine Verknüpfung zwischen Valenz und Raum findet sich auch für andere räumliche Achsen, wie die sagittale und die vertikale Achse. Automatisch scheint diese Verknüpfung bei der vertikalen Achse insbesondere dann zu sein, wenn die Stimuli auf emotionale Zustände Bezug nehmen, die mit einer nach oben oder nach unten ausgerichteten Körperhaltung assoziiert sind (traurig vs. euphorisch; Dudschig, De la Vega & Kaup, 2015). In Bezug auf abstrakte Konzepte ist somit unklar, in wie weit die beobachteten Verhaltenseffekte tatsächlich eine sensomotorische Fundierung von abstrakten Konzepte implizieren.

Der Einfluss von basalen Prozessen auf Sprachverstehen

Um die Rolle basaler nicht-sprachlicher Prozesse beim Sprachverstehen angemessen bewerten zu können, sollte nicht nur die Interaktion von sprachlichen und nicht-sprachlichen Faktoren analysiert werden, sondern insbesondere der Einfluss von nicht-sprachlichen Prozessen auf das Sprachverstehen. Bislang liegen jedoch nur wenige Studien vor (z. B. Glenberg et al., 2008; Meteyard, Zokaei, Bahrami & Vigliocco, 2008; Yee, Chrysikou, Hoffman & Thompson-Schill, 2013), die diese Wirkrichtung von nicht-sprachlicher Kognition auf sprachliche Kognition adressiert haben, was entweder bedeutet, dass diese Wirkrichtung nicht vorhanden ist oder sich eben nur schwer nachweisen lässt. Beispielsweise mussten in der Studie von Glenberg et al. Probanden 600 Bohnen einzeln von einem großen Behälter in einen kleineren Behälter befördern. Die Bewegungsrichtung war dabei entweder weg oder hin zum Probanden. Nachdem alle Bohnen im Zielbehälter waren, wurden den Probanden Sätze präsentiert, in denen ein Transfer von einem konkreten Objekt oder abstrakter Information beschrieben wurde, wobei die Richtung des Transfers variiert wurde (z. B. „Andy gives you the pizza“ vs. „You give Andy the pizza“). Die Probanden sollten die Sätze auf ihre Sinnhaftigkeit hin überprüfen und es wurde die Zeit gemessen, die sie für dieses Urteil benötigten. Tatsächlich zeigte sich ein Einfluss der vorrausgehenden Bewegungsrichtung beim Bohnensortieren auf die Verarbeitungszeit der Sätze. Wurden beispielsweise die Bohnen von sich wegbewegt, so waren die Reaktionszeiten bei Sätzen, die eine Wegbewegung thematisieren, verlängert gegenüber Sätzen, die eine Hinbewegung thematisieren. Dieser Befund wurde von den Autoren als Evidenz dafür angesehen, dass das motorische System bei der Satzverarbeitung beteiligt ist. Mit anderen Worten, hier liegt ein Einfluss von nicht-sprachlichen Prozessen auf Sprachverstehen vor, was zu der Hypothese passt, dass Sprachverstehen an sensomotorische Prozesse gebunden ist.

In einer weiteren Studie (Yee et al., 2013) zeigte sich, dass die Geschwindigkeit, mit der Wörter als abstrakt oder konkret eingeteilt werden können, durch eine manuelle Nebentätigkeit beeinflusst wurde. Dieses Ergebnis wurde nur für Wörter wie z. B. „Bleistift“ beobachtet, mit deren Referenten häufig manuell interagiert wird, nicht aber für Wörter wie z. B. „Tiger“, für die dies nicht der Fall ist. Ein Kontrollexperiment mit einer mentalen Rotationsaufgabe zeigte jedoch die üblichen Interferenzeffekte für alle Wörter. Auch hier beeinflusste also die motorische Aufgabe die Verarbeitungsgeschwindigkeit der sprachlichen Stimuli und spricht damit wiederum für die Sicht, dass sensomotorische Prozesse Teil der Sprachverarbeitung sind.

Als Zwischenfazit lässt sich festhalten, dass mittlerweile eine Fülle von empirischer Evidenz vorliegt, die dafürspricht, dass modale Repräsentationen beim Sprachverstehen aktiviert werden. An der Annahme, dass modale Repräsentationen die einzigen Bedeutungsrepräsentationen sind, die beim Sprachverstehen eine Rolle spielen, kann jedoch aus verschiedenen Gründen gezweifelt werden. So konnte bislang unserer Meinung nach nicht überzeugend gezeigt werden, dass modale Repräsentationen bei der Sprachverarbeitung die Grundlage für die Bedeutungskomposition bilden und funktional für die Sprachverarbeitung sind. Aus diesem Grund sind wir der Ansicht, dass sich die Befunde zum Sprachverstehen im Rahmen der Zwei-Format-Hypothese besser erklären lassen, wonach die Bedeutungskomposition auf amodalen Repräsentationen basiert, und die Aktivierung von modalen Repräsentationen entweder ein Epiphänomen darstellt oder das Sprachverstehen unterstützt, indem konkrete erfahrungsbezogene Repräsentationen aktiviert werden.

Schlussfolgerung und theoretische Perspektiven

Eine zentrale Frage in der Kognitionspsychologie betrifft das Verhältnis zwischen sprachlicher und nicht-sprachlicher Kognition. Obgleich Sprache traditionell als ein eigenständiges Modul innerhalb des kognitiven Systems betrachtet wurde, mehren sich heute die Befunde, wonach die sprachliche Kognition enger mit der nicht-sprachlichen Kognition vernetzt ist als ursprünglich angenommen wurde. Diese Befunde stammen sowohl aus der Forschung zum Einfluss von Sprache auf Denken als auch aus der Forschung zur Bedeutung nicht-sprachlicher (sensomotorischer) Repräsentationen beim Sprachverstehen.

In dieser Arbeit haben wir zwei Sichtweisen zu den Repräsentationsformaten dargestellt, auf denen sprachliche und nicht-sprachliche Prozesse basieren. Obgleich beide Sichtweisen eine enge Beziehung zwischen sprachlicher und nicht-sprachlicher Kognition nahelegen, unterscheiden sie sich deutlich in der Art und Weise, wie Sprache innerhalb des kognitiven Systems eingebettet ist. Die Ein-Format-Sichtweise nimmt an, dass alle kognitiven Funktionen auf einem modalen Repräsentationssystem operieren. Ob, und wenn ja wie, sprachliche Prozesse andere kognitive Funktionen bereichern, ist ungeklärt und bislang von Vertretern dieser Sichtweise nicht untersucht worden. Aufgrund der Literatur, insbesondere im Bereich Sprache und Denken, greift dieser Ansatz unserer Meinung nach zu kurz, da sich nur schwer erklären lässt, warum sprachliche Prozesse oft nicht-sprachliche Prozesse unterstützen können, wenn sprachliche und nicht-sprachliche Prozesse ohnehin auf identischen Repräsentationsformen basieren und sich so gegenseitig nicht bereichern können.

Im Gegensatz dazu erscheint nach der Zwei-Format-Sichtweise eine solche Bereicherung sogar naheliegend. Es sind hierbei verschiedene Möglichkeiten denkbar. Eine naheliegende Möglichkeit geht davon aus, dass das Sprachsystem ein funktional eigenständiges Modul innerhalb des kognitiven Systems darstellt, welches alle Mechanismen und Repräsentationen beinhaltet, die für die Sprachverarbeitung notwendig sind, einschließlich der Repräsentation von Bedeutung. Das Sprachmodul könnte andere kognitive Prozesse dadurch unterstützen, dass es einen Mechanismus zur Verfügung stellt, der Informationen in einem amodalen System kombiniert und transformiert. Ein prominentes Beispiel hierzu ist das MUC (Memory, Unification, Control)-Modell von Hagoort, Hald, Bastiaansen und Petersson (2004). Das “unification center” in diesem Modell ist nicht nur zuständig für die Erzeugung von hierarchischen Strukturen innerhalb des Sprachmoduls, sondern unterstützt auch die nicht-sprachliche Kognition, zum Beispiel die Wahrnehmung von Handlungen, die Handlungsplanung und die visuelle Suche.

Auch die Forschung zum Grounded Cognition Ansatz lässt sich unserer Meinung nach eher mit der Zwei-Format-Sichtweise in Einklang bringen. Zwar zeigen mittlerweile viele Befunde, dass sensomotorische Repräsentationen beim Sprachverstehen aktiviert werden. Allerdings ergeben sich hier fundamentale Fragen, die bislang weitgehend ungelöst sind und zu wenig in der Forschung thematisiert werden. Beispielsweise ist offen, wie der Mechanismus der Bedeutungskomposition auf Basis modaler Repräsentation funktionieren kann, wie Bedeutung, die über die Erfahrung hinausgeht, in modalen Repräsentationen entstehen kann und in wieweit modale Repräsentation funktional für das Sprachverstehen sind. Unserer Meinung nach wäre eine Fülle von gezielter Evidenz zu diesen Fragen notwendig, um die Ein-Format-Hypothese der Alternativhypothese, die von zwei Repräsentationsformaten ausgeht, vorzuziehen. Eine Fokussierung auf die Ein-Format-Hypothese, wie sie derzeit in der kognitionspsychologischen Forschung zu beobachten ist, erscheint uns angesichts der derzeitigen Forschungsergebnisse und der vielen offenen Fragen zum Verhältnis von sprachlicher und nicht-sprachlicher Kognition vorschnell und daher als ein wissenschaftlicher Holzweg.

Diese Arbeit wurde von der Deutschen Forschungsgemeinschaft (SFB 833, Teilprojekte B4 und B7) gefördert. Wir bedanken uns für viele hilfreiche Diskussionen und Anregungen unserer Kolleginnen und Kollegen dieses Sonderforschungsbereichs „Bedeutungskonstitution“ und bei Carolin Dudschig sowie bei drei anonymen Gutachtern für wertvolle Hinweise.

Literatur

  • Anderson, J. R. (1996). The architecture of cognition. Mahwah, NJ: Lawerence Erlbaum Associates Inc. Google Scholar

  • Baddely, A. D. & Hitch, G. J. (1974). Working memory. In G. A. BowerEd., The psychology of learning and motivation: Advances in research and theory (pp. 47 – 89). New York: Academic Press. Google Scholar

  • Barsalou, L. W. (2008). Grounded cognition. Annual Review of Psychology, 59, 617 – 645. CrossrefGoogle Scholar

  • Bender, A. & Beller, S. (2014). Mapping spatial frames of reference onto time: A review of theoretical accounts and empirical findings. Cognition, 132, 342 – 382. CrossrefGoogle Scholar

  • Binder, J. R. & Desai, R. H. (2011). The neurobiology of semantic memory. Trends in Cognitive Sciences, 15, 527 – 536. CrossrefGoogle Scholar

  • Boroditsky, L. (2000). Metaphoric structuring: Understanding time through spatial metaphors. Cognition, 75, 1 – 28. CrossrefGoogle Scholar

  • Boroditsky, L. (2010). How the languages we speak shape the way we think: The FAQs. In M. J. SpiveyM. JoanisseK. McRaeEds., The Cambridge Handbook of Psycholinguistcs (pp. 615 – 632). Cambridge, MA: Cambridge University Press. Google Scholar

  • Boroditsky, L. & Ramscar, M. (2002). The roles of body and mind in abstract thought. Psychological Science, 13, 185 – 189. CrossrefGoogle Scholar

  • Boroditsky, L., Schmidt, L. A. & Phillips, W. (2003). Sex, syntax, and semantic. In D. GentnerS. GoldinEds., Language in mind: Advances in the Study of Language and Thought (pp. 61 – 79). Cambridge, MA: MIT Press. Google Scholar

  • Boutonnet, B., Dering, B., Viñas-Guasch, N. & Thierry, G. (2013). Seeing objects through the language glass. Journal of Cognitive Neuroscience, 25, 1702 – 1710. CrossrefGoogle Scholar

  • Brown, P. & Levinson, S. C. (1993). “Uphill” and “Downhill” in Tzeltal. Journal of Linguistic Anthropology, 3, 46 – 74. CrossrefGoogle Scholar

  • Bub, D. N., Masson, M. E. J. & Cree, G. S. (2008). Evocation of functional and volumetric gestural knowledge by objects and words. Cognition, 106, 27 – 58. CrossrefGoogle Scholar

  • Casasanto, D. (2009). Embodiment of abstract concepts: Good and bad in right- and left-handers. Journal of Experimental Psychology: General, 138, 351 – 367. CrossrefGoogle Scholar

  • Clark, H. H. (1973). Space, time, semantics and the child. In T. E. MooreEd., Cognitive development and the acquisition of language (pp. 27 – 63). New York: Academic Press. Google Scholar

  • Davidson, D. (1975). Thought and talk. In S. GuttenplanEd., Mind and Language, Wolfson College Lectures 1974 (pp. 7 – 23). Oxford: Clarendon. Google Scholar

  • De la Fuente, J., Santiago, J., Román, A., Dumitrache, C. & Casasanto, D. (2014). When you think about it, your past is in front of you: How culture shapes spatial conceptions of time. Psychological Science, 25, 1682 – 1690. CrossrefGoogle Scholar

  • De la Vega, I., De Filippis, M., Lachmair, M., Dudschig, C. & Kaup, B. (2012). Emotional valence and physical space: Limits of interaction. Journal of Experimental Psychology: Human Perception & Performance, 38, 375 – 385. CrossrefGoogle Scholar

  • De la Vega, I., Dudschig, C., De Filippis, M., Lachmair, M. & Kaup, B. (2013). Keep your hands crossed: The valence-by-left/right interaction is related to hand, not side, in an incongruent hand-response key assignment. Acta Psychologica, 142, 273 – 277. CrossrefGoogle Scholar

  • Dessalegn, B. & Landau, B. (2008). More than meets the eye: The role of language in binding and maintaining feature conjunctions. Psychological Science, 19, 189 – 195. CrossrefGoogle Scholar

  • Dove, G. (2009). Beyond perceptual symbols: A call for representational pluralism. Cognition, 110, 412 – 431. CrossrefGoogle Scholar

  • Dudschig, C., De la Vega, I. & Kaup, B. (2015). Emotion-specific activation of vertical space during language processing. Acta Psycholgica 156, 143 – 155. CrossrefGoogle Scholar

  • Eikmeier, V., Schröter, H., Maienborn, C., Alex-Ruf, S. & Ulrich, R. (2013). Dimensional overlap between time and space. Psychonomic Bulletin & Review, 20, 1120 – 1125. CrossrefGoogle Scholar

  • Fausey, C. M. & Boroditsky, L. (2011). Who dunnit? Cross-linguistic differences in eye-witness memory. Psychonomic Bulletin & Review, 18, 150 – 157. CrossrefGoogle Scholar

  • Fodor, J. A. (2008). LOT 2: The language of thought revisited. Oxford: University Press. CrossrefGoogle Scholar

  • Frank, M. C., Everett, D. L., Fedorenko, E. & Gibson, E. (2008). Number as a cognitive technology: Evidence from Pirahã language and cognition. Cognition, 108, 819 – 824. CrossrefGoogle Scholar

  • Frege, G. (1892). Über Sinn und Bedeutung. Zeitschrift für Philosophie und philosophische Kritik, 100, 25 – 50. Google Scholar

  • Gennari, S. P., Sloman, S. A., Malt, B. C. & Fitch, W. T. (2002). Motion events in language and cognition. Cognition, 83, 49 – 79. CrossrefGoogle Scholar

  • Gentner, D., Imai, M. & Boroditsky, L. (2002). As time goes by: Evidence for two systems in processing space → time metaphors. Language and Cognitive Processes, 17, 537 – 565. CrossrefGoogle Scholar

  • Gleitman, L. & Papafragou, A. (2013). Relations between language and thought. In D. Reisberg (Ed.), Handbook of cognitive psychology (pp. 504 – 523). New York: Oxford University Press. Google Scholar

  • Glenberg, A. M., Sato, M., Cattaneo, L., Riggio, L., Palumbo, D. & Buccino, G. (2008). Processing abstract language modulates motor system activity. The Quarterly Journal of Experimental Psychology, 61, 905 – 919. CrossrefGoogle Scholar

  • Gordon, P. (2004). Numerical cognition without words: Evidence from Amazonia. Science, 306, 496 – 499. CrossrefGoogle Scholar

  • Hagoort, P., Hald, L., Bastiaansen, M. & Petersson, K. M. (2004). Integration of word meaning and world knowledge in language comprehension. Science, 304, 438 – 441. CrossrefGoogle Scholar

  • Haspelmath, M. (1997). From space to time: Temporal advervials in the world’s languages. München: Lincom Europa. Google Scholar

  • Hauk, O., Johnsrude, I. & Pulvermüller, F. (2004). Somatotopic representation of action words in human motor and premotor cortex. Neuron, 41, 301 – 307. CrossrefGoogle Scholar

  • Hauk, O. & Pulvermüller, F. (2011). The lateralization of motor cortex activation to action-words. Frontiers in Human Neuroscience, 5, 149. CrossrefGoogle Scholar

  • Irmen, L. & Schumann, E. (2011). Processing grammatical gender of role nouns: Further evidence from eye movements. Journal of Cognitive Psychology, 23, 998 – 1014. doi: 10.1080/20445911.2011.596824 CrossrefGoogle Scholar

  • James, W. (1890). The principles of psychology. New York: (Dover Publ.). CrossrefGoogle Scholar

  • Kant, I. (1983). Anthropologie in pragmatischer Hinsicht. Ditzingen: Reclam. Google Scholar

  • Kaup, B., Yaxley, R. H., Madden, C. J., Zwaan, R. A. & Lüdtke, J. (2007). Experiential simulations of negated text information. Quarterly Journal of Experimental Psychology, 60, 976 – 990. CrossrefGoogle Scholar

  • Kintsch, W. & Dijk, T. A. van (1978). Toward a model of text comprehension and reproduction. Psychological Review, 85, 257 – 274. CrossrefGoogle Scholar

  • Klein, W. (1994). Time in language. London: Routledge. Google Scholar

  • Koch, S. C., Zimmermann, F. & Garcia-Retamero, R. (2007). El sol – die Sonne. Hat das grammatische Geschlecht von Objekten Implikationen für deren semantischen Gehalt? Psychologische Rundschau, 58, 171 – 182. doi: 10.1026/0033 – 3042.58.3.171 LinkGoogle Scholar

  • Lakoff, G. & Johnson, M. (1980). Metaphors we live by. Chicago: Chicago University Press. Google Scholar

  • Li, P. & Gleitman, L. (2002). Turning the tables: Language and spatial reasoning. Cognition, 83, 265 – 294. CrossrefGoogle Scholar

  • Lupyan, G. (2012). Linguistically modulated perception and cognition: The label-feedback hypothesis. Frontiers in Psychology, 3 (March), 1 – 13. Google Scholar

  • Lupyan, G., Rakison, D. H. & McClelland, J. L. (2007). Language is not just for talking: Redundant labels facilitate learning of novel categories. Psychological Science, 18, 1077 – 1083. CrossrefGoogle Scholar

  • Maier, M., Glage, P., Hohlfeld, A. & Abdel Rahman, R. (2014). Does the semantic content of verbal categories influence categorical perception? An ERP study. Brain and Cognition, 91, 1 – 10. CrossrefGoogle Scholar

  • Malt, B. C. & Wolff, P. (2010). Words and the mind: How words capture human experience. Oxford: Oxford University Press. CrossrefGoogle Scholar

  • Markman, A. B. & Dietrich, E. (2000). Extending the classic view of representation. Trends in Cognitive Sciences, 4, 470 – 475. CrossrefGoogle Scholar

  • Martin, L. (2014). Research Reports. American Anthropologist, 88, 418 – 423. CrossrefGoogle Scholar

  • Meteyard, L., Zokaei, N., Bahrami, B. & Vigliocco, G. (2008). Visual motion interferes with lexical decision on motion words. Current Biology, 18, R732–R733. CrossrefGoogle Scholar

  • Newell, A. (1990). Unified theories of cognition. Cambridge, MA: Harvard University. Google Scholar

  • Nuerk, H.-C., Weger, U. & Willmes, K. (2001). Decade breaks in the mental number line? Putting the tens and units back in different bins. Cognition, 82, B25–B33. CrossrefGoogle Scholar

  • Núñez, R. & Cooperrider, K. (2013). The tangle of space and time in human cognition. Trends in Cognitive Sciences, 17, 220 – 229. CrossrefGoogle Scholar

  • Paivio, A. (1986). Mental representations: A dual-coding approach. New York: Oxfor University Press. Google Scholar

  • Papafragou, A., Hulbert, J. & Trueswell, J. (2008). Does language guide event perception? Evidence from eye movements. Cognition, 108, 155 – 184. CrossrefGoogle Scholar

  • Piaget, J. (1923). The language and thought of the child (Trans. M. Gabain, 1955). Cleveland, OH: Meridian. Google Scholar

  • Pinker, S. (1999). How the mind works. Annals of the New York Academy of Science, 882, 119 – 127. CrossrefGoogle Scholar

  • Pixner, S., Moeller, K., Hermanova, V., Nuerk, H.-C. & Kaufmann, L. (2011). Whorf reloaded: Language effects of nonverbal number processing in first grade – A trilingual study. Journal of Experimental Child Psychology, 108, 371 – 382. CrossrefGoogle Scholar

  • Pullum, G. K. (1991). The great eskimo vocabluary hoax, and other irreverent essays on the study of language. Chicago: The University of Chicago Press. Google Scholar

  • Pyers, J. E. & Senghas, A. (2009). Language promotes false-belief understanding: Evidence from learners of a new sign language. Psychological Science, 20, 805 – 812. CrossrefGoogle Scholar

  • Rosch Heider, E. (1972). Universials in color naming and memory. Journal for Experimental Psychology, 93, 337 – 354. Google Scholar

  • Rosch Heider, E. & Oliver, D. C. (1972). The structure of the color space in naming and memory for two languages. Cognitive Psychology, 3, 337 – 354. CrossrefGoogle Scholar

  • Rothermund, K. (1998). Automatische geschlechtsspezifische Assoziationen beim Lesen von Texten mit geschlechtseindeutigen und generisch maskulinen Text-Subjekten. Sprache & Kognition, 17, 183 – 198. Google Scholar

  • Rueschemeyer, S.-A., Glenberg, A. M., Kaschak, M. P., Mueller, K. & Friederici, A. D. (2010). Top-down and bottom-up contributions to understanding sentences describing objects in motion. Frontiers in Psychology, 1, 183. CrossrefGoogle Scholar

  • Sell, A. J. & Kaschak, M. P. (2011). Processing time shifts affects the execution of motor responses. Brain and Language, 117, 39 – 44. CrossrefGoogle Scholar

  • Slobin, D. I. (2003). Language and thought online: Cognitive consequences of lingustic relativity. In D. GentnerS. Goldin-MeadowEds., Language in mind: Advances in the study of language and thought (pp. 157 – 191). Cambridge (MA): The MIT press. Google Scholar

  • Taylor, L. J. & Zwaan, R. A. (2008). Motor resonance and linguistic focus. Quarterly Journal of Experimental Psychology, 61, 896 – 904. CrossrefGoogle Scholar

  • Thierry, G., Athanasopoulos, P., Wiggett, A., Dering, B. & Kuipers, J.-R. (2009). Unconscious effects of language-specific terminology on preattentive color perception. Proceedings of the National Academy of Sciences of the United States of America, 106, 4567 – 4570. CrossrefGoogle Scholar

  • Ulrich, R., Eikmeier, V., De la Vega, I., Ruiz Fernandez, S., Alex-Ruf, S. & Maienborn, C. (2012). With the past behind and the future ahead: Back-to-front representation of past and future sentences. Memory & Cognition, 40, 483 – 495. CrossrefGoogle Scholar

  • Ulrich, R. & Maienborn, C. (2010). Left-right coding of past and future in language: The mental timeline during sentence processing. Cognition, 117, 126 – 138. CrossrefGoogle Scholar

  • Ulrich, R., Maienborn, C. & Kaup, B. (2015). Understanding the meaning of words and sentences: The role of non-linguistic processes. Acta Psychologica, 156, 97. CrossrefGoogle Scholar

  • Whorf, B. L. (1956). Language, thought and reality; Selected writings of Benjamin Lee Whorf. Cambridge, MA: The MIT Press. Google Scholar

  • Winawer, J., Witthoft, N., Frank, M. C., Wu, L., Wade, A. R. & Boroditsky, L. (2007). Russian blues reveal effects of language on color discrimination. Proceedings of the National Academy of Sciences of the United States of America, 104, 7780 – 7785. CrossrefGoogle Scholar

  • Wittgenstein, L. (1922). Tractatus logico-philosophicus (Vol. 41). London: Kegan Paul. Google Scholar

  • Wolff, P. & Holmes, K. J. (2011). Linguistic relativity. Wiley Interdisciplinary Reviews: Cognitive Science, 2, 253 – 265. CrossrefGoogle Scholar

  • Yee, E., Chrysikou, E. G., Hoffman, E. & Thompson-Schill, S. L. (2013). Manual experience shapes object representations. Psychological Science, 24, 909 – 919. CrossrefGoogle Scholar

  • Zwaan, R. A. (2014). Embodiment and language comprehension: Reframing the discussion. Trends in Cognitive Sciences, 18, 229 – 234. CrossrefGoogle Scholar

  • Zwaan, R. A. & Taylor, L. J. (2006). Seeing, Acting, Understanding: Motor Resonance in Language Comprehension. Journal of Experimental Psychology: General, 135, 1 – 11. CrossrefGoogle Scholar

  • Zwaan, R. A., Taylor, L. J. & Boer, M. de (2010). Motor resonance as a function of narrative time: Further tests of the linguistic focus hypothesis. Brain and Language, 112, 143 – 149. CrossrefGoogle Scholar

1Manchmal wird zwischen einer starken und schwachen Form dieser Hypothese unterschieden, wonach nach der starken Form, wie bei der Kantschen Sichtweise, Denken durch Sprache bestimmt ist und nach der schwachen Form Sprache lediglich das Denken beeinflusst.

2Historisch wurde vornehmlich die Beziehung zwischen Sprache und Denken und nicht die zwischen sprachlicher und nicht-sprachlicher Kognition thematisiert. Allerdings wurden in der Forschung zu Sprache und Denken von Anfang an der Einfluss von Sprache auf basale kognitive Prozesse untersucht, wie z. B. auf die Diskrimination von Farben oder die Wahrnehmung von Raum. Daher halten wir die Unterscheidung zwischen sprachlicher und nicht-sprachlicher Kognition für angemessener. In dieser Arbeit verwenden wir beide Unterscheidungen mehr oder weniger äquivalent.

3Allerding ist bei dieser Art von kulturvergleichenden Studien zu beachten, dass es natürlich weitere Unterschiede außer der Sprache gibt, die möglicherweise für die gefundenen Gruppenunterschiede verantwortlich sein könnten.

Prof. Dr. Barbara Kaup, Prof. Dr. Rolf Ulrich, Universität Tübingen, Fachbereich Psychologie, Schleichstr. 4, 72076 Tübingen, E-Mail