Skip to main content
Free AccessKommentare

Kommentare zu R. Spanagel (2021): Replikationskrise in der präklinischen Suchtforschung und Vorschläge zur Krisenbewältigung

Published Online:https://doi.org/10.1024/0939-5911/a000723

Wie können wir die Robustheit, Reproduzierbarkeit und Prädiktivität präklinischer Forschung verbessern?

How Can We Improve the Robustness, Reproducibility, and Predictiveness of Preclinical Research?

Rainer Spanagel greift in seinem Positionspapier ein wichtiges Thema auf, das seit einigen Jahren nicht nur in der biomedizinischen Forschung intensiv diskutiert wird, die sogenannte „Replikationskrise“ (Spanagel, 2021). Dabei steht dieser Begriff für viel mehr als die Einsicht, dass auch teils hochranging publizierte experimentelle Befunde sich oftmals nicht unabhängig wiederholen lassen und sollte eine Replikation einmal gelingen, sind die gemessenen Effektstärken meist deutlich geringer als die initial publizierten. „Replikationskrise“ impliziert in dem Wissenschafts-intern geführten, und von der Öffentlichkeit mit Beunruhigung verfolgten Diskurs auch gleichzeitig einen ganz grundsätzlichen und oftmals pauschalen Verlust der Glaubwürdigkeit wissenschaftlicher Ergebnisse. Geht es doch um die Robustheit von Befunden, um die Frage wie sehr Verzerrungen („Bias“) oder Schwächen im experimentellen Design und insbesondere der statistischen Auswertungen zu Resultaten geführt haben, welche mehr die Erwartungen der Forscher als die Biologie der Erkrankung wiederspiegeln. Wenn dann noch nur jene Experimente veröffentlicht werden, in denen sich ein neuer Mechanismus oder eine neue Therapie als statistisch signifikant erwiesen hat (p< 0.05!) schließt sich der Kreis der wissenschaftlichen Selbsttäuschung.

Der Artikel hebt sehr richtig hervor, dass in dieser Selbsttäuschung wohl auch die Gründe zu suchen sind, warum oftmals in präklinischen Krankheitsmodellen scheinbar spektakulär wirksame, neue Therapien dann in der klinischen Prüfung versagen, warum Translation also häufig scheitert. Systematische präklinische Replikationen von Befunden sind bisher eine Seltenheit, erst beim Versuch der Übertragung auf den Menschen macht sich die oftmals zu geringe interne und externe Validität der präklinischen Forschung bemerkbar. Es verdichtet sich die Erkenntnis, dass eben nicht ganz prinzipielle biologische Unterschiede zwischen Tier und Mensch das Problem sind, sondern ein Mangel an Robustheit der präklinischen Befunde. Warum sollten wir erwarten, dass sich Ergebnisse vom Tier zum Menschen übertragen lassen, wenn die Übertragbarkeit von Labor zu Labor (also von Tier zu Tier) in Frage steht?

Aber was können wir tun, um die Reproduzierbarkeit und Translation präklinischer Studien zu verbessern? Rainer Spanagel macht hierfür 10 Vorschläge. Er lenkt unsere Aufmerksamkeit nicht nur auf Offensichtliches und auch in Guidelines Genanntes (Percie du Sert et al., 2020). Durchweg originell und nicht minder relevant ist sein Hinweis den fehlenden Placeboeffekt in Tierexperimenten zu korrigieren, die Empfehlung zur Evidenzsynthese in präklinischen systematischen Reviews und Metaanalysen, sowie der Vorschlag, DSM-5 bzw. ICD-11 basierte Tiermodelle zu verwenden.

Einige zusätzliche Gedanken mögen an dieser Stelle die Vorschläge des Autors unterstützen und erweitern. Zu Recht verweist er darauf, dass auch Negativbefunde veröffentlicht werden müssen. Vor einiger Zeit war dies in der Tat noch fast unmöglich, weil sich für solche Befunde keine Journale fanden, welche diese publiziert hätten. Mittlerweile existieren aber eine Reihe von Journalen, welche sich programmatisch der Veröffentlichung von Ergebnissen verschrieben haben, welche relevante Fragen mit kompetenten Methoden untersuchen. Bei PeerJ, F1000 Research, PLOS ONE basieren die Auswahl der Artikel zur Veröffentlichung ausschließlich auf der Feststellung der wissenschaftlichen und methodischen Fundiertheit, nicht auf subjektiven Evaluationen von „Impact“, „Neuheit“ oder „Interesse“. Seit einiger Zeit bieten auch immer mehr Journale das Format „Registered Report“ (Chambers, 2019) an. Ein Registered Report ist eine Form eines wissenschaftlichen Originalartikels, bei dem Methoden und vorgeschlagene Analysen bereits vor der Durchführung der Forschung vorregistriert und von Experten begutachtet werden. Hochwertige Protokolle werden dann vor Beginn der Datenerfassung vorläufig zur Veröffentlichung angenommen (Stufe 1). Sobald die Studie abgeschlossen ist, stellt der Autor den Artikel einschließlich Ergebnis- und Diskussionsabschnitt fertig (Stufe 2). Dieser wird von den Gutachtern begutachtet, und sofern die notwendigen Bedingungen erfüllt sind, ist die Veröffentlichung praktisch garantiert. Registered Reports haben damit eine Reihe positiver Effekte gleichzeitig, wirken sie doch u. a. dem Publikationsbias entgegen, verhindern auch nicht offengelegte Anpassung von Hypothesen oder Analysen, und helfen Autoren dabei, ihre Methodik auf Grund von Gutachterhinweisen zu verbessern, bevor die Studie begonnen hat und es damit zu spät wäre.

Der Autor weist zu Recht darauf hin, dass die Translation der Effektstärke von präklinischen Untersuchungen durch den fehlenden Placeboeffekt überschätzt werden könnte. Es muss an dieser Stelle auf einen weiteren, vermutlich noch substantielleren Grund für die Inflation von Effektstärken in der präklinischen Literatur hingewiesen werden: Die häufig zu geringen Fallzahlen. Es muss davon ausgegangen werden, dass aufgrund niedriger statistischer Power reale Effekte um mindestens 50 % überschätzt werden (Colquhoun, 2014). Dies bedeutet auch, dass Pilotexperimente, welche zum Zweck informierter Fallzahlabschätzung von Studien durchgeführt werden, zur Unterschätzung der nötigen Fallzahlen führen. Auch muss darauf hingewiesen werden, dass ungenügende statistische Power nicht nur die Wahrscheinlichkeit von falsch negativen (Typ II Fehler), sondern auch die von falsch positiven Resultaten (Typ I Fehler) erhöht, und damit einen weiteren Grund für die Nichtreproduzierbarkeit auch in Studien mit vermeintlich ausreichender Fallzahl darstellt.

Zu guter Letzt möchte ich darauf hinweisen, dass Replizierbarkeit natürlich nicht 100 % sein kann. Forschung an den Grenzen des bisher Bekannten („cutting edge“) muss notwendigerweise eine geringe Vortestwahrscheinlichkeit („prior probability“, „base rate“) haben. Gemeinsam mit in der Biomedizin realistisch zu erreichenden Typ I und Typ II Fehlerraten von 1 bzw. 20 % führt dies selbst ohne Bias bzw. niedriger interner Validität zu falsch-positiv Raten von über 50 %. Diese falsch Positiven müssen dann in Studien mit hoher interner Validität und ausreichenden Fallzahlen eliminiert werden (Dirnagl, 2020). Es gibt also so etwas wie eine „notwendige“ Nichtreproduzierbarkeit (Dirnagl, 2019), und eine unbedingt zu vermeidende, welche das Resultat von niedriger experimenteller Qualität (zu niedrige Fallzahlen, fehlende Verblindung oder Randomisierung, statistische Fehler etc.) ist. Letzteres zu vermindern oder gar zu verhindern ist das Ziel der sehr unterstützenswerten 10 Punkte von Rainer Spanagel. Die gute Nachricht ist, dass derzeit international große Anstrengungen von Wissenschaftlern, Journalen, Institutionen und Fördergebern darauf gerichtet werden, die dort beschriebenen Maßnahmen umzusetzen, auch in Trainings- und Ausbildungsformaten.

Replikationskrise: Anlass zum Überdenken der Anreizstruktur in der Wissenschaft

Replication Crisis: Reason to Rethink the Incentive Structure in Science

Im Positionspapier „Replikationskrise in der präklinischen Suchtforschung und Vorschläge zur Krisenbewältigung“ diskutiert Prof. Rainer Spanagel (2021) Gründe dafür, dass wissenschaftliche Ergebnisse häufig nicht „einfach“ repliziert werden können und die Translation vom Tiermodell in klinische Studien sowie in die Patientenversorgung nur viel zu selten möglich ist. Er schlägt unter anderem Gegenmaßnahmen in einem 10-Punkteplan für präklinische Suchtforschung vor. Die erfolgreiche Implementierung dieser Gegenmaßnahmen wird die Replikations- und Translationschancen von präklinischen Befunden definitiv erhöhen.

Auch in der klinischen Forschung werden viele der Punkte diskutiert und entsprechende Gegenmaßnahmen von Wissenschaftlern sowie Drittmittelgebern, Journalen und auch Gesetzen gefordert. Trotzdem ist die Replikationskrise alles andere als überwunden, unter anderem weil die Gegenmaßnahmen nur inkonsequent angewandt werden.

Wieso erfolgt deren Implementierung nur verzögert und unvollständig?

Eine Ursache liegt in den zum Teil fehlleitenden Anreizstrukturen für Wissenschaftler (Nosek, Spies & Motyl, 2012). Die Leistung von Wissenschaftlern wird wesentlich auch über die Anzahl von Zitationen bestimmt. Dies fördert die Publikation möglichst aufmerksamkeitswirksamer, neuartiger und vor allem positiver Befunde, also von Studien mit „signifikanten“ Ergebnissen. Diese werden häufiger zitiert. Studien mit einem starken Fokus auf Replizierbarkeit werden in diesem Anreizsystem unter anderem aufgrund des höheren Ressourcenbedarfs benachteiligt. Aktuelle Ergebnisse von Serra-Garcia und Gneezy (2021) zeigen einen Zusammenhang zwischen Zitationen und Replizierbarkeit. Publikationen, deren Ergebnisse nicht repliziert werden konnten, werden häufiger zitiert als solche, deren Ergebnisse erfolgreich repliziert werden konnten. Dies erstaunt auf den ersten Blick, sollten mehr Zitate doch auch höhere Replizierbarkeit als Qualitätsmerkmal anzeigen.

Wie lässt sich das Anreizsystem anpassen, sodass Replizier- und Translatierbarkeit an Bedeutung gewinnen?

Das Anreizsystem sollte mehr honorieren, wenn Wissenschaftler erfolgreich Maßnahmen zur Steigerung der Replizier- und Translatierbarkeit von Forschungsergebnissen unternehmen. Dies könnte dadurch geschehen, dass bei der Begutachtung von Qualifikationsarbeiten und Drittmittelanträgen sowie der Besetzung von Stellen explizit auch die Adhärenz der Wissenschaftler zu den von Prof. Rainer Spanagel (2021) genannten Punkten beurteilt wird. Journale könnten als positiven Anreiz auch vermehrt Qualitätskennzeichen wie eine Präregistrierung prominent auf den Publikationen positionieren. Redakteure, Gutachter und Wissenschaftler sollten mehr auf eine korrekte Interpretation sowie Diskussion der Ergebnisse im Hinblick auf explorative Analysen und konfirmatorische Hypothesentestung achten. Auch die Nennung der begutachtenden Wissenschaftler und des Editors im Artikel könnte zu einer Verbesserung führen (Serra-Garcia & Gneezy, 2021). Die Favorisierung registrierter Berichte (registered reports) im Anreizsystem würde der Replikationskrise ebenfalls entgegenwirken ( Serra-Garcia & Gneezy, 2021). Diese Methode erhöht die Transparenz und reduziert den Publikationsbias (Allen & Mehler, 2019).

Ressourcenknappheit und die Bedeutsamkeit des Schutzes der Privatsphäre von Studienteilnehmer_innen als mögliche Hindernisse bei der Umsetzung von Open-Science-Maßnahmen

Lack of Resources and the Importance to Protect Study Participants’ Privacy as Possible Hindrances to Implement Open-Science-Measures

Die Replikationskrise hält die Psychologie und andere Disziplinen seit Jahren in Atem. Rainer Spanagel (2021) gibt in seinem Artikel eine gute Übersicht über den aktuellen Stand und diskutiert zentrale Aspekte der Replikationskrise im Kontext der Suchtforschung. Dieses Ansinnen ist ohne Zweifel bedeutsam, da auch dieser wichtige Zweig der psychologischen und psychiatrischen Forschung von der Replikationskrise betroffen ist. Ich möchte das Format dieses Kommentars nutzen, um ein paar Aspekte aus Spanagels Arbeit zu vertiefen bzw. zu ergänzen.

Am Ende seines Artikels schlägt Spanagel (2021) einige Maßnahmen vor, um die Replikationskrise in den Griff zu bekommen. Zu den Strategien gehören wesentliche Punkte wie die Präregistrierung einer Studie, das Durchführen von Power-Analysen und das (öffentliche) Zurverfügungstellung von Forschungsdaten aus Gründen der Transparenz sowie für die weitere wissenschaftliche Verwendung in Meta-Analysen. Eine weitere Maßnahme zur Lösung der Replikationskrise stellt auch die vermehrte Durchführung von Replikationsstudien dar.

Nach meiner Einschätzung eignen sich diese vorgeschlagenen Strategien allesamt, um den wissenschaftlichen Prozess und Erkenntnisgewinn zu verbessern. Allerdings entstehen durch das Umsetzen dieser Maßnahmen auch Kosten, wenn man die Perspektive der Wissenschaftler_innen sowie der Studienteilnehmer_innen einnimmt. Solche Kosten können ein Hindernis bei der Umsetzung von Open-Science-Maßnahmen als auch bei der Durchführung von Replikationsstudien darstellen und müssen deswegen im Detail adressiert werden.

Ich weiß aus eigener Erfahrung, dass das Befolgen von Open-Science-Maßnahmen sehr ressourcenintensiv ist. Die Registrierung eines Forschungsvorhabens auf einem Portal, wie dem Open-Science-Framework (osf.io – als prominente Ergänzung zu den vorgestellten Plattformen in Spanagels Artikel), kann schnell mehrere Stunden in Anspruch nehmen. Auch das Aufbereiten der Datensätze für die wissenschaftliche Community stellt einen sehr ressourcenintensiven Prozess dar. Schließlich muss eine Datei, die online begleitend zu einem Artikel verfügbar ist, für Außenstehende selbsterklärend sein. Zudem sind viele Datensätze von ihrer Datengröße her sehr umfangreich, so dass durchaus monetäre Kosten für eine Arbeitsgruppe entstehen können, wenn man diese Datensätze nachhaltig auf Servern für die Allgemeinheit bereitstellen möchte.

Ein weiteres Problem des öffentlichen Bereitstellens von Daten stellt aus Sicht der datenerhebenden Wissenschaftler_innen sicherlich die Weiterverwertbarkeit der Daten dar. Wenn ein Wissenschaftler oder eine Wissenschaftlerin noch nicht alle relevanten Fragestellungen mit Hilfe des Datensatzes beantwortet hat, kann schnell der Zweifel aufkommen, ob die online bereitgestellten Daten nicht von anderen Wissenschaftlern und Wissenschaftlerinnen für die Beantwortung der gleichen Fragestellung genutzt werden. Hier scheint es mir wichtig, ein entsprechendes Rahmenwerk zu schaffen, welches sicherstellt, dass die Wissenschaftler_innen, die ursprünglich den Großteil des Aufwands mit Hinblick auf Idee einer Studie, Finanzierung der Studie, Ethikantrag schreiben und Datensammeln hatten, nicht in einen Nachteil geraten.

Wie lässt sich nun der entstehende Mehraufwand bzw. lassen sich die entstehenden Mehrkosten durch die Open-Science-Maßnahmen auf Wissenschaftler_innen-Seite belohnen, um die Open-Science-Maßnahmen in der Psychologie und Psychiatrie als Standard zu etablieren? Und wie sieht eine solche Belohnungsagenda jenseits der intrinsischen Motivation der Wissenschaftler_innen aus, immer die bestmögliche Forschung machen zu wollen? Meiner Ansicht nach braucht es unter anderem flankierende Maßnahmen in Berufungsverfahren und bei den Fachzeitschriften.

Zum aktuellen Stand: Erfreulicherweise sieht man bereits heute vermehrt in Berufungsverfahren in der Psychologie, dass die Bewerber_innen Stellung dazu nehmen müssen, in wie weit sie in ihren Arbeiten Open-Science-Strategien verfolgen. Damit stellt die Umsetzung von Open-Science-Maßnahmen sicherlich bald ein gängiges Berufungskriterium dar. Dies ist sehr begrüßenswert, da damit Open-Science-Praktiken ein größeres Gewicht mit Hinblick auf das Fortkommen in der eigenen Karriere bekommen.

Auf Seiten der Fachzeitschriften empfinde ich die Vergabe von Open-Science-Badges (https://www.cos.io/initiatives/badges) interessant, die das Vertrauen in die Arbeiten der Wissenschaftler_innen erhöhen und sich positiv auf die Zitierbarkeit des Artikels auswirken können. Diese Open-Science-Abzeichen zeigen für einen wissenschaftlichen Artikel an, ob eine Arbeit vorregistriert wurde, und ob die (Roh-) Daten als auch weitere Materialien (z. B. in einer Studie verwendete Fragebögen) in einem Online-Repositorium frei zugänglich hinterlegt worden sind. Top-Journale der Psychologie wie das European Journal of Personality erwarten sogar mittlerweile, dass “all authors have to confirm that their manuscript explicitly deals with open science issues“ (European Journal of Personality, n. d.). Wenn sich alle Fachzeitschriften so verhielten, könnten nur noch Studien veröffentlicht werden, die relevante Kriterien der Open-Science-Bewegung unterstützen.

Wie kurz oben erwähnt, wird seit Jahren auch über die Bedeutsamkeit von Replikationsstudien zur Absicherung von wissenschaftlichen Erkenntnissen diskutiert. Zweifelsohne ist es äußerst wichtig, dass Beobachtungen, die in einem Fachartikel berichtet wurden, in möglichst ähnlicher Art und Weise auch von unabhängig forschenden Personen gemacht werden. Gleiche Beobachtungen von unterschiedlichen Arbeitsgruppen untermauern die Belastbarkeit von Studienergebnissen (auch oder gar besonders in interkulturellen Settings, siehe Montag, 2018).

Trotz der hohen Wichtigkeit von Replikationsstudien, wurde die Durchführung solcher Replikationsstudien viele Jahre nur unzureichend belohnt. Für viele Wissenschaftler_innen scheint es übrigens auch heute noch für die eigene Karriere deutlich wertvoller zu sein, besonders neuartige Befunde zu publizieren. Dies hat einen Grund: Es ist immer noch schwierig in die Top-Fachzeitschriften eines Forschungsfelds mit einer Replikationsstudie zu kommen. Es wird in diesem Zusammenhang sogar von einem sozialen Dilemma für junge Forscher gesprochen (Everett & Earp, 2015), welches sich unter anderem zwischen dem Publizieren einer Replikationsstudie in einer niedrigen gerankten Fachzeitschrift und neuartigen Befunden in höher gerankten Fachzeitschriften abspielt.

Neben der Steigerung des Ansehens von Replikationsstudien muss sichergestellt werden, dass das Befolgen von ressourcenintensiven Open-Science-Praktiken und ihr möglicher negativer Einfluss auf die Quantität der sichtbaren Wissenschaftsleistungen keine Nachteile für die Karrieren von Jungwissenschaftler_innen bedeuten (Schönbrodt, 2019).

Einige Fachzeitschriften haben übrigens das Problem um die Replikationsstudien bereits erkannt und weisen explizit darauf hin, dass solche Replikationsstudien in ihren Outlets erwünscht sind. In diesem Zusammenhang verweise ich beispielhaft auf die Möglichkeit des Artikelformats „Registered Replication Reports“, welches auf der Webseite der Association for Psychological Science (n. d.) vorgestellt wird. Trotz dieser erfreulichen Anzeichen sollte insgesamt das Veröffentlichen von gut gemachten Replikationsstudien (noch) stärkeres Ansehen bekommen.

Dies führt mich zum letzten Punkt: Kosten entstehen durch das Durchführen von Open-Science-Maßnahmen nicht nur auf Seite der Wissenschaftler_innen, sondern auch auf Seite der Studienteilnehmer_innen. Auch wenn es meist noch nicht verpflichtend ist, die Rohdatensätze einem wissenschaftlichen Artikel öffentlich beizufügen, sollte doch klar sein, dass eine Bereitstellung solcher Daten die Privatsphäre der Studienteilnehmer_innen gefährden kann. Auf die offenkundigen Probleme durch das Bereitstellen von GWAS-Daten ohne Zugangsbeschränkung muss an dieser Stelle sicherlich nicht explizit eingegangen werden. Die Chancen der Re-Identifikation einer Person wären aufgrund der öffentlichen Bereitstellung solcher Daten deutlich erhöht und es muss hier von einem frei zugänglichen Zugriff abgesehen werden.

Probleme können aber auch entstehen, wenn Fragebogen-Daten „anonym“ bereitgestellt werden (ohne Klarname, etc.), sich aber durch die Kombination vorhandener Informationen wie Ort und Zeitpunkt der Datenerhebung in einem Artikel und dem Auftreten seltener Merkmale in einer Stichprobe (z. B. weniger Männer in Stichproben von Psychologiestudierenden) die Wahrscheinlichkeit einer Re-Identifikation erhöht. Grundsätzlich sollte auf einen ausgewogenen Trade-Off zwischen ausreichender Granularität der öffentlich bereitgestellten Daten und damit wissenschaftlichen Nutzen auf der einen Seite und ausreichendem Schutz der Privatsphäre der Studienteilnehmer_innen auf der anderen Seite geachtet werden. In diesem Zusammenhang sollten Wissenschaftler_innen bereits bei der Studienplanung im Hinterkopf behalten, dass der Zusammenhang zwischen der Granularität der öffentlich zu bereitstellenden Daten und der Privatsphäre der Studienteilnehmer_innen in einem inversen Zusammenhang stehen (siehe Abbildung 1). Um das unterschiedliche Granularitätsniveau zu illustrieren: Es macht einen Unterschied für die Möglichkeit der Re-Identifikation einer Person, ob das Alter beispielweise mit dem genauen Geburtsdatum erfasst wird oder nur das aktuelle Alter in Jahren oder eine noch gröbere Alterskategorie (zum Beispiel 41–50 Jahre) von dem Wissenschaftler oder der Wissenschaftlerin gewählt wird.

Abbildung 1 Wissenschaftler_innen müssen bei dem Bereitstellen von Daten für die Öffentlichkeit zwischen höchstmöglichem Schutz der Identität der Studienteilnehmer_innen und höchstmöglicher Transparenz der Studiendaten abwägen. Je höher die Granularität der bereitgestellten Daten, desto niedriger der Schutz der Studienteilnehmer_innen vor einer möglichen Re-Identifikation (ein theoretisches Modell).

Für die in diesem Kommentar diskutierten Punkte müssen alle Beteiligten im Wissenschaftsprozess sensibilisiert und auch in Ethikkommissionen darauf geachtet werden, dass über Re-Identifikationsmöglichkeiten im Sinne des Studienteilnehmer_innen-Schutzes im Zeitalter von Open Science verstärkt reflektiert wird. Zudem sollten die Studienteilnehmer_innen über das Bereitstellen ihrer Daten in einem Open-Science-Framework aufgeklärt werden und dem Prozedere explizit zustimmen. Diese Punkte sind gerade auch vor dem Hintergrund der Psychoinformatik-Bewegung von großer Bedeutung, wo vermehrt digitale Datenspuren zu psychodiagnostischen Zwecken berücksichtigt werden (Montag, 2019).

Die hier aufgeführten Kosten sollen bitte nicht so verstanden werden, dass Open-Science-Strategien in Zukunft nicht verstärkt umgesetzt werden. Im Gegenteil: Die von Spanagel (2021) vorgetragene Liste ist für die Suchtforschung im Humanbereich (als auch Tierbereich) sehr wichtig. Allerdings ist es bedeutsam, die Kosten auf Seite der Wissenschaftler_innen und Studienteilnehmer_innen möglichst zu reduzieren, damit Open-Science-Maßnahmen nachhaltig erfolgreich umgesetzt und so die Probleme der Replikationskrise in den Griff bekommen werden können. Dies bedeutet übrigens auch, dass sich Drittmittelgeber nicht nur auf erhöhte Studienkosten durch Open-Science-Praktiken einstellen müssen, sondern vermehrt Replikationsstudien fördern.

Suchtforschung: und die wachsende Einsicht in die Größe der Aufgabe

Addiction Research: And the Growing Realization of the Magnitude of the Task

Die wissenschaftliche Forschung ist in einer Replikationskrise. Belegt durch zahlreiche Umfragen, die ein gewisses Unbehagen der Wissenschaftler zu Tage bringen, und durch ökonomische Entwicklungen, die ein Auge allein auf die Ergebnisse dieser Forschung haben. Auch die Suchtforschung scheint davon betroffen zu sein. Zwar wachsen die Einsichten in die neurobiologischen und systemischen Mechanismen der Sucht stetig. Bei der Nutzung dieser Erkenntnisse, zum Beispiel bei der Entwicklung von breit wirksamen Pharmakotherapien, tut sich jedoch ein Graben auf. Angesichts der bereits sehr detaillierten Einsichten zu den neuropsychopharmakologischen Wirkungsmechanismen sollten eigentlich viel mehr und bessere Pharmakotherapien in der Entwicklung sein. Dass sie es nicht sind, verursacht nicht nur bei den Konsumenten der Forschung, den Anwendern, sondern auch bei den Forschern selber eine wachsende Unzufriedenheit hinsichtlich der Replizierbarkeit ihrer Befunde. Das kann man getrost als Zweifel an der Glaubhaftigkeit übersetzen. Die Pharmaindustrie, als einer der großen Endnutzer wissenschaftlicher Erkenntnisse, hat aufgrund des ausbleibenden ökonomischen Erfolgs ihre Bemühungen bei der Entwicklung neuer Pharmakotherapien der Sucht weitgehend eingestellt. Aber befinden wir uns wirklich in einer neuartigen Replikationskrise? Eine Verschlechterung einer Leistung, die früher einmal besser war? Oder sehen wir nur eine gemeinschaftliche Hysterie unter Wissenschaftlern angesichts der wachsenden Einsicht in die Größe der Aufgabe?

Vergewissert man sich nochmal, was eine empirische Forschung generell leisten soll. Wir wollen eine Beschreibung der Realität in einem Modell, dass möglichst viele Beobachtungen logisch kohärent in sich aufnimmt und Vorhersagen über die Zukunft erlaubt, die später auch eintreffen (Müller, 2018). Für die Suchtforschung würde das konkret bedeuten, wir wollen ein Modell, das beschreibt, wie alle in unseren diagnostischen Manualen klassifizierten Suchtverhalten und nichtklassifizierten subjektiven Erlebnisse durch soziale, biologische und pharmakologische Faktoren zu Stande kommen. Und wir wollen aus diesem Modell heraus Interventionen haben, welche in vorhersagbarer Weise dieses Verhalten und subjektiven Erlebnisse inhibieren, und idealerweise den Organismus wieder ohne Sucht ein normales Leben führen lassen. Das Modell zur Sucht sollte dabei die Struktur eines Naturgesetzes mit festen Ursache-Wirkungs-Beziehungen haben. Dabei gelten Naturgesetze immer in einem dafür definierten Rahmen und Geltungsbereich. Wenn nun neue Gesetzmäßigkeiten beschrieben werden, bedeutet das zwangsläufig auch immer, dass Annahmen oder Vorgaben zu deren Geltungsbereich gemacht werden. Etwas soll in unserem Universum gelten, in unserem Sonnensystem, auf der Erde, oder nur in lebenden Organismen, nur im Menschen, vielleicht sogar nur sein Verhalten betreffen (Müller, 2020). Jede neue Beschreibung einer Gesetzmäßigkeit, die zunächst in einer kleinen Stichprobe aus der Gesamtheit aller möglichen Fälle berichtet und später repliziert wird, ist damit auch immer eine Beschreibung ihrer Grenzen. Und wer mit diesen Gesetzen arbeiten will, sollte idealerweise diese Grenzen kennen. Die Erkenntnis einer Gesetzmäßigkeit ist auch immer die undankbare und frustrierende Erkenntnis ihrer Beschränktheit. Replikationen sind Wiederholung einer bereits beschriebenen Beobachtung, nur unter etwas veränderten Bedingungen (in der realen Welt sind sie niemals völlig identisch). Sie sind somit auch immer Grenztestungen. Gilt eine Beobachtung noch unter diesen Bedingungen, oder nicht? Wenn nun viele Replikationsversuche scheinbar „scheitern“, ist das möglicherweise nichts weiter als das zutage treten der Grenzen der untersuchten Gesetzmäßigkeit. Und diese sollte man besser nicht negieren, sondern vielmehr sich ihnen aktiv stellen. Ich möchte nicht so weit gehen und fordern, dass gescheiterte Replikationsversuche als Grenzen-Erkenntnisse gefeiert werden müssen, aber eine despektierliche Behandlung scheint hier genauso unangebracht. Fest steht allerdings bei der aktuellen Entwicklung der Bewertung wissenschaftlicher Forschung, dass sich die Wertschätzung und der Umgang mit scheinbar gescheiterten Replikationsversuchen ändern sollte. Ändern muss.

Die Lösungsvorschläge von Rainer Spanagel (2021) sind in diesem Zusammenhang sehr gut nachvollziehbar und wahrscheinlich auch mittelfristig schon umsetzbar. Allerdings greifen sie erst bei der konkreten Umsetzung der Forschung im Labor. Hier kann man vorsichtig fragen, ob das ausreichen wird. Wird es damit weniger gescheiterte Replikationen geben? Ein besseres Verständnis von Sucht? Bessere Pharmakotherapien, die von Patienten genutzt werden und auch ökonomisch Sinn machen? Möglicherweise sind noch andere Anstrengungen notwendig. Größere. Solche, die noch mehr an der Substanz unserer Forschung rütteln.

Umsetzung in der Forschungskultur

Wir sollten es uns erlauben, Sir Karl Popper’s kritischen Realismus und seine Forderungen an den Wissenschaftsbetrieb bei dieser Gelegenheit etwas zu erweitern. Und Falsifikationen, also gescheiterte Replikationsversuche, nicht mehr als das Stiefkind der Erkenntnis betrachten, sondern in die Beletage des Erkenntnisgewinns befördern. Nämlich dahin, wo die Grenzen jeder Gesetzmäßigkeit, jedes biomedizinischen Zusammenhangs ausgelotet werden. Denn die Grenzen eines Gesetzes sind genauso wichtig wie ihre Hauptstadt. Replikationen sind wichtig. Genauso sind es auch die fehlgeschlagenen Replikationen, die aber eine Grenzbeschreibung liefern. Eine Vermessung des Gesetzes. Letzteres ist das technisch aber nicht in Einzelpublikationen möglich; auch nicht in den wichtigen, aber stark verallgemeinernden (da Information reduzierenden) Metaanalysen. Hierfür bedarf es, nach wie vor, guter Review-Analysen, die sich den Grenzen der Gesetzmäßigkeiten widmen, und diese dann systematisch identifizieren.

Umsetzung in der Forschungsstrategie

Wie kann eine neue Replikationskultur langfristig implementiert werden? Neben den von Rainer Spanagel (2021) gemachten Vorschlägen, die alle zu begrüßen sind, wird es meiner Ansicht nach noch einer wichtigen Erweiterung bedürfen. Kurz gesagt: Nullresultate dürfen nicht mehr systematisch bestraft werden, so wie es gegenwärtig auf allen Ebenen der Forschung üblich ist. Stattdessen müssen sie konstruktiv in den Erkenntnisgewinn eingebunden werden. Forschungsförderer und Pharmaindustrie fördern bisher fast ausschließlich Erfolge, positive Daten, die spektakulär in high impact Journalen publiziert werden. Fehlgeschlagene Replikationen werden dagegen meist direkt oder indirekt bestraft. Forschungsförderung bleibt aus oder wird nicht verlängert. Gemessen wird der Erfolg oft anhand der Impact-Punkte der Journale, in denen publiziert wurde, als schnell verfügbaren Proxy-Marker für den erst weit in der Zukunft liegenden wirklichen Einfluss der Forschung. Ein wichtiger Beitrag zur konstruktiven Bewältigung der Replikationskrise sollte deshalb von dieser Seite kommen. Replikationen und das Aufzeigen ihrer Grenzen sind ein signifikanter Bestandteil des Erkenntnisgewinns. Sie brauchen deshalb auch einen Anteil an der Förderung. Deshalb sollten Replikationsversuche zur Testung der Grenzen eines beobachteten Befundes auch schon Teil eines jeden Forschungsprojektes werden. Bereits laufende multi-zentrische präklinische Studien können hier ein guter Start für eine verbesserte Förderkultur sein (https://www.sys-med.de/de/demonstratoren/target-​oxy/), müssten aber noch mehr Standard werden. Damit einhergehend muss sich aber auch die Erwartungshaltung der Fördernden und letztlich die Bewertung der Forschungsleistung ändern. Im Zweifelsfall sollten weniger Erkenntnisse, die aber bezüglich ihres Geltungsbereichs (Grenzen) gut abgesichert sind, solchen bevorzugt werden, die nur spektakuläre Effekte in einem weitgehend unklaren Geltungsbereich hervorbringen. Das dürfte letztlich sogar billiger werden, da diese Grenzen früher oder später ohnehin zutage treten und unter höherem Aufwand systematisch erfasst werden müssen.

Die Entscheidung, ob ein high-Impact Journal eine Arbeit zur Publikation annimmt, hängt ganz essenziell von der Anzahl der positiven Befunde ab. Das erzeugt wiederum einen Druck, möglichst viele davon für eine Arbeit zu generieren. Dabei spielt es fast keine Rolle, wie viele Negativresultate ebenfalls generiert wurden. Diese genauso wichtigen Daten landen dann meist in den, wenig einflussreichen Supplements der Artikel. Das einzelne Journale, die für diesen Zweck ins Leben gerufen wurden, bisher gescheitert sind, dürfte nicht zuletzt an der geringen Wertschätzung der wissenschaftlichen Gemeinschaft für die wenig spektakulären Null-Effekte oder die gescheiterten Replikationsversuche gelegen haben. Die von Rainer Spanagel angekündigte Initiative, im international führenden Fachjournal Addiction Biology auch einen Platz für Grenzbeschreibungen einzuräumen, wird deshalb ausdrücklich begrüßt. Und es bleibt zu hoffen, dass sich diese wichtige Erkenntniskommunikation vielleicht im Rahmen bereits arrivierter Journale einen breiteren Zugang zum Wissenschaftsbetrieb verschaffen kann. Jeder Editor und Gutachter eines wissenschaftlichen Artikels sollte bei der Bewertung einer wissenschaftlichen Arbeit stets im Blick behalten, ob nicht auch ein gescheiterter Replikationsversuch wichtige neue Erkenntnisse für die Festlegung der Grenzen der ursprünglichen Beobachtung enthält und eine hochrangige Publikation verdient.

Umsetzung in der Suchtforschung

Neben den eher systembedingten Herausforderungen für Erkenntnisgewinn und Replikation in den empirischen Wissenschaften gibt es auch konkrete Probleme in der Suchtforschung (Müller, 2018). Eine erhebliche Verbesserung dürfte nach Umsetzung der von Rainer Spanagel vorgeschlagenen Punkte zu erwarten sein. Ein identifiziertes Problem in der präklinischen Suchtforschung ist die Translation von präklinischen Modellen zu einer klinischen Anwendung bei Menschen. Trotz der immer weiter verbesserten Einsicht in die Entstehungsmechanismen und in die Folgen der Sucht, hat die Nutzung pharmakologischer Targets für die Therapieentwicklung in den letzten Jahrzehnten kaum Fortschritte gemacht. Es wurde eine Vielzahl pharmakologischer Targets identifiziert, die an der Entstehung und dem Aufrechterhalt von Süchten beteiligt sind (z. B. Müller & Homberg, 2015). Zudem wurden selektive Liganden für viele dieser Targets entwickelt und häufig auch an präklinischen Modellen erfolgreich getestet (z. B. König et al., 2020). Letzteres umfasste zumeist den Nachweis, dass eine vom Experimentator verabreichte Substanz zumindest eines der Sucht-assoziierten Verhalten im Tiermodell inhibieren kann. Daraus wurde dann abgeleitet, dass diese Substanz und der Wirkmechanismus potenziell zur Suchttherapie geeignet sein könnten. Bei diesem Vorgehen werden allerdings drei wesentliche Aspekte der Sucht und einer potenziellen Pharmakotherapie systematisch vernachlässigt. Sie bilden damit oft die Grenzen der therapeutischen Wirkung, was in der Regel die Translation auf eine der nächsten Entwicklungsstufen verhindert hat. Diese Probleme sollen hier kurz benannt und mögliche Lösungen vorgeschlagen werden:

  1. 1
    Die meisten pharmakologischen Suchttherapien werden in präklinischen Modellen an nicht-süchtigen Organismen getestet und validiert. Die neurowissenschaftliche Forschung hat aber gezeigt, dass die biologischen Mechanismen und die Wirkung eines Suchtstoffes eine völlig andere ist im Gehirn von kontrollierten Konsumenten im Vergleich zu Süchtigen (Müller & Homberg, 2015). Testet man nun eine Pharmakotherapie bei Tieren mit kontrolliertem Drogenkonsum und beschreibt zudem den Wirkungsmechanismus, so ist das Ergebnis häufig nicht automatisch für den süchtigen Organismus anwendbar. Eine horizontale Translation scheitert hier. Gelangt dann eine so validierte Substanz in die klinische Testung an Suchtpatienten, ist ein systematischer Translationsfehler im Prinzip vorprogrammiert. Die Lösung dafür könnte eine noch stärkere Fokussierung der Testinstrumente sein, in dem man klar zwischen Modellen mit kontrolliertem Konsum und solchen mit Sucht-artigem Konsum unterscheidet (Müller & Homberg, 2015). Während beide für das Verständnis der neurobiologischen Mechanismen der Sucht notwendig sind, erscheint nur letzteres für die Therapieentwicklung wirklich sinnvoll. Diese Modelle sind aufwendiger, sollten aber auch therapeutisch relevantere Ergebnisse liefern (Müller, 2018).
  2. 2
    Wie sollte eine Pharmakotherapie der Sucht aussehen? Es sollte sich idealerweise um eine Substanz handeln, die ein Suchtpatient freiwillig und bei Bedarf einnehmen kann und die einzelne oder alle Sucht-assoziierte Verhalten inhibiert und andere, nicht-Sucht-bezogene Verhalten fördert. Gesunde Personen sollten diese Substanz nicht einnehmen wollen, da sie sonst selber ein Suchtpotential haben könnte. Wichtig dabei ist, dass ein süchtiger Organismus tatsächlich bereit ist, diese Substanz selbst zu verabreichen. Tut er das nicht, so ist auch der pharmakologisch wirksamste Inhibitor in der Praxis nutzlos. Diese Anforderung würde in einer Rückwärts-Translation ein weiteres Kriterium an die präklinische Forschung definieren: die Testsubstanz muss nicht nur wirksam sein, sondern auch von süchtigen Tieren (und idealerweise nur von süchtigen Tieren) selbst-verabreicht werden.
  3. 3
    Viele Suchtdrogen werden in ihrer Wirkung instrumentalisiert. Das bedeutet, unter dem Einfluss der Droge werden andere, an sich nicht Substanz-bezogene Verhalten effektiver ausgeführt. Die Verstärkereffekte einer Droge generieren sich daher nicht nur aus den unmittelbaren pharmakologischen Effekten, sondern auch über einen zweiten Weg, indem ein anderes zielgerichtetes Verhalten effizienter wird und mehr Belohnung generiert (Müller & Schumann, 2011). Eine vielschichtige und sehr zielgerichtete Instrumentalisierung von Suchtdrogen wird bereits von nicht-süchtigen Konsumenten berichtet. Sie verändert sich bei der Suchtentstehung und trägt dann weiter zum Erhalt der Sucht bei (Müller, Mühle, Kornhuber & Lenz, 2021). Pharmakotherapien der Sucht können scheitern, da ein Verzicht auf den Konsum einer Droge eben nicht nur diesen selbst berührt, sondern auch die Instrumentalisierung stark beeinträchtigt. Die verringerte Effizienz anderer Verhalten, die bisher von der Droge profitiert haben (z. B. Alkohol zum Stress Coping), wird dann als zusätzlich aversives Ereignis wahrgenommen. Die Konsequenz ist neben dem pharmakologischen Suchtdruck auch noch ein funktionaler Konsumdruck (Müller & Kornhuber, 2017). Eine effektive Pharmakotherapie sollte dies berücksichtigen und entweder ein pharmakologisches Substitut zur Instrumentalisierung anbieten, oder gezielt auf die Pharmakotherapie abgestimmte verhaltenstherapeutische Maßnahmen. An dieser Stelle wird vorgeschlagen, die Untersuchung möglicher Instrumentalisierungseffekte in die präklinische Testung von Pharmakotherapien der Sucht mit aufzunehmen.

Nach Meinung dieses Autors stellt die Replikationskrise keine echte Krise der empirischen Forschung dar. Die herausgearbeiteten Probleme sind nicht gänzlich neu, liegen jetzt aber vermehrt in quantitativen Auswertungen vor. Die Suchtforschung, eine noch relativ junge Disziplin, stellt da keine Ausnahme dar, weder im Erkenntnisgewinn noch im praktischen Nutzen der Erkenntnisse. Vielmehr stellen diese Probleme Herausforderung und Chance dar. Eine Chance, auch die Suchtforschung besser zu machen. Besser im systemischen Verständnis kausaler Mechanismen und ihrer Grenzen. Und vielleicht auch besser in der Anwendung dieser Erkenntnisse für die Therapie der Sucht.

Auf der Suche nach zugrundliegenden Mechanismen und einem Selbstverständnis in Forschung und Praxis

Searching for Basic Mechanisms and a Selfconcept in Science and Practice

Herzlichen Dank an den Autor Rainer Spanagel für diesen Überblick zu Problemen der Reproduzierbarkeit von Ergebnissen aus tierexperimentellen Studien und die kritische Diskussion der mangelhaften Übertragbarkeit von Befunden aus der präklinischen Forschung in den klinischen Forschungsbereich zum einen sowie von Ergebnissen klinischer Studien in die praktische Anwendung zum anderen. Die Schlussfolgerung „Die Replikationskrise ist nur dann eine Krise, wenn wir für fehlende Replikation keine Erklärung finden.“ ist aus meiner Sicht auch für Studien im Humanbereich eine hilfreiche und konstruktive Einstellung, die dazu führen kann, besser zu verstehen, welche Faktoren Erleben und Verhalten des Menschen beeinflussen. Stattdessen schwebt im Zusammenhang mit der Replikationskrise doch eher der Vorwurf unethischen Verhaltens im Raum, des absichtlichen Verschleierns relevanter methodischer Informationen, der nachträglichen Auswahl von Ergebnisparametern, die Ergebnisse im Sinne der eigenen Erwartungen unterstützen, oder gar der Manipulation von Daten. Dabei gibt es aber häufig Erklärungen für abweichende wissenschaftliche Ergebnisse, die z. B. in der Art der untersuchten Probandenpopulation, der speziellen Untersuchungsmethode oder verschiedenen Datenanalysestrategien begründet sind. Ein Verständnis dieser Faktoren kann dabei einen wichtigen Beitrag zum Erkenntnisfortschritt liefern. Dies sei an einem Beispiel erläutert.

Bei der Erklärung der Entstehung und Aufrechterhaltung von abhängigem Verhalten wie auch von Ess- und Gewichtsstörungen spielen substanz- bzw. nahrungsbezogene Verzerrungen der Aufmerksamkeit und Inhibitionsdefizite zumindest bei einigen Betroffenen scheinbar eine wichtige Rolle. Die Ergebnisse von Übersichtsarbeiten und Meta-Analysen (Hardman et al., 2021) verdeutlichen jedoch, dass die Studienlage durchaus heterogen ist. So kommen z. B. Field und Kollegen (Field et al., 2016) zu dem Ergebnis, dass die Stabilität und der Einfluss einer Aufmerksamkeitsverzerrung auf das Verhalten wohl überschätzt wurden, ferner aber auch der Einfluss moderierender Faktoren, z. B. der aktuelle Belohnungswert („incentive value“) oder motivationale Konflikte, unterschätzt wurde. In mehreren eigenen Untersuchungen haben wir nahrungsbezogene Inhibitionsdefizite bei adipösen und normalgewichtigen Personen untersucht. So konnten wir beispielsweise zeigen, dass adipöse Patientinnen mit Binge Eating Störung im Vergleich zu normalgewichtigen Kontrollprobandinnen weniger Inhibitionsfehler bei Präsentation nahrungsbezogener Stimmung begingen, dieser Effekt jedoch von der aktuellen Stimmung und restriktivem Essverhalten moderiert wurde (Loeber et al., 2018). Als weiteren Moderator konnten wir subjektiv erlebten Hunger identifizieren, der bei adipösen Patient_innen mit Binge Eating (Kollei et al., 2018) als auch bei normalgewichtigen Proband_innen (Loeber, Grosshans, Herpertz, Kiefer & Herpertz, 2013) nahrungsbezogene Inhibitionsdefizite erhöhte. Diese Ergebnisse verdeutlichen, dass es eine Vielzahl von Faktoren geben kann, in denen sich Proband_innenstichproben unterscheiden und die zu unterschiedlichen Studienergebnissen führen können. Sie bilden dabei wahre Varianz ab und erweitern unser Verständnis komplexer Erlebens- und Verhaltensmuster. Vor diesem Hintergrund ist nicht nur für tierexperimentelle Forschung, sondern auch für klinische Forschung die Forderung nach einem besseren Verständnis von abweichenden Befunden höchst relevant.

Die open-science-Initiative mit der Idee, Wissenschaft transparent und zugänglich zu machen, kann in diesem Zusammenhang eine wichtige Rolle spielen. Grundsätzlich erscheint es aber als wichtig, welches Verständnis von Forschung wir jungen Wissenschaftler_innen, Nachwuchsforscher_innen und Studierenden vermitteln. Gerade die von Rainer Spanagel (2021) angesprochene Translationslücke zwischen klinischer Forschung und Anwendungspraxis sollte schon im Studium bedacht werden und das Selbstverständnis zukünftiger Generationen von Forscher_innen und/oder Praktiker_innen thematisiert werden. Vor diesem Hintergrund ist es äußerst zu begrüßen, dass bei der Reform des Psychotherapeutengesetzes (PsychThG) das Studium, das zur Approbation als Psychotherapeut_in führt, nur an Hochschulen angeboten werden darf (§ 9 PsychThG). Dadurch bleibt auch zukünftig die enge Verzahnung von akademischer Lehre, wissenschaftlicher Forschung und praktischer Anwendung erhalten bzw. wird sogar durch den deutlich stärkeren Praxisbezug des Studiums noch verstärkt. Vor dem Hintergrund des aktuellen Beitrags sollte dabei auch insbesondere darauf geachtet werden, praktisch tätigen Psychotherapeut_innen eine kritisch reflektierende Grundhaltung zu vermitteln und sie dazu zu veranlassen, die Qualität und Effektivität ihrer Tätigkeit zu hinterfragen und zu überprüfen. Entsprechende Trainingsansätze wurden dabei auch für den Suchtbereich bereits vorgestellt (Magill, Martino & Wampold, 2020).

Ein leuchtendes Vorbild für die klinische Suchttherapie

A Leading Light for Addiction Treatment Providers

Die präklinische Suchtforschung scheint ein Qualitätsproblem zu haben (Spanagel, 2021). Dass sie dies thematisiert, ist anerkennenswertes Ergebnis der genuinen Aufgabe aller Wissenschaftler, die eigene Arbeit ständig selbstkritisch zu hinterfragen und nicht die Augen zu verschließen, wenn eine gute Absicht nicht zum gewünschten Erfolg führt. Dieses Prinzip gilt nicht nur für Forscher. Welches Bild ergibt sich, wenn man es auf die klinische Suchtforschung und deren praktische Umsetzung anwendet?

In Bezug auf die klinische Entwicklung und den Einsatz von Medikamenten scheint die Situation schon allein aufgrund der Bestimmungen des deutschen Arzneimittelgesetzes (AMG) günstiger zu sein. Seit 2004 sind nicht nur Zulassungsstudien, sondern alle Studien, welche die Wirkungen, Nebenwirkungen oder Pharmakokinetik von Arzneimitteln am Menschen untersuchen, den strengen, international definierten Regeln von Good Clinical Practice (GCP) unterworfen. Anlass dazu war, ganz im Sinne von Spanagel, dass die Qualität und Replizierbarkeit zuvor durchgeführter Studien oft zu wünschen übrig ließ. Diese hohen Anforderungen verbessern sicherlich die Qualität der erhobenen Daten. Ihre rigorose Umsetzung in Form der GCP-Verordnung (Bundesministerium für Justiz und Verbraucherschutz, 2004) führte jedoch zu der Nebenwirkung, dass seitens deutscher universitärer Einrichtungen in diesen vergangenen 17 Jahren nur 9 Studien zum Thema Alkoholabhängigkeit und keine einzige zu anderen Suchterkrankungen beim Clinical Trial-Register der EU angemeldet wurden (EU Clinical Trials Register, n. d.). Von der pharmazeutischen Industrie unabhängige, hypothesengenerierende Pilotstudien am Menschen, inklusive solcher zum drug repurposing, scheinen durch die Hürden des AMG also de facto undurchführbar geworden zu sein. Es ist müßig darüber zu spekulieren, wie viele Chancen auf eine bessere Patientenbehandlung dadurch versäumt werden.

Die Psychotherapieforschung hat es in dieser Hinsicht etwas leichter, weil die Anforderungen weniger stark reguliert sind. So z. B. müssen die Studienprotokolle nicht zusätzlich zur Anmeldung bei öffentlichen Registern noch kostenpflichtig durch Aufsichtsbehörden überprüft und genehmigt werden, ebenso wenig die Herstellung von Prüfpräparaten. Eine Inanspruchnahme von klinischen Studienzentren zur Durchführung bzw. Überwachung von Randomisierung, Datendokumentation und Monitoring wird von öffentlichen Geldgebern als Voraussetzung für die Förderung verlangt, ist abgesehen davon jedoch nicht verpflichtend. Zudem sind eine valide Placebokontrolle kaum und eine Verblindung nicht möglich (De Zwaan, 2013). Aus diesem Vergleich lässt sich zumindest schlussfolgern, dass die Methodik und somit die Evidenz für den Wirknachweis psychotherapeutischer Verfahren in der Suchttherapie nicht besser sind als für die Pharmakotherapie. Dennoch wird Suchttherapie gemeinhin ausschließlich als Psychotherapie gedacht und durchgeführt.

Paradigmatisch zeigt sich dies an den beiden „Anticravingsubstanzen“ Acamprosat und Naltrexon: ihre Wirksamkeit wurde unter Publikation von positiven wie negativen Befunden so gründlich und methodisch hochwertig wie bei kaum einem anderen Therapieverfahren nachgewiesen, die Effektstärke ist mit einer number needed to treat zwischen 9 und 12 vergleichbar mit der von Antidepressiva und vielen anderen unstrittigen Therapien. Diese Erkenntnis kommt den betroffenen Patienten jedoch kaum zugute, denn z. B. im Jahr 2019 wurden zu Lasten der gesetzlichen Krankenkassen praktisch kein Acamprosat mehr und nur etwa 400 000 definierte Tagesdosen Naltrexon verordnet (Fritze, 2021). Wenn man zugrundelegt, dass die Behandlungsdauer individuell mit dem Patienten vereinbart werden, aber mindestens 3 Monate betragen sollte, ergibt sich also, dass in 2019 höchstens 4444 Patienten einen adäquaten Behandlungszyklus mit Naltrexon erhielten. Zusammen mit der im Drogen- und Suchtbericht 2019 der Drogenbeauftragten der Bundesregierung beschriebenen Inanspruchnahme von Einrichtungen lässt sich daraus der Anteil behandelter Patienten abschätzen. Rein rechnerisch waren das ca. 0,2 % aller alkoholabhängigen Patienten, 1 % aller mit der Hauptdiagnose „psychische Störungen durch Alkohol“ in Krankenhäuser aufgenommenen Patienten, 6 % derjenigen Klienten, die wegen Alkohol ambulante Suchthilfeeinrichtungen in Anspruch nahmen und 21 % der Patienten, die eine stationäre Rehabilitationsbehandlung wegen Alkoholabhängigkeit begannen.

Die Ursachen dieser Diskrepanz zu diskutieren würde den Rahmen dieses Kommentars sprengen. Aus eigener klinischer Erfahrung erklären jedoch Nebenwirkungen oder geringe Akzeptanz auf Seiten der Patienten nur einen kleinen Anteil der Unterbehandlung, vielmehr kommt es auf die Art der Informationsvermittlung an. Zu diesem Thema besteht jedoch sogar offensichtlich unter den Autoren der einschlägigen S3-Leitlinie Uneinigkeit (Deutsche Gesellschaft für Psychiatrie und Psychotherapie, Psychosomatik und Nervenheilkunde, 2020). Auch in ihrer neu aktualisierten Version geben sie trotz höchstem Evidenzlevel (1a) nur eine eingeschränkte Empfehlung für Naltrexon und Acamprosat („sollte“ angeboten werden, Empfehlungsgrad B). Die Begründung, dass in den Studien ja gleichzeitig auch psychotherapeutische oder psychosoziale Interventionen stattfanden ist unverständlich, da die Wirksamkeit der Pharmakotherapie ja gerade unter diesen Bedingungen als Zusatznutzen nachgewiesen wurde. Alkoholabhängigkeit ist so schwierig unter Kontrolle zu bringen, dass man jede nachgewiesene Chance zur Unterstützung nicht nur nutzen „sollte“, sondern soll. Ganz in diesem Sinne fordert die Leitlinie ja auch einstimmig, dass eine Komplexbehandlung mit verschiedenen Interventionen angeboten werden soll. Warum gilt dies für die Pharmakotherapie nur in eingeschränktem Maße? Als Ergebnis wird hierdurch die von Spanagel (2021) beklagte zweite Translationslücke geradezu institutionalisiert.

Im Sinne der motivierenden Gesprächsführung würde ich, wenn auch nur rhetorisch möglich, an dieser Stelle gerne fragen ob ich einen Änderungsvorschlag machen darf? Der Vorschlag wäre, dass nicht nur Ärzte, sondern Suchttherapeuten aller Professionen die Evidenzlage zu Anticravingmedikamenten gut kennen, sie den Patienten als mögliche Therapieoption vermitteln und mit ihnen besprechen sollten, ob dies – zum jetzigen oder einem späteren Zeitpunkt – ein Bestandteil ihres Gesamtbehandlungsplanes werden könnte. Damit erhielten die Patienten die Chance, im Sinne des „shared decision making“ eine informierte Entscheidung zu treffen. Eine eventuelle ärztliche Verschreibung wäre dann nach Abklärung von Kontraindikationen das geringere Hemmnis.

Die Annäherung an die Wahrheitsfindung – Vieles halten wir in eigenen Händen!

Approximation to Verity – Most is Up to Us!

Der Beitrag des Kollegen Spanagel (2021) behandelt die Grundsatzfragen der Wissenschaft:

Wie können wir (neue) Erkenntnisse gewinnen? Wie können wir wissen, dass die Erkenntnisse wahr sind? Wie können wir die Erkenntnisse praktisch (klinisch) nutzbar machen?

Die Aussagen bezüglich Replikation, Bias oder Robustheit der Methodik sind gut nachvollziehbar; zugleich lassen Sie den Leser fast verwundert zurück. Wie konnte sich der wissenschaftliche Fortschritt, der sich auch in einer kontinuierlichen Verlängerung der Lebenszeit zeigt, trotz eingeschränkter Reproduzierbarkeit von Studien, eingeschränkter Übertragbarkeit aus dem Labor in die klinische Prüfung und im nächsten Schritt in die Versorgung oder einer Publikationskultur, welche der Wahrheitsfindung nicht nur dienlich ist, durchsetzen?

Im Sinne einer Ergänzung und Akzentuierung möchte ich den implizit im Beitrag angeführten Aspekt von Normen und Akzeptanz hervorheben. Nicht selten behindern Normen und Glaubensvorstellungen wissenschaftsgetriebene Entwicklungen („Die Erde ist eine Scheibe“), auf der anderen Seite sehen wir auch in unserem suchtmedizinischen Feld, dass wissenschaftsgetrieben sich beispielsweise die Erkenntnis der Schädlichkeit von Tabak durchgesetzt hat und in vielfältigen gesellschaftlich akzeptierten Maßnahmen zur Konsumreduktion gemündet ist.

Wenn es möglich ist, eine komplexe Intervention wie die Tabakreduktion umzusetzen, sollte es doch auch möglich sein, sinnvolle Maßnahmen wie im 10-Punkte Katalog genannt, zu implementieren. In besonderem Maße auf Akzeptanz angewiesen ist die Forderung nach einer Publikation von „Negativbefunden“. Hier wäre bereits bei der Begrifflichkeit nachzufragen, es handelt sich im eigentlichen Sinn nicht um einen negativ zu bewertenden Befund, sondern um eine Bestätigung der Nullhypothese. Im Sinne des kritischen Rationalismus dient auch die Verifizierung der Nullhypothese der Annäherung an die Wahrheit. Gerade die Wissenschaftsgemeinde sollte in der Lage sein – auch im Sinne ihres eigenen Selbstverständnisses – den fortschrittsschädlichen Publikationsbias abzustellen.

Dass das Austarieren von Gründen für die Bestätigung der Nullhypothese durchaus spannend ist, zeigen die Überlegungen zu Neramexan. Insofern wäre zu hoffen, dass sich die Alternativhypothese zur Wirksamkeit bestätigen ließe.

Literatur

  • Allen, C. & Mehler, D. M. A. (2019). Open science challenges, benefits and tips in early career and beyond. PLoS Biology, 17 (5), e3000246. First citation in articleCrossrefGoogle Scholar

  • Association for Psychological Science. (n. d.). Registered Replication Reports. Retrieved July 7, 2021 from https://www.psy​chologicalscience.org/publications/replication) First citation in articleGoogle Scholar

  • Bundesministerium für Justiz und Verbraucherschutz. (2004). Verordnung über die Anwendung der Guten Klinischen Praxis bei der Durchführung von klinischen Prüfungen mit Arzneimitteln zur Anwendung am Menschen. Verfügbar unter https://www.gesetze-im-internet.de/gcp-v/ First citation in articleGoogle Scholar

  • Chambers, C. (2019). What’s next for registered reports? Nature, 573 (7773), 187–189. First citation in articleCrossrefGoogle Scholar

  • Colquhoun, D. (2014). An investigation of the false discovery rate and the misinterpretation of p-values. Royal Society Open Science, 1 (3), 140216. First citation in articleCrossrefGoogle Scholar

  • De Zwaan, M. (2013). Methodische Aspekte kontrollierter Psychotherapiestudien. Zeitschrift für Evidenz, Fortbildung und Qualität im Gesundheitswesen, 107 (3), 236–241. First citation in articleCrossrefGoogle Scholar

  • Deutsche Gesellschaft für Psychiatrie und Psychotherapie, Psychosomatik und Nervenheilkunde. (2020). S3-Leitlinie „Screening, Diagnose und Behandlung alkoholbezogener Störungen“. Verfügbar unter https://www.awmf.org/leitlinien/detail/ll/076-001.html First citation in articleGoogle Scholar

  • Dirnagl, U. (2019). Rethinking research reproducibility. The EMBO Journal, 38 (2), e101117. First citation in articleCrossrefGoogle Scholar

  • Dirnagl, U. (2020). Resolving the tension between exploration and confirmation in preclinical biomedical research. In A. Bespalov, M. C. Michel & T. Steckler (Eds.), Good research practice in non-clinical pharmacology and biomedicine (pp. 71–79). Berlin: Springer. First citation in articleGoogle Scholar

  • EU Clinical Trials Register. (n. d.) Clinical trials for alcohol dependence. Verfügbar unter https://www.clinicaltrialsregister.eu/ctr-search/search?query=alcohol+dependence&country=de First citation in articleGoogle Scholar

  • European Journal of Personality. (n. d.). Author Guidelines. Retrieved July 7, 2021 from https://onlinelibrary.wiley.com/page/journal/10990984/homepage/forauthors.html First citation in articleGoogle Scholar

  • Everett, J. A. C. & Earp, B. D. (2015). A tragedy of the (academic) commons: Interpreting the replication crisis in psychology as a social dilemma for early-career researchers. Frontiers in Psychology, 6, 1152. First citation in articleGoogle Scholar

  • Field, M., Werthmann, J., Franken, I., Hofmann, W., Hogarth, L. & Roefs, A. (2016). The role of attentional bias in obesity and addiction. Health Psychology: Official Journal of the Division of Health Psychology, American Psychological Association, 35 (8), 767–780. First citation in articleCrossrefGoogle Scholar

  • Fritze, J.. (2021). Verordnung von Neuro-Psychopharmaka. Psychopharmakotherapie, 28, 72–75. First citation in articleGoogle Scholar

  • Hardman, C. A., Jones, A., Burton, S., Duckworth, J. J., McGale, L. S. & Mead, B. R. et al. (2021). Food-related attentional bias and its associations with appetitive motivation and body weight: A systematic review and meta-analysis. Appetite, 157, 104986. First citation in articleCrossrefGoogle Scholar

  • Heinz, A., Kiefer, F., Smolka, M. N., Endrass, T., Beste, C. & Beck, A. et al. (2020). Addiction Research Consortium: Losing and regaining control over drug intake (ReCoDe) – from trajectories to mechanisms and interventions. Addiction Biology, 25 (2), e12866. First citation in articleCrossrefGoogle Scholar

  • Kollei, I., Rustemeier, M., Schroeder, S., Jongen, S., Herpertz, S. & Loeber, S. (2018). Cognitive control functions in individuals with obesity with and without binge-eating disorder. The International Journal of Eating Disorders, 51 (3), 233–240. First citation in articleCrossrefGoogle Scholar

  • König, L., Kalinichenko, L. S., Huber, S. E., Voll, A. M., Bauder, M. & Kornhuber, J. et al. (2020). The selective FKBP51 inhibitor SAFit2 reduces alcohol consumption and reinstatement of conditioned alcohol effects in mice. Addiction Biology, 25, e12758. First citation in articleCrossrefGoogle Scholar

  • Loeber, S., Grosshans, M., Herpertz, S., Kiefer, F. & Herpertz, S. C. (2013). Hunger modulates behavioral disinhibition and attention allocation to food-associated cues in normal-weight controls. Appetite, 71, 32–39. First citation in articleCrossrefGoogle Scholar

  • Loeber, S., Rustemeier, M., Paslakis, G., Pietrowsky, R., Müller, A. & Herpertz, S. (2018). Mood and restrained eating moderate food-associated response inhibition in obese individuals with binge eating disorder. Psychiatry Research, 264, 346–353. First citation in articleCrossrefGoogle Scholar

  • Magill, M., Martino, S. & Wampold, B. E. (2020). The process of skills training: A content analysis of evidence-based addiction therapies. Journal of Substance Abuse Treatment, 116, 108063. First citation in articleCrossrefGoogle Scholar

  • Montag, C. (2018). Cross-cultural research projects as an effective solution for the replication crisis in psychology and psychiatry. Asian Journal of Psychiatry, 38, 31–32. First citation in articleGoogle Scholar

  • Montag, C. (2019). Wird die Diagnostik und Behandlung von psychiatrischen Erkrankungen unter Berücksichtigung digitaler Spuren des Internet of Things zum Normalfall? Eine psychoinformatische Perspektive. Sucht Aktuell, 3, 33–36. First citation in articleGoogle Scholar

  • Müller, C. P. (2018). Animal models of psychoactive drug use and addiction “ present problems and future needs for translational approaches. Behavioural Brain Research, 352, 109–115. First citation in articleCrossrefGoogle Scholar

  • Müller, C. P. (2020). Mechanisms of a near-orthogonal ultra-fast evolution of human behaviour as a source of culture development. Behavioural Brain Research, 384, 112521. First citation in articleCrossrefGoogle Scholar

  • Müller, C. P. & Schumann, G. (2011). Drugs as instruments: a new framework for non-addictive psychoactive drug use. Behavioral and Brain Sciences, 34 (6), 293–310. First citation in articleCrossrefGoogle Scholar

  • Müller, C. P. & Homberg, J. (2015). The role of serotonin in drug use and addiction. Behavioural Brain Research, 277, 146–192. First citation in articleCrossrefGoogle Scholar

  • Müller, C. P. & Kornhuber, J. (2017). Biological evidence for paradoxical improvement of psychiatric disorder symptoms by addictive drugs. Trends in Pharmacological Sciences, 38 (6), 501–502. First citation in articleCrossrefGoogle Scholar

  • Müller, C. P., Mühle, C., Kornhuber, J. & Lenz, B. (2021). Sex-dependent alcohol instrumentalization goals in non-addicted alcohol consumers versus patients with alcohol use disorder: Longitudinal change and outcome prediction. Alcoholism, Clinical and Experimental Research, 45 (3), 577–586. First citation in articleCrossrefGoogle Scholar

  • Nosek, B. A., Spies, J. R. & Motyl, M. (2012). Scientific Utopia: II. Restructuring incentives and practices to promote truth over publishability. Perspectives on Psychological Science, 7 (6), 615–631. First citation in articleCrossrefGoogle Scholar

  • Percie du Sert, N., Hurst, V., Ahluwalia, A., Alam, S., Avey, M. T. & Baker, M. et al. (2020). The ARRIVE guidelines 2.0: Updated guidelines for reporting animal research. PLOS Biology, 18 (7), e3000410. First citation in articleCrossrefGoogle Scholar

  • Schönbrodt, F. (2019). Training students for the Open Science future. Nature Human Behaviour, 3 (10), 1031. First citation in articleGoogle Scholar

  • Serra-Garcia, M. & Gneezy, U. (2021). Nonreplicable publications are cited more than replicable ones. Science Advances, 7 (21), eabd1705. First citation in articleCrossrefGoogle Scholar

  • Spanagel, R. (2021). Replikationskrise in der präklinischen Suchtforschung und Vorschläge zur Krisenbewältigung. SUCHT, 67 (4), 195–206. First citation in articleLinkGoogle Scholar