Grenzverlauf: unklar

Wo hört gute Wissenschaft auf, wo fängt Fehlverhalten an? Die Antwort ist erstaunlich kompliziert. Spurensuche in einem Graubereich.
Drew Hays/Unsplash

Zum Beispiel dieser Fall: Ein Molekularbiologe bearbeitet Gen-Scans am Computer. Er erhöht die Kontraste, damit seine Aussage gut erkennbar ist. Hat er sich falsch verhalten?

Eine Physikerin veröffentlicht eine Studie. Manche Daten hält sie zurück. Sie plant mit ihnen weitere Veröffentlichungen. Verhält sie sich falsch?

Oder der Chemiker, der zur Wirksamkeit einer bestimmten Substanz forscht. Weil das Ergebnis der Firma nicht passt, die ihn finanziert, die Substanz also nicht wirkt, publiziert er nicht. Verhält er sich falsch?

Weiß sei die Farbe der vorbildlichen wissenschaftlichen Praxis. Schwarz sei, um im Bild zu bleiben, ihr Gegenteil, schwarz sind Plagiate, Fälschungen und Manipulation. Und dazwischen? Gerade die Naturwissenschaften ringen mit einer ganzen Bandbreite an Praktiken, die sich an der Grenze zum Fehlverhalten bewegen. Dort, wo der Übergang von handwerklichen Fehlern zur Trickserei fließend ist. Wo Daten nicht gefälscht, aber geschönt oder weggelassen werden. Wo Ergebnisse aufgebauscht und Erkenntnisse übertrieben werden. Willkommen im Graubereich der wissenschaftlichen Praxis.

Der Graubereich und seine Grenzfälle sind ein Problem für die Wissenschaft. Denn sie sind schwer zu erkennen und sie schaden der Forschung. Doch wo fängt das Fehlverhalten eigentlich genau an? Und wie unterscheidet man absichtliche Täuschung von versehentlichen Fehlern, Betrug von Unwissen?

Der Graubereich

Sarah Schießl-Weidenweber kennt den Graubereich aus der Praxis, sie hat ihn immer wieder ausleuchten müssen, wenn sie im Review-Prozess Beiträge begutachtet. Schießl-Weidenweber forscht an der Universität Gießen zur Pflanzengenetik. Beim Prüfen von Studien ist ihr aufgefallen, wie Wissenschaftler Forschungsergebnisse bisweilen im Sinne der Arbeitshypothese verbiegen.

Etwa bei der in der Genetik häufig angewendeten „genomweiten Assoziationsstudie“. Mit dieser Methode ermitteln Forscher Gene, die ein bestimmtes Merkmal beeinflussen könnten. Es gebe dabei Möglichkeiten, Ergebnisse sehr unterschiedlich auszulegen, wenn man bestimmte Dinge nicht erwähne, sagt Schießl-Weidenweber. „In einem Genom liegen sehr viele Gene herum und die Wahrscheinlichkeit, dass ein Gen in einem bestimmten Bereich zufällig auftaucht, ist nicht null. Daher will man wissen: Welche Gene liegen dort noch?“ Ohne diese Information könne man nicht beurteilen, ob es ein vernünftiger Schluss ist, den die Forscher ziehen. Die Biochemikerin hat deswegen schon Aufsätze zur Überarbeitung oder Präzisierung zurückgegeben.

In den Graubereich fallen auch Studien, die sich nicht reproduzieren lassen. Etwa weil Daten zurückgehalten werden. Oder weil Versuchsbedingungen zu speziell sind. Häufig seien auch statistische Fehler, sagt Schießl-Weidenweber. „Weil es kaum jemand richtig kann.“

Und auch die Qualität veröffentlichter Daten steht immer wieder in der Kritik. Angeprangert werden zu kleine Samples oder frisierte Datenreihen, ein Fehlverhalten, das die Wissenschaft als „Beautification“ bezeichnet.

Der Schaden

Wie verbreitet Fehlverhalten tatsächlich ist, lässt sich kaum oder nur schwer ermitteln. Vorhandene Statistiken sind nicht mehr als eine Annäherung. Im vergangenen Jahr ergab eine vom Bayerischen Rundfunk initiierte bundesweite Umfrage unter Ombudspersonen deutscher Unis und Forschungseinrichtungen, dass zwischen 2012 und 2016 insgesamt 1124 Verdachtsfälle gemeldet wurden, von denen 246 anschließend von eigenen Kommissionen untersucht wurden.

Auffallend ist, dass die Zahl der Fachaufsätze, die wegen wissenschaftlichen Fehlverhaltens wieder zurückgezogen wurden, seit den frühen 2000er-Jahren emporgeschossen ist. Zwischen 2001 und 2011 hat sich diese Zahl einer Erhebung der Fachzeitschrift Nature zufolge verzehnfacht, obwohl die Anzahl der Veröffentlichungen in diesem Zeitraum nur um 44 Prozent gestiegen ist. Dabei ist allerdings umstritten, ob immer unsauberer geforscht wird, oder einfach nur immer mehr Fehler und Schummeleien enttarnt werden.

Klar ist hingegen: Das Fehlverhalten schadet der Wissenschaft. Für Stefan Hornbostel vom Deutschen Zentrum für Hochschul- und Wissenschaftsforschung ist die Wissenschaft selbst Objekt der Forschung, er kann also einschätzen, was es bedeutet, wenn eine fehlerhafte oder manipulierte Studie publiziert wird. Das gesicherte Wissen sei zwar nicht in Gefahr, sagt er. „Die meisten Fälle werden entdeckt und irgendwann aussortiert.“ Der Schaden sei allerdings immer dann enorm, wenn angebliche Erkenntnisse starken Einfluss auf Verhaltensweisen in der Bevölkerung nähmen. Beispiel Impfdebatte: Problematische und auch fehlerhafte Studien hätten hier dazu geführt, dass viele Menschen Impfschäden mehr fürchteten als die Gefahren des Nicht-Impfens. Mit Folgen bis zum heutigen Tag.

Auch einen ethischen Schaden sieht Hornbostel: „Wenn sich herausstellt, dass Wissenschaftler gut durchkommen mit solchen Strategien, dann gibt es eine moralische Erosion innerhalb der Wissenschaft.“

Die Ursachen

Im Jahr 2014 rügte die Deutsche Forschungsgemeinschaft (DFG) einen Kölner Mediziner und schloss ihn für vier Jahre von der Antragsberechtigung für Forschungsgelder aus. Der junge Wissenschaftler habe bewusst Daten aus Herzstudien manipuliert, so die Begründung. Der Forscher selbst gab an, er habe nur einen befristeten Vertrag und sich Sorgen um seine Karriere gemacht, weil er dem Erwartungsdruck der Arbeitsgruppenleiterin nicht gewachsen gewesen sei.

Der Fall verdeutlicht eine Vermutung, die auch Stefan Hornbostel teilt: Der zunehmende Druck im Wissenschaftsbetrieb begünstigt Fehlverhalten. „Wir haben speziell in Deutschland eine Drittmittelintensität, die im letzten Vierteljahrhundert rasant angestiegen ist“, sagt er. Diese erzeuge Zwänge: Projekte hätten einen begrenzten Zeitrahmen, Verträge seien befristet, die Erwartungen hoch. Gerade Nachwuchswissenschaftler bräuchten Ergebnisse, die sie vorzeigen können. Und wenn die Ergebnisse noch nicht reif sind für eine Publikation, dann wird bisweilen nachgeholfen. Weil ganze Biografien davon abhängen.

Auch Erfolgssucht, Geltungssucht und Eitelkeit spielten mitunter eine Rolle, sagt Hornbostel, wenn Forscher Grenzen überschreiten. Und dann gibt es die sogenannten „honest errors“, lästige und vermeidbare Fehler als Folge unsauberer Methodik – aber ohne erkennbare Täuschungsintention.

Die Grenze

Die meisten Forschungseinrichtungen und Universitäten in Deutschland umreißen in ihren Satzungen oder Richtlinien zur guten wissenschaftlichen Praxis, was sie als Fehlverhalten erachten. Das „Verfälschen“ und „Erfinden“ von Daten und die „Beseitigung von Primärdaten“ führt beispielsweise die entsprechende Ordnung der Universität Regensburg an.

Aber Schwarz lässt sich leichter definieren als Grau. In der Wissenschaft gibt es kein Gesetz, kein Korsett, es gilt die Wissenschaftsfreiheit. Stellt sich also die Frage: Wo verläuft die Grenze, wo wird Weiß zu Schwarz? Und wie lassen sich Fehler von Manipulationen unterscheiden?

„Es ist wirklich sehr schwierig“, sagt Joachim Heberle. „Wie wollen Sie überprüfen, ob jemand ehrlich ist?“ Heberle ist Professor für Physik an der Freien Universität Berlin. Und er ist Teil des Gremiums „Ombudsman für die Wissenschaft“, das der Senat der DFG eingesetzt hat. In dieser Funktion prüft Heberle mit seinen Kollegen Hinweise auf mögliche Verstöße gegen die Regeln guter wissenschaftlicher Praxis, um die 100 Fälle im Jahr. Nahezu alle, sagt er, entstammten dem hier beschriebenen Graubereich.

Heberle vermittelt in diesen Fällen. Weil die Wissenschaft auf Ehrlichkeit fuße, sei sie empfindlich für Fehlverhalten, sagt er, einen Graubereich werde es immer geben. Stets aber gelte die Unschuldsvermutung, denn Fehler könnten passieren. Wenn sich Muster aber wiederholten, etwa Fremdpassagen in einer Arbeit, dann sei die Häufung ein Hinweis auf Absicht. Auf bewusstes Fehlverhalten.

Der Ombudsmann wirbt dafür, jeden Einzelfall differenziert zu betrachten, alle Graustufen zu bedenken. Auch bei den eingangs erwähnten fiktiven Beispielsfällen:

  • Das Nachbearbeiten von Gen-Scans am Computer? Per se kein Fehlverhalten, sagt er, sogar gängige Praxis. Zulässig sei, das zu akzentuieren, was man aussagen möchte, etwa die Kontraste leicht zu erhöhen, damit das Bild im Druck gut erkennbar ist. Bedingung: Der Forscher gibt an, wie und was er mit welcher Software bearbeitet hat. Klares Fehlverhalten hingegen: Montagen, Ausschneidungen, Verdrehungen.
  • Die sogenannte „Salamitaktik“, das bewusste Zurückhalten von Daten für weitere Publikationen? Auf jeden Fall verwerflich, sagt Heberle. Je mehr Scheibchen, desto schlimmer. Das, was man schon weiß, solle man auch sagen. Nur wenn der Datensatz besonders groß sei, könne es gerechtfertigt sein, zwei Publikationen daraus zu machen.
  • Und das Nichtpublizieren von gescheiterten Studien in der angewandten Forschung? Nicht gut, findet Heberle, allerdings nicht zwingend ein Fehlverhalten: Der Forscher habe schließlich Pflichten gegenüber dem Auftraggeber, arbeitsrechtliche und patentrechtliche Faktoren spielten eine Rolle. Für die Wissenschaft gleichwohl ein großer Schaden, denn: „Wissen geht verloren.“

Die Reaktion

An vielen Stellen hat das Wissenschaftssystem bereits reagiert: Wissenschaftsforscher Hornbostel nennt als Beispiel die sogenannte „Pre-Registration“ klinischer Studien. Dadurch werde das Korsett einer Studie festgelegt und dokumentiert, noch ehe sie beginne: Samplegrößen beispielsweise, Hypothesen. Weil diese Dinge dann nicht mehr variiert werden können, verkleinert sich der Spielraum für Manipulationen.

Auch die Open-Science-Bewegung zielt darauf ab, Graubereiche aufzulösen. Auf Plattformen wie PubPeer können Zweifel an Publikationen angemeldet werden, die Seite Retraction Watch macht auf zurückgezogene Veröffentlichungen aufmerksam. Allerdings hat Open-Access auch neue Probleme hervorgebracht: sogenannte „predatory journals“, Raubjournale, die ohne hinreichende Qualitätskontrolle gegen Geld mehr oder weniger alle eingesandten Manuskripte veröffentlichen.

Immerhin: Universitäten bieten mittlerweile mehr Veranstaltungen an, um gute wissenschaftliche Praxis zu unterrichten. Hornbostel aber sieht noch Nachholbedarf in der Ausbildung und Erziehung junger Wissenschaftler: Ihnen müssten die Grenzen des erlaubten sehr deutlich gemacht werden.

Das Problem mit dem Fehlverhalten aber greift noch tiefer. Denn es stellt die Belohnungs- und Reputations-Mechanismen der Wissenschaft auf den Prüfstand. Hornbostel fordert, mehr Anreize dafür zu schaffen, Wissen zu überprüfen. Replikationsstudien würden zu wenig gefördert, weil es für die Wissenschaftler wenig Anreiz gebe, ein Ergebnis zu replizieren. „Damit kann man keine Lorbeeren gewinnen“, sagt er. Indirekt belohnt werde stattdessen, wenn Forscher etwa Daten zurückhalten, weil mehr Publikationen am Ende mehr Prestige bedeuten. Und damit die Chancen auf eine wissenschaftliche Karriere erhöhen. Hornbostel: „Organisationen müssen klarmachen: Ja, wir verlangen durchaus Leistung, aber das Gewicht liegt auf der Qualität, nicht der Quantität.“

Joachim Heberle und seine Kollegen wollen mit dem Ombudsgremium durch Aufklärung dazu beitragen, Fehlverhalten zu reduzieren. Als eine „Art Grundgesetz der Wissenschaft“ propagieren sie den DFG-Leitfaden „Sicherung guter wissenschaftlicher Praxis“, grundlegende Regeln, an denen sie kontinuierlich feilen. Aufklärungsbedarf gibt es genug: 2014 ergab eine Umfrage des Wissenschaftsrats, dass nicht einmal die Hälfte aller Fakultäten in Deutschland den DFG-Leitfaden kennt.

Graubereiche aber werden am Ende trotzdem bleiben. Sie müssten es sogar, da sind sich der Ombudsmann und der Wissenschaftsexperte einig. Denn zu viel Kontrolldruck, zu viel Transparenz und zu viele Vorgaben seien eine Gefahr für die Forschung, sagt Stefan Hornbostel: „Wissenschaft produziert nicht automatisch neue Erkenntnisse, sondern hat auch mit Holzwegen, falschen Vermutungen und manchmal eben auch mit fälschlicherweise akzeptiertem Wissen zu tun.“ So gebe es durch mutige Ansätze oft Durchbrüche in der Forschung. „Eine Wissenschaft, von der man erwartet, dass sie innovativ und kreativ ist, die bahnbrechende Erkenntnisse hat, bewegt sich immer in einem Grenzbereich, in dem geltende methodische Standards gebrochen werden.“ Dieses Innovationspotenzial dürfe man nicht abwürgen.

Auch der Irrtum, sagt Hornbostel, gehört zur Wissenschaft.