Sechs hartnäckige Missverständnisse in der wissenschaftlichen Forschung – Kenneth J. Rothman

von Anton Theunissen | 7. Jan. 2026, 13:01

← Jessica Rose, Kevin McKernan und ihre Katzen – nachträglicher GedankeDas Dilemma der antiinstitutionellen Wissenschaft →

Lesezeit

Seitdem ich mich nur mit meinem kommunikationsanalytischen Hintergrund und einer Grundausstattung an Argumentationstheorie, Statistik, Logik, Wissenschaftsphilosophie usw. mit medizinischen und epidemiologischen Studien beschäftige, bin ich oft von den wissenschaftlichen Denkweisen überrascht, denen ich im Studium begegnet bin. Anfangs dachte ich, ich könnte daraus etwas lernen, aber allzu oft stieß ich auf interne Inkonsistenzen, implizite Annahmen und falsche Schlussfolgerungen; eigentlich hauptsächlich argumentationstheoretische Angelegenheiten. Wenn Sie dafür eine Antenne entwickelt haben, werden Sie dies als kontraintuitiv empfinden: Daher lohnt es sich, es zu überprüfen.

Ich sah, dass wissenschaftlicher Fachjargon als Abkürzung zur Umgehung logischer Denkprozesse genutzt wurde. Gerade in Bereichen, in denen es um viele Milliarden Dollar geht, werden legitime kritische Fragen mit dem Mantra übertüncht, dass jeder vergessen habe, woher sie kämen und wofür sie gedacht seien. Es scheint schlampiges Denken zu geben, Menschen verlassen sich auf die gegenseitige Bestätigung, wenn es ihnen passt (ohne überhaupt auf widersprüchliche Daten einzugehen), Menschen verstecken sich hinter komplizierten multifaktoriellen Korrekturen, während Rohdaten auf völlig gegensätzliche Schlussfolgerungen hinzuweisen scheinen usw. usw. Es stellte sich bald heraus, dass es nicht nur an meiner Unwissenheit lag.¹ Dies wurde mir auch klar, als ich gegenüber Fachleuten (auch Akademikern) auf den entsprechenden Gebieten meine Zweifel – manchmal sogar Bestürzung – zum Ausdruck brachte.

Dann ist es ermutigend, wenn sich herausstellt, dass ein anerkannter wissenschaftlicher Leiter es viel früher gesehen hat. Diese Zweifel sind also nicht so idiotisch.

Kenneth J. Rothman hat es bereits 2014 aufgeführt. Wenn sich das nur die wissenschaftsanbetenden Dogmatiker und Wissenschaftspopularisierer zu Herzen nehmen würden ... aber ich fürchte, dass Max Planck recht haben wird: Das wird sicherlich noch eine Generation dauern. Und dann war er immer noch optimistisch.

Gleichzeitig sehe ich auch, warum dieser Ansatz Probleme bereitet: Nur wer scharf denken kann, wird auch weiterhin in der Lage sein, Wissenschaft auf diese Weise zu betreiben. Unsere wissenschaftliche Welt, insbesondere die großen Institute, ist teilweise mit gefügigen Mittelständlern gefüllt, und die gehen nicht einfach weg. Sie gehen sogar weiter als Forscher, die andere Prioritäten haben als Teamplayer zu sein, einen guten Ruf zu wahren oder mit politikbejahenden Vorschlägen Geld einzustreichen. Denken Sie einfach darüber nach, womit ein Institut mehr machen kann. Untergrabung oder Bestätigung des aufgebauten Konsenses? Der Fortschritt der Wissenschaft kann leicht als institutionenbedrohend angesehen werden. Und je grundlegender, desto antiinstitutioneller.

Bei solch einem strengeren Qualitätsstandard bleiben auch hartnäckige Schreier, die Jargon und Konsens verwenden, freundliche Experten und Legacy Science™-Experten auf der Strecke. Sie müssen in der Lage sein, Ihre eigenen Urteile zu fällen, fundierte Schätzungen vornehmen zu können (und sich dazu zu trauen), Ihre eigenen Gewissheiten zu hinterfragen, zu abstrahieren usw., und das ist nicht jedermanns Sache. Das ist sicherlich nicht „inklusiv“, denn eine Diskriminierung aufgrund des Gehirns ist natürlich nicht möglich. (s) Auch Einfaltspinsel sollten mitmachen können! Gerade wenn sie in der Wissenschaft unterrepräsentiert sind, ist positive Diskriminierung nur fair! Nur gemeinsam können wir aufholen!(/s)

Das bedeutet sicherlich nicht, dass jeder, der etwas schreit, immer ernst genommen werden sollte. Die Leitlinien zur wissenschaftlichen Integrität sind hierfür ein guter Leitfaden und können auch als Prüfstein dienen. Leider werden diese Richtlinien nicht mehr angewendet. Unsere führenden Institute ignorieren sie (nehmen Sie zum Beispiel die „Transparenz“ der Kernrichtlinie, die die anderen Kernrichtlinien tatsächlich überprüfbar macht).² und behalten dennoch ihren wissenschaftlichen Status. Diese Richtlinien werden daher zu gegebener Zeit angepasst, damit alles wieder stimmt...

Auf diese Weise können sie weiterhin die sechs grundlegenden Fehler machen, die Rothman 2014 identifizierte und für die er auch verblüffende Beispiele lieferte. Prägnant und klar, daher die vollständige Übersetzung in der Hoffnung, dass seine Argumentation noch einmal entstaubt wird.

Über Kenneth J. Rothman

Kenneth J. Rothman ist ein amerikanischer Epidemiologe, der weltweit als einer der Begründer der modernen epidemiologischen Methodik bekannt ist. Er wurde 1945 geboren und ist vor allem für seine einflussreichen Arbeiten zu epidemiologischer Kausalität, Voreingenommenheit und Forschungsmethoden bekannt. Rothman erhielt seinen Doktortitel (Sc.D.) in Epidemiologie von der Harvard School of Public Health.

Einstellung zu gängigen medizinischen Dogmen:
Rothman betont immer wieder, dass Wissenschaft nicht zu einer Glaubensstruktur verkommen dürfe. Er plädiert für Transparenz, methodische Reinheit und eine weiterhin kritische Haltung gegenüber institutionellen Interessen – einschließlich des pharmazeutischen Einflusses in der klinischen Forschung.
Dies ist in seiner Arbeit deutlich zu erkennen statistische Signifikanz ist nicht gleich wissenschaftliche Wahrheit - Eine Botschaft, die heute dringender denn je ist.

Wichtige Arbeit:
Er schrieb das Standardwerk "Modern Epidemiology" – ursprünglich von ihm allein geschrieben, später in Zusammenarbeit mit Sander Greenland und Timothy Lash. Dieses Buch gilt als das 'Bibel' der empirischen Epidemiologie.

Wissenschaftliche Beiträge:

Er führte das Konzept ein und systematisierte es verwirrend und Interaktion (Effektmodifikation).
Er betonte die Bedeutung von Kausaldiagramme (Vorgänger von DAGs – Directed Asymmetric Graphs).
Er wies auf die Grenzen von p-Werten und die Gefahr hin statistische Ritualisierung in der Medizin.
Er kritisierte auch die übermäßige Abhängigkeit von „Signifikanzgrenzen“ in der Forschung, die zu irreführenden Schlussfolgerungen führen könne.

Institute und Zeitschriften:
Er ist der Gründer des Magazins Epidemiologie (gestartet 1990), das eine Alternative zu übermäßig konservativen, institutionell kontrollierten medizinischen Publikationen bieten sollte.

Unten finden Sie die Übersetzung seines Artikels³.

Zusammenfassung

Wissenschaftliche Erkenntnisse ändern sich schnell, die Konzepte und Methoden der Forschung ändern sich jedoch langsamer. Um die Diskussion über veraltete Denkweisen bei der Durchführung von Forschung anzuregen, liste ich sechs Missverständnisse über Forschung auf, die noch lange bestehen bleiben, nachdem ihre Mängel offensichtlich geworden sind.

Die Missverständnisse sind:

Es gibt eine Hierarchie der Forschungsdesigns; Randomisierte Studien bieten die größte Validität, gefolgt von Kohortenstudien, während Fall-Kontroll-Studien am wenigsten zuverlässig sind.
Ein wesentliches Element für eine gültige Verallgemeinerung besteht darin, dass die Probanden eine repräsentative Stichprobe einer Zielpopulation darstellen.
Wenn ein Term, der das Produkt zweier Faktoren in einem Regressionsmodell angibt, statistisch nicht signifikant ist, gibt es keine biologische Wechselwirkung zwischen diesen Faktoren.
Bei der Kategorisierung einer kontinuierlichen Variablen besteht ein sinnvolles Schema zur Auswahl kategorialer Grenzwerte darin, perzentildefinierte Grenzwerte zu verwenden, beispielsweise Quartile oder Quintile der Verteilung.
Man sollte immer P-Werte oder Konfidenzintervalle angeben, die für mehrere Vergleiche korrigiert wurden.
Signifikanzforschung ist nützlich und wichtig für die Dateninterpretation.

Diese Missverständnisse halten sich in Zeitschriften, Klassenzimmern und Lehrbüchern hartnäckig. Sie bleiben bestehen, weil es sich um intellektuelle Abkürzungen handelt, die eine durchdachtere Herangehensweise an Forschungsprobleme verhindern. Ich hoffe, dass das Aufzeigen dieser Missverständnisse die notwendigen Diskussionen anstoßen wird, um diese veralteten Ideen endgültig zu begraben.

Kenneth J. Rothman, DrPH
Research Triangle Institute, Research Triangle Park, NC, VS; Boston University School of Public Health, Boston, MA, VS.

SCHLÜSSELWÖRTER: Forschungsdesign; Dateninterpretation; epidemiological methods; Repräsentativität; Bewertung der Interaktion; multiple comparisons; percentile limits; statistische Signifikanztests.

PMID:24452418 | PMCID:PMC4061362 | DOI:10.1007/s11606-013-2755-z
© Die Autoren 2014. Dieser Artikel ist Open Access auf Springerlink.com veröffentlicht

Es gibt immer noch überraschend viele Missverständnisse über die Durchführung von Forschungen mit menschlichen Probanden. Manche Missverständnisse bleiben bestehen, obwohl das Gegenteil gelehrt wird, andere wiederum, weil das Gegenteil gelehrt werden sollte. Um die Diskussion über diese Themen anzuregen, liste ich hier sechs hartnäckige Missverständnisse über Forschung auf und gebe eine kurze Zusammenfassung der Probleme, die jedes dieser Missverständnisse mit sich bringt.

Missverständnis 1. Es gibt eine Hierarchie der Studiendesigns: Randomisierte Studien bieten die größte Validität, gefolgt von Kohortenstudien, während Fall-Kontroll-Studien am wenigsten zuverlässig sind.

Randomisierte Studien gelten oft als „Goldstandard“ unter den Studientypen, sind aber selbst in der Theorie nicht perfekt. Darüber hinaus ist die Annahme, dass aus der Art der Studie auf die Vergleichsvalidität von Forschungsergebnissen geschlossen werden kann, falsch.

Obwohl einige glauben, dass Beweise aus einer randomisierten Studie genauso überzeugend sind wie logische Beweise, kann keine empirische Studie absolute Sicherheit bieten. Wenn randomisierte Studien perfekt wären, wie könnten sie dann zu unterschiedlichen Ergebnissen führen? Tatsächlich unterliegen sie mehreren Fehlern¹. Natürlich gibt es zufällige Fehler, wie es bei einer Studie zu erwarten wäre, die auf einer zufälligen Zuordnung basiert. Es gibt aber auch systematische Fehler oder Verzerrungen. Beispielsweise werden randomisierte Studien in der Regel nach dem Intention-to-Treat-Prinzip analysiert, wobei die zunächst zufällig zugewiesenen Gruppen unabhängig von späteren Nichteinhaltungen verglichen werden. Die Nichteinhaltung führt dazu, dass die Wirkung der Behandlung unterschätzt wird. Diese Verzerrung wird normalerweise als akzeptabel angesehen, da sie durch die Vorteile einer zufälligen Zuweisung ausgeglichen wird. Allerdings ist eine Unterschätzung der Wirkungen in einer Sicherheitsstudie zur Aufdeckung von Nebenwirkungen der Behandlung nicht akzeptabel. Eine weitere wichtige Quelle für Verzerrungen in einer randomisierten Studie sind Fehler bei der Ergebnisbewertung, beispielsweise die Unterzählung von Ergebnisereignissen. Selbst wenn die Randomisierung zu Beginn der Studie für ein Gleichgewicht zwischen den Risikofaktoren der Gruppen sorgt, kann es im Laufe der Langzeitbeobachtung aufgrund unterschiedlicher Studienabbrecher oder Veränderungen in der Verteilung der Risikofaktoren zu einer zunehmenden Unausgewogenheit der Studiengruppen kommen. In Langzeitstudien kann es daher sein, dass der Nutzen einer zufälligen Zuordnung mit der Zeit abnimmt.

Kurz gesagt, das Studium ist alles andere als perfekt. Darüber hinaus liefern sowohl Kohorten- als auch Fallkontrollstudien bei richtiger Konzeption und Durchführung valide Ergebnisse. Es ist daher falsch, einer Studie, die auf einer Hierarchie von Forschungsdesigns basiert, unüberlegt mehr Aussagekraft zu verleihen^2,3. Beispielsweise ist der Zusammenhang zwischen Zigarettenrauchen und Lungenkrebs auf der Grundlage von Erkenntnissen aus Kohorten- und Fall-Kontroll-Studien gut belegt. Dieser Zusammenhang konnte in einer randomisierten Studie nie eindeutig nachgewiesen werden. Es ist nicht einfach, Menschen zufällig einer Raucher- oder Nichtrauchergruppe zuzuordnen, aber wenn die Raucherentwöhnung im Rahmen einer vielschichtigen Intervention in der Randomized Multiple Risk Factor Intervention Trial untersucht wurde⁴, entwickelten diejenigen, die dazu ermutigt wurden, mit dem Rauchen aufzuhören, tatsächlich mehr Lungenkrebs als diejenigen, die nicht dazu ermutigt wurden, mit dem Rauchen aufzuhören. Die Ergebnisse der Studie haben die Ergebnisse der vielen Kohorten- und Fallkontrollstudien, die ohne Randomisierung durchgeführt wurden, nicht umgekehrt. Vielmehr wurde die Diskrepanz auf Probleme mit der Studie zurückgeführt.

Ein weiteres markantes Beispiel sind die Ergebnisse großer Kohortenstudien^5,6 wiesen darauf hin, dass das Risiko einer koronaren Herzkrankheit bei postmenopausalen Hormonkonsumenten verringert war, spätere Ergebnisse aus zwei randomisierten Studien zeigten jedoch keinen Zusammenhang oder ein erhöhtes Risiko.^7,8Die Reaktion in der wissenschaftlichen Gemeinschaft und der populären Presse⁹bestand darin, die Ergebnisse der Kohortenstudien in der Annahme zu diskreditieren, dass sie durch die randomisierten Studien widerlegt worden seien. Viele halten weiterhin an dieser Interpretation fest, aber in einer eleganten Neuanalyse stellen Hernan et al.¹⁰wiesen darauf hin, dass die Studiengruppen in den Kohortenstudien und den randomisierten Studien unterschiedlich waren und dass die Auswirkungen des Hormonkonsums nach der Menopause je nach Alter und Zeit seit der Menopause stark variierten. Als die Studien auf neue Hormonkonsumenten beschränkt waren, haben Hernan et al. zeigten, dass Unterschiede in der Verteilung von Alter und Zeit seit der Menopause alle offensichtlichen Diskrepanzen erklären könnten. Obwohl es üblich ist, solche Diskrepanzen auf inhärente Schwächen nicht-experimenteller Studien zurückzuführen, ist es zu einfach, die Gültigkeit auf der Grundlage einer angenommenen Hierarchie von Studientypen zuzuordnen.¹¹

Ebenso sollten Diskrepanzen zwischen Kohortenstudien und Fall-Kontroll-Studien nicht oberflächlich durch einen angenommenen Validitätsvorteil von Kohortenstudien gegenüber Fall-Kontroll-Studien erklärt werden. Gut konzipierte Fall-Kontroll-Studien werden zu denselben Ergebnissen führen wie gut konzipierte Kohortenstudien. Wenn Konflikte auftreten, können sie auf Probleme in einer oder beiden Studienarten zurückzuführen sein. Obwohl Fall-Kontroll-Studien lange Zeit als veraltete Versionen von Kohortenstudien abgetan wurden, die von der Krankheit ausgehen und auf mögliche Ursachen zurückblicken, betrachten Epidemiologen Fall-Kontroll-Studien heute als konzeptionell identisch mit Kohortenstudien, mit Ausnahme eines Effizienzgewinns, der sich aus der Stichprobe der Nenner ergibt, anstatt eine vollständige Zählung durchzuführen. Tatsächlich ermöglichen diese Effizienzgewinne, dass in Fall-Kontroll-Studien mehr Ressourcen für die Expositionsbewertung oder Fallvalidierung aufgewendet werden können, was zu einer geringeren Verzerrung führt als in entsprechenden Kohortenstudien zum gleichen Zusammenhang.

Diejenigen, die Fall-Kontroll-Studien als veraltete Versionen von Kohortenstudien betrachten, ziehen manchmal die falsche Analogie, dass die Kontrollen den Fällen sehr ähnlich sein müssen, außer dass sie nicht die Krankheit haben, die den Fall definiert. Tatsächlich soll die Kontrollgruppe in einer Fall-Kontroll-Studie eine Stichprobe des Bevölkerungsnenners sein, der die Fälle hervorbringt, ein Ersatz für die vollständigen Nenner, die in einer Kohortenstudie ermittelt wurden. Die Kontrollgruppe muss daher der gesamten Forschungsgruppe ähneln und nicht den Fällen.^12,13 Bei gutem Design können Fall-Kontroll-Studien die gleiche hervorragende Validität erreichen wie gut konzipierte Kohortenstudien, während eine schlecht konzipierte Studie unzuverlässig sein kann. Die Art der Studie sollte nicht als Maßstab für die Validität einer Studie herangezogen werden.

Missverständnis 2. Ein wesentliches Element für gültige Verallgemeinerungen aus einer Studie besteht darin, dass es sich bei den Probanden um eine repräsentative Stichprobe einer Zielpopulation handelt.

Dieses Missverständnis hängt mit der Ansicht zusammen, dass die wissenschaftliche Verallgemeinerung eine mechanische Extrapolation der Ergebnisse einer Stichprobe auf die Quellpopulation beinhaltet. Aber das beschreibt die statistische Verallgemeinerung; Die wissenschaftliche Verallgemeinerung ist etwas anders: Es ist der Prozess, eine korrekte Aussage über die Funktionsweise der Natur zu treffen.

Die wissenschaftliche Verallgemeinerung ist das ultimative Ziel der wissenschaftlichen Forschung, aber eine Voraussetzung dafür ist die Gestaltung einer Studie mit interner Validität, die dadurch verbessert wird, dass alle Störvariablen konstant gehalten werden. Wann haben wir jemals von Tierforschern gehört, die nach einer statistisch repräsentativen Stichprobe von Tieren suchen? Stattdessen ist ihr Ansatz fast das Gegenteil des Strebens nach Repräsentativität. Beispielsweise bevorzugen Biologen, die Mäuse untersuchen, Mäuse, die in Bezug auf Gene und Umwelt homogen sind und sich nur in Bezug auf die experimentell manipulierte Variable unterscheiden. Im Gegensatz zur statistischen Verallgemeinerung von Umfragen oder Stichproben, die nur eine Extrapolation von der Stichprobe auf die Quellpopulation erfordert, erfolgt die wissenschaftliche Verallgemeinerung durch fundierte Vermutungen, jedoch nur auf der sicheren Plattform einer gültigen Umfrage. Folglich sind Studien aussagekräftiger, wenn sie die Variabilität der Störfaktoren begrenzen, anstatt auf Repräsentativität zu zielen. Puppe und Hügel¹⁴untersuchten die Sterblichkeit männlicher britischer Ärzte im Zusammenhang mit ihren Rauchgewohnheiten. Ihre Ergebnisse galten als weitgehend verallgemeinerbar, obwohl ihre Studiengruppe hinsichtlich Geschlecht, Rasse, ethnischer Zugehörigkeit, sozialer Klasse, Nationalität und vielen anderen Variablen nicht repräsentativ für die Gesamtbevölkerung der Tabakkonsumenten war.

Wenn es eine berechtigte Frage darüber gibt, ob eine Gesamtassoziation je nach Untergruppe einer dritten Variablen, wie etwa Alter oder ethnischer Gruppe, variiert, kann es notwendig sein, Personen aus einem breiten Wertebereich dieser dritten Variablen einzubeziehen, aber selbst dann ist es kontraproduktiv, wenn die Studiengruppe repräsentativ für die Quellpopulation dieser Variablen ist. Das Ziel wäre in diesem Fall, Probanden einzubeziehen, die gleichmäßig über das Spektrum verteilt sind oder in einer Verteilung, die die Gesamteffizienz der Studie erhöht. Eine Stichprobe, die für die Quellpopulation repräsentativ ist, ist nicht optimal.^15,16

Missverständnis 3. Wenn ein Term, der das Produkt zweier Faktoren in einem Regressionsmodell angibt, statistisch nicht signifikant ist, gibt es keine biologische Wechselwirkung zwischen diesen Faktoren.

Der Begriff „biologisch“ sollte hier im weitesten Sinne verstanden werden und umfasst biochemische, psychologische, verhaltensbezogene und physische Interaktionen. Das Problem besteht darin, dass Interaktionen normalerweise mithilfe von Regressionsmodellen bewertet werden, bei denen sich der Produktbegriff eher auf statistische als auf biologische Interaktionen bezieht.

Unter biologischer Interaktion versteht man zwei oder mehr Ursachen, die im selben Mechanismus wirken und deren Wirkungen voneinander abhängig sind. Es beschreibt einen natürlichen Zustand. Wenn Basiseffekte als Veränderungen des Krankheitsrisikos gemessen werden, kommt es zu einer synergistischen (d. h. positiven) biologischen Wechselwirkung, wenn die gemeinsame Wirkung zweier kausaler Faktoren größer ist als die Summe ihrer einzelnen Wirkungen.¹⁷Statistische Interaktion hingegen beschreibt nicht die Natur, sondern ein mathematisches Modell. Dies wird üblicherweise mit einem Produktterm für zwei Variablen in einem Regressionsmodell bewertet. Seine Größe hängt von der Wahl der Maße und der Messskala ab. Statistische Interaktion impliziert lediglich, dass die grundlegende funktionale Form eines bestimmten mathematischen Modells keine angemessene Beschreibung der Beziehung zwischen Variablen ist. Zwei Faktoren, die biologisch interagieren, können je nach verwendetem Modell statistisch interagieren oder auch nicht.

Produktbegriffe in Regressionsmodellen haben Einheiten, die schwer zu interpretieren sind. Wenn eine Variable der Fettverbrauch ist, gemessen in Gramm pro Tag, und eine andere die Anzahl der Packungsjahre gerauchter Zigaretten, wie ist dann eine Variable zu interpretieren, deren Einheit Gramm/Tag mit Packungsjahren multipliziert ist? Die Herausforderung bei der Interpretation solcher Produkttermkoeffizienten hat dazu geführt, dass der Schwerpunkt eher auf dem mit dem Koeffizienten verbundenen p-Wert als auf der Größe des Koeffizienten selbst liegt. Die Konzentration auf den p-Wert oder darauf, ob der Koeffizient eines Produktterms statistisch signifikant ist, verschlimmert nur das Problem der Verwechslung statistischer Interaktion mit biologischer Interaktion (siehe Missverständnis 6). Eine aussagekräftigere Bewertung der Interaktion bestünde darin, sich auf den Prozentsatz der Krankheitsfälle zu konzentrieren, die auf biologische Interaktionen zurückzuführen sind.^17,18

Nehmen Sie ein einfaches Beispiel aus der TREAT-Studie (Trial to Reduce Cardiocular Events with Aranesp Therapy).¹⁹), die das Schlaganfallrisiko bei 4.038 Patienten mit Diabetes mellitus, chronischer Nierenerkrankung und Anämie bewertete, die nach dem Zufallsprinzip einer Gruppe mit Darbepoetin alfa oder einer Gruppe mit Placebo zugeordnet wurden. Bei Patienten ohne Schlaganfall in der Vorgeschichte betrug das Schlaganfallrisiko während des Studienzeitraums 2 % bei Patienten, die Placebo erhielten, und 4 % bei Patienten, die Darbepoetin alfa erhielten. Bei Patienten mit Schlaganfall in der Vorgeschichte betrugen die entsprechenden Risiken 4 % bzw. 12 %. Die Autoren stellten fest, dass der Risikoanstieg für Darbepoetin alfa bei Patienten mit Schlaganfall in der Vorgeschichte größer war, lehnten diese Wechselwirkung jedoch ab, da der Produktterm in einem logistischen Regressionsmodell statistisch nicht signifikant war. Das erhöhte Risiko, das auf Darbepoeitin alfa zurückzuführen ist, betrug 2 % bei Patienten ohne Schlaganfall in der Vorgeschichte und 8 % bei Patienten mit Schlaganfall in der Vorgeschichte, was auf eine starke biologische Wechselwirkung zwischen Darbepoeitin alfa und Schlaganfall in der Vorgeschichte hinweist. Wären die Risiken rein additiv, läge das Risiko bei Patienten mit beiden Risikofaktoren bei 6 % statt der tatsächlichen 12 %. Die Hälfte des Risikos bei Patienten mit beiden Risikofaktoren scheint auf biologische Wechselwirkungen zurückzuführen zu sein, obwohl die Autoren behaupten, dass es keine Wechselwirkungen gab.

Missverständnis 4. Bei der Kategorisierung einer kontinuierlichen Variablen besteht ein sinnvolles Schema zur Auswahl der Kategoriegrenzen darin, perzentildefinierte Grenzen zu verwenden, z. B. Quartile oder Quintile der Verteilung.

Es gibt zwei Gründe, warum die Verwendung von Perzentilen eine schlechte Methode zur Auswahl von Kategoriegrenzen ist. Erstens entsprechen diese Grenzen möglicherweise nicht den Teilen der Verbreitung, in denen biologisch signifikante Veränderungen auftreten. Angenommen, Sie führen eine Studie über die Vitamin-C-Aufnahme und das Skorbutrisiko in den Vereinigten Staaten durch. Wenn Sie die Vitamin-C-Zufuhr in fünf Gruppen aufteilen würden, würden Sie feststellen, dass der gesamte Zusammenhang zwischen Vitamin-C-Konsum und Skorbut auf die unterste Gruppe und innerhalb dieser Gruppe nur auf einen kleinen Anteil der Menschen beschränkt ist, die eine außergewöhnlich niedrige Vitamin-C-Zufuhr hatten. 10 mg Vitamin C pro Tag können Skorbut vorbeugen, aber diejenigen, die weniger als diese Menge zu sich nehmen, machen nur einen Bruchteil von 1 % der Bevölkerung in den Vereinigten Staaten aus.²⁰Die Verwendung prozentualer Kategorien würde es unmöglich machen, die Auswirkung einer unzureichenden Vitamin-C-Zufuhr auf das Skorbutrisiko zu bestimmen, da jede Zufuhr über 10 mg/Tag im Wesentlichen gleichwertig ist. If we routinely use percentile cut points, we may not know if we are facing the same problem as when researching vitamin C and scurvy. Eine effektivere Alternative wäre, mit vielen engen Kategorien zu beginnen und benachbarte Kategorien zusammenzuführen, bis signifikante Risikounterschiede sichtbar werden.

Das zweite Problem bei perzentilbasierten Kategorien besteht darin, dass es schwierig ist, Ergebnisse zwischen Studien zu vergleichen, da Kategorien zwischen Studien, die Perzentilkategoriegrenzen verwenden, wahrscheinlich nicht übereinstimmen. Dieses Problem kann vermieden werden, indem Grenzwerte in den natürlichen Einheiten der Variablen ausgedrückt werden (z. B. mg/Tag für die Vitamin-C-Aufnahme). Es ist auch nützlich, Mittelwerte oder Mediane innerhalb von Kategorien anzugeben.

Missverständnis 5. Man sollte immer P-Werte oder Konfidenzintervalle angeben, die für mehrere Vergleiche korrigiert wurden.

Bei herkömmlichen Anpassungen für mehrere Vergleiche wird der P-Wert oder die Breite eines Konfidenzintervalls basierend auf der Anzahl der durchgeführten Vergleiche erhöht. When analyzing biological data that is full of real relationships, the premise for traditional adaptations is shaky and the adaptations are difficult to defend. Die Sorge vor Mehrfachvergleichen rührt von der Angst her, falsch signifikante Ergebnisse zu finden (Typ-I-Fehler im Fachjargon der Statistik). In Missverständnis 6 diskutieren wir die Probleme, die mit der Verwendung statistischer Signifikanztests für die Datenanalyse verbunden sind. Bevor wir uns jedoch mit diesen Problemen befassen, betrachten wir die Gründe für die Anpassung der gemeldeten Ergebnisse für mehrere Vergleiche.

Trotz der Tatsache, dass ein einzelner Signifikanztest eine 5-prozentige Chance (auf dem herkömmlich verwendeten Niveau) haben soll, signifikant zu sein, wenn die Nullhypothese wahr ist, und daher mehrere Tests bei korrekter Durchführung jeweils diese Eigenschaft aufweisen sollten, besteht die Sorge, dass die Durchführung mehrerer Tests die Wahrscheinlichkeit eines falsch positiven Ergebnisses erhöht. Natürlich steigt mit der Anzahl der Tests auch die Wahrscheinlichkeit, dass ein oder mehrere Tests falsch positiv ausfallen, aber das liegt nur daran, dass viele Tests durchgeführt werden. Anpassungen für Mehrfachvergleiche reduzieren diese Arten von Fehlern vom Typ I, allerdings auf Kosten einer Zunahme von Fehlern vom Typ II, bei denen es sich bei Vorliegen einer echten Beziehung um nicht signifikante Testergebnisse handelt. Wenn beobachtete Beziehungen alle das Ergebnis von Zufällen sind, können Fehler vom Typ I auftreten, Fehler vom Typ II jedoch nicht. Wenn umgekehrt die beobachteten Beziehungen alle tatsächliche Beziehungen widerspiegeln, können Fehler vom Typ II auftreten, Fehler vom Typ I jedoch nicht. Der Kontext jeder Analyse hat daher grundlegende Auswirkungen auf die Interpretation der Daten. Insbesondere ist es absurd, Anpassungen vorzunehmen, die Fehler vom Typ I auf Kosten einer Erhöhung von Fehlern vom Typ II reduzieren, ohne die geschätzten relativen Kosten und die Häufigkeit jedes Fehlertyps zu bewerten.

Wenn Wissenschaftler Zufallszahlen statt biologischer Daten untersuchen würden, wären alle signifikanten Ergebnisse, die sie melden, Fehler vom Typ I, und Anpassungen für mehrere Vergleiche wären sinnvoll; Einige Skeptiker glauben, dass Studien zu genomweiten Assoziationsscans dieser Situation nahe kommen.²¹ Wenn Wissenschaftler jedoch eher biologische Zusammenhänge als Zufallszahlen untersuchen, ist die Annahme, dass Fehler vom Typ I das größte Problem darstellen, möglicherweise falsch.²²Eine strengere Bewertung der Notwendigkeit von Multiplizitätsanpassungen würde mit einer Bewertung der Haltbarkeit der Behauptung beginnen, dass es sich bei den Daten im Wesentlichen um Zufallszahlen handelt. Bei der Untersuchung von Experimenten zu paranormalen Phänomenen könnte Skepsis gegenüber den Ergebnissen ein Argument für Multiplizitätsanpassungen sein. Bei der Untersuchung der physiologischen Wirkungen pharmazeutischer Wirkstoffe sind reale Assoziationen zu erwarten und die Anpassungen sind schwieriger zu verteidigen. Die Untersuchung einzelner Nukleotidpolymorphismen in Bezug auf eine bestimmte Krankheit könnte ein Mittelweg sein. Ein theoretisch vertretbarerer Ansatz für dieses Problem ist ein Bayesian-Ansatz, bei dem Ex-ante-Glaubwürdigkeit verschiedenen Beziehungsebenen zugewiesen wird und Anpassungen mithilfe des Bayes-Theorems vorgenommen werden, um die posteriore Glaubwürdigkeit zu berechnen.^23,24

Missverständnis 6. Signifikanzforschung ist nützlich und wichtig für die Dateninterpretation.

Die Signifikanzforschung hat zu weitaus mehr Missverständnissen und Fehlinterpretationen geführt als zu Klarheit bei der Interpretation von Forschungsergebnissen.^25–28Ein Signifikanztest ist eine verschlechterte Version des P-Werts, einer statistischen Größe, die Präzision und Effektgröße kombiniert und zwei wesentliche Aspekte der Dateninterpretation verwechselt. Die Messung der Effektgröße und -präzision als separate Aufgaben ist ein direkterer und klarerer Ansatz zur Dateninterpretation.

Bei Studien, die darauf abzielen, Zusammenhänge zu messen und zu dem Schluss zu kommen, ob diese kausale Zusammenhänge widerspiegeln, sollte der Fokus auf dem Ausmaß dieser Zusammenhänge im Vordergrund stehen: Die Abschätzung von Effekten ist statistischen Tests eindeutig vorzuziehen. Im Idealfall schätzt eine Studie die Größe des Effekts ab und analysiert mögliche Fehler, die den Effekt verzerrt haben könnten. Systematische Fehler, wie z. B. Verzerrungen durch gemessene Faktoren, können mit analytischen Methoden behoben werden; Andere systematische Fehler, wie etwa die Auswirkungen von Messfehlern oder Selektionsverzerrungen, können mit Sensitivitätsanalysen (auch Bias-Analyse genannt) angegangen werden. Zufällige Fehler werden typischerweise in Konfidenzintervallen ausgedrückt, die einen Bereich von Parameterwerten liefern, die bis zu einem bestimmten Niveau mit den Daten übereinstimmen.

Es ist bedauerlich, dass ein Konfidenzintervall, aus dem sowohl eine Schätzung der Effektgröße als auch der Messgenauigkeit abgeleitet werden kann, normalerweise nur zur Beurteilung verwendet wird, ob es den Nullwert enthält oder nicht, und somit zu einem Signifikanztest wird. Signifikanztests sind ein schlechtes Klassifizierungssystem für Forschungsergebnisse; Starke Effekte können fälschlicherweise als Nullbefunde interpretiert werden, weil die Autoren das Fehlen einer statistischen Signifikanz fälschlicherweise als mangelnde Wirkung interpretieren, oder schwache Effekte können fälschlicherweise als wichtig interpretiert werden, weil sie statistisch signifikant sind. Anstatt als Ersatztests für die Signifikanz verwendet zu werden, sollten Konfidenzintervalle als quantitative Maße interpretiert werden, die das Ausmaß der Effektgröße und den Grad der Präzision angeben, wobei der genauen Lage der Grenzen des Konfidenzintervalls wenig Aufmerksamkeit geschenkt wird. Dieser Rat wird durch die „Uniform Requirements for Manuscripts Submitted to Biomedical Journals“ unterstützt, wird aber dennoch häufig übersehen, selbst von Gutachtern und Herausgebern von Zeitschriften, die diese Anforderungen unterstützen.²⁹

Viele Missverständnisse entstehen durch das Vertrauen auf statistische Signifikanztests. Ein Beispiel hierfür ist die Fokussierung auf die statistische Signifikanz von Interaktionstermen statt auf die Messung der Interaktion, wie oben erläutert. Ein weiteres Beispiel ist die Bewertung von Dosis-Wirkungs-Trends, indem einfach angegeben wird, ob ein signifikanter Trend vorliegt oder nicht, anstatt das Ausmaß und idealerweise die Form dieses Trends anzugeben. Ein weiteres Beispiel ist der manchmal gegebene Rat, bei der Berichterstattung über Ergebnisse die Aussagekraft einer Studie zu berechnen, insbesondere wenn diese Ergebnisse statistisch nicht signifikant sind. Die Angabe der Aussagekraft einer Studie als Teil der Ergebnisse wird als „Post-hoc“-Berechnung der Aussagekraft bezeichnet.³⁰Power-Berechnungen basieren auf einer Hypothese über den Grad der Assoziation, der von einer Null-Assoziation zu unterscheiden ist. Wenn jedoch die Forschungsergebnisse vorliegen, ist es nicht mehr notwendig, eine Hypothese über das Ausmaß der Assoziation zu formulieren, da Sie nun über eine Schätzung davon verfügen. Ein Konfidenzintervall für den geschätzten Zusammenhang spiegelt alle relevanten Informationen wider; eine Kapitalrechnung bringt nichts mehr.

Die unglückliche Konsequenz der Fokussierung auf statistische Signifikanztests besteht darin, dass dadurch eine dichotome Sicht auf Beziehungen entstanden ist, die quantitativ besser bewertet werden können. Diese Unterscheidung ist mehr als nur eine Feinheit. Jeden Tag kommt es zu erheblichen, bedauerlichen und vermeidbaren Fehlinterpretationen von Daten, die aus dem verwirrenden Nebel statistischer Signifikanztests resultieren. Die meisten dieser Fehler könnten vermieden werden, wenn der Schwerpunkt von statistischen Tests auf Schätzungen verlagert würde.

Fazit

Why do such important misconceptions about research persist? Diese Missverständnisse sind größtenteils ein Ersatz für nachdenklichere und schwierigere Aufgaben. Es ist einfacher, eine Diskrepanz zwischen einer Studie und einer nicht-experimentellen Studie zugunsten der Studie aufzulösen, ohne die aufwändige Analyse durchzuführen, die Hernan et al.¹⁰Het is gemakkelijk om te verklaren dat een resultaat statistisch niet significant is, waardoor ten onrechte wordt gesuggereerd dat er geen aanwijzingen zijn voor een verband, in plaats van kwantitatief te kijken naar het bereik van verbanden dat de gegevens daadwerkelijk ondersteunen. Deze misvattingen zijn een makkelijke weg, maar wanneer die weg vol is met anderen die dezelfde weg bewandelen, is er misschien weinig reden om de route in twijfel te trekken. Deze misvattingen worden inderdaad vaak in tijdschriften, klaslokalen en studieboeken in stand gehouden. Ik ben van mening dat de beste kans op verbetering ligt in het vergroten van het bewustzijn over deze kwesties, met een redelijk debat. Max Planck zei ooit: "Een nieuwe wetenschappelijke waarheid zegeviert niet door haar tegenstanders te overtuigen en hen het licht te laten zien, maar omdat haar tegenstanders uiteindelijk sterven en er een nieuwe generatie opgroeit die ermee vertrouwd is."³¹Soweit diese zynische Sichtweise zutrifft, können wir damit rechnen, dass veraltete Konzepte bestenfalls langsam verschwinden. Ich hoffe, dass das Aufzeigen dieser Missverständnisse die notwendigen Diskussionen anstoßen und ein Katalysator für Veränderungen sein wird.

Danksagungen: Ich habe nützliche Kritik von Susana erhalten Perez, Andrea Margulis, Manel Pladevall in Jordi Castellsague.

Interessenkonflikt: Der Autor erklärt, dass kein Interessenkonflikt besteht.

Korrespondierender Autor: Kenneth J. Rothman, DrPH; Research Triangle Institute, Research Triangle Park, NC, VS (E-Mail: KRothman@rti.org).

Open Access Dieser Artikel wird unter den Bedingungen der Creative Commons Attribution License verbreitet, die jede beliebige Nutzung gestattet Verbreitung und jede Vervielfältigung in einem beliebigen Medium, sofern der/die ursprüngliche(n) Autor(en) und die Quelle genannt werden.

REFERENZEN

Hernán MA, Hernández-Díaz S, Robins JM. Randomisierte Studien wurden als Beobachtungsstudien analysiert. Ann Intern Med. 2013;159:560–2. doi:10.7326/0003-4819-159-8-201310150-00709
Ioannidis JPA. Warum die meisten veröffentlichten Forschungsergebnisse falsch sind. PLoS Mit. 2005;2(8):e124.
Hiatt WR. Beobachtungsstudien zur Arzneimittelsicherheit – Aprotinin und es mangelnde Transparenz. N Engl J Med. 2006;355:2171–3.
Shaten BJ, Kuller LH, Kjelsberg MO, Stamler J, Ockene JK, Cutler JA, Cohen JD. Lungenkrebssterblichkeit nach 16 Jahren bei MRFIT-Teilnehmern in Interventions- und Regelversorgungsgruppen. Interventionsstudie mit mehreren Risikofaktoren. Ann Epidemiol 1997;7:125–36.
Grodstein F., Manson JE, Colditz GA, et al. Eine prospektive Beobachtungsstudie zur postmenopausalen Hormontherapie und Primärprävention Herz-Kreislauf-Erkrankungen. Ann Intern Med. 2000;133:933–41.
Varas-Lorenzo C, García-Rodríguez LA, Pérez-Gutthann S, et al. Hormonersatztherapie und Inzidenz eines akuten Myokardinfarkts Infarkt. Verkehr. 2000;101:2572–8.
Hulley S, Grady D, Bush T, Furberg C, Herrington D, Riggs B, Vittinghoff E. Randomisierte Studie mit Östrogen plus Gestagen zur Sekundärprävention koronarer Herzkrankheit bei postmenopausalen Frauen. Forschungsgruppe Herz- und Östrogen/Gestagen-Ersatzstudie (HERS). JAMA. 1998;280:605–13. doi:10.1001/jama.280.7.605.
Manson JE, Hsia J, Johnson KC, et al. Östrogen plus Gestagen und das Risiko einer koronaren Herzkrankheit. N Engl J Med. 2003;349:523–34.
Taubes G. Wissen wir wirklich, was uns gesund macht? New York Times, 16. September 2007.
Hernán MA, Alonso A, Logan R, Grodstein F, Michels K, Willett WC, Manson JE, Robins JM. Als randomisierte Experimente analysierte Beobachtungsstudien: eine Anwendung auf die postmenopausale Hormontherapie und koronare Herzkrankheit. Epidemiologie. 2008;19:766–79. doi:10.1097/EDE.0b013e3181875e61
Concato J. Beobachtungs- versus experimentelle Studien: Was ist der epidemiologische Beweis für eine Hierarchie? NeuroRx. 2004;1:341–7.
Vandenbroucke JP, Pearce N. Fallkontrollstudien: Grundkonzepte. Int J Epidemiol. 2012;41:1480–9. doi:10.1093/race/dys147.
Rothman KJ. Kapitel 5, Arten epidemiologischer Studien, in Epidemiologie, eine Einführung, 2e Ausgabe. Oxford University Press, New York, 2012.
Doll R, Hill AB. Mortalität unter Ärzten im Zusammenhang mit ihren Rauchgewohnheiten: ein vorläufiger Bericht. Br Med J 1954;ii:1451–5.
Rothman KJ, Gallacher J, Hatch EE. Warum Repräsentativität vermieden werden sollte. Int J Epidemiol. 2013;42:1012–4. doi:10.1093/walk/dys223
Rothman KJ, Gallacher J, Hatch EE. Wenn es um wissenschaftliche Schlussfolgerungen geht, ist eine Zigarre manchmal nur eine Zigarre. Int J Epidemiol. 2013;42:1026–8. doi:10.1093/walk/dyt124
Rothman KJ. Kapitel 11, Messung der Interaktion, in Epidemiologie, An Einführung, 2e Ausgabe. Oxford University Press, New York, 2012.
Knol MJ, van der Tweel I, Grobbee DE, Numans ME, Geerlings MI. Schätzung der Interaktion auf einer additiven Skala zwischen kontinuierlichen Determinanten in einem logistischen Regressionsmodell. Int J Epidemiol. 2007;36:1111–8.
Skali H, Parving HH, Parfrey PS, Burdmann EA, Lewis EF, Ivanovich P, Keithi-Reddy SR, McGill JB, McMurray JJ, Singh AK, Solomon SD, Uno H, Pfeffer MA. TREAT-Ermittler: Schlaganfall bei Patienten mit Typ-2-Diabetes mellitus, chronischer Nierenerkrankung und Anämie, die mit Darbepoetin alfa behandelt wurden: die Studie zur Reduzierung kardiovaskulärer Ereignisse mit Aranesp -Therapie (BEHANDELN). Verkehr. 2011;124:2903–8.
Empfohlene Tagesdosis an Vitamin C, Vitamin E, Selen und Carotinoiden. Institut für Medizin, The National Academies Press, Washington, D. C., 2000.
Dudbridge F, Gusnanto A. Schätzung der Signifikanzschwellen für genomische Assoziationsscans. Genet Epidemiol. 2008;32:227–34.
Rothman KJ. Für Mehrfachvergleiche sind keine Anpassungen erforderlich. Epidemiologie. 1990;1:43–6.
Greenland S, Robins J. Empirisch-bayesianische Anpassungen für mehrere statistische Vergleiche sind manchmal nützlich. Epidemiologie. 1991;2:244–51.
Greenland S, Poole C. Empirisch-bayesianische und semi-bayesianische Ansätze zur Überwachung von Berufs- und Umweltrisiken. Arch-Umgebung Gesundheit. 1994;48:9–16.
Rothman KJ. Ein Vertrauensbeweis (Redaktion). N Engl J Med. 1978;299:1362–3.
Poole C. Jenseits des Konfidenzintervalls. Bin J Public Hlth. 1987;77:195–9.
Rothman KJ. Auf der Suche nach Bedeutung (Redaktion). Ann Int Med. 1986;105:445–7.
Gelman A, Stern H. Der Unterschied zwischen „signifikant“ und „nicht signifikant“ an sich ist statistisch nicht signifikant. Amerikanischer Statistiker. 2006;60:328–31.
Einheitliche Anforderungen für Manuskripte, die bei biomedizinischen Fachzeitschriften eingereicht werden, http://www.icmje.org/manuscript_1prepare.html (konsultiert am 2. Mai 2013)
Smith AH, Bates MN. Konfidenzgrenzenanalysen sollten Leistungsberechnungen bei der Interpretation epidemiologischer Studien ersetzen. Epidemiologie. 1992;3:449–52.
Planck M. Wissenschaftliche Autobiographie und andere Artikel, Philosophical Library, New York, 1968, vert. F. Gaynor (New York, 1949), S. 33–34

Fußnoten

1
Manchmal ist es überall Het-akademische Insolvenz in vier Unternehmen
2
Siehe auch den Artikel vom Juni 2021 über wissenschaftliche Integrität
3
Das Originalstück ist hier https://doi.org/10.1007/s11606-013-2755-z

← Jessica Rose, Kevin McKernan und ihre Katzen – nachträglicher GedankeDas Dilemma der antiinstitutionellen Wissenschaft →

Möchten Sie eine E-Mail mit einem neuen Artikel erhalten?

Beiträge zu virusvaria sind erlaubt! Klicken Sie und geben Sie den Betrag selbst über Ideal oder Paypal ein
👇

Etwas beitragen? Bitte! Klicken Sie hier.

...oder bezahlen per

Möchten Sie eine E-Mail mit einem neuen Artikel erhalten?

Etwas beitragen? Bitte! Klicken Sie hier.

...oder bezahlen per

Kommentare

Kommentare, die keinen Bezug zum Diskussionsthema haben, werden gelöscht. Halten Sie Kommentare stets respektvoll und sachlich.

9 Kommentare

J.G.M. van der Zanden am 01.07.2026 um 15:29 Uhr

Schöner Streit über die epidemiologischen Prinzipien und Details. TS Kuhn sagte 1962, dass die „Bastion der Wissenschaft“ weiterhin die vorherrschenden Paradigmen verteidigt, bis sie nach einem langen Kampf gegen Mainstream-Wissenschaftler nicht mehr haltbar sind ... https://www.lri.fr/~mbl/Stanford/CS477/papers/Kuhn-SSR-2ndEd.pdf

6

Antwort
1. Miriam Ferwerda am 01.08.2026 um 17:15 Uhr
  
  210 Seiten, JGM! Mit Niels Bohr und Bertrand Russell im Beirat ... Und ich hatte bereits eine so lange Leseliste.
  
  2
  
  Antwort
  1. J.G.M. van der Zanden am 01.08.2026 um 18:54 Uhr
    
    Dann lesen Sie zumindest das Wiki-Lemma ...
    Aber seine Beispiele in seinem Buch sind sehr interessant und lohnenswert…. Aber ich habe das Buch etwa 1975 gelesen … Dann hatte ich als Student der Elektrotechnik auch mehr Zeit...
    
    Antwort
    1. Cees Mul am 01.09.2026 um 17:37 Uhr
      
      Zur Leseliste hinzugefügt. Für mich ist es eine Aufholjagd.
      
      Überall, wo ich hinschaue, sehe ich interessante Dinge. Als Kind habe ich mich auf den neuen Donald Duck, später auf den PEP, jetzt Virusvaria und viele andere Dinge gefreut. Immer noch etwas intellektuelles Wachstum in all den Jahren :-).
      
      1
      
      Antwort
Willem am 01.07.2026 um 15:38 Uhr

Danke, dass du diesen Artikel geteilt hast, Anton.

Rothman lehrte viele Jahre am Erasmus MC, war leicht zugänglich, aber ein bisschen mürrisch (Studenten und Kollegen hatten ein bisschen Angst vor ihm). Aber er hat sehr gute Vorträge gehalten und ein, ja, schönes Buch über Epidemiologie geschrieben: „epidemiology an intriduction“, dessen Lektüre ich jedem empfehlen kann, der unterhalb der Zeile liest. Es ist leicht zu lesen und verwendet wenig bis gar keinen Fachjargon.

Ein Artikel, der ebenfalls Spaß macht, ist ein satirischer Artikel von Rothman über einen der epidemiologischen Helden einer vergangenen Ära: John Snow. Snow entdeckte, dass sich Cholera über Wasser und nicht über die Luft ausbreitet (Miasma). Dies war damals (wir sprechen von der Mitte des 19. Jahrhunderts) eine große und wichtige Entdeckung. Was Rothman im folgenden Artikel getan hat, ist, als ob Snow in der Gegenwart lebte und durch einen Förderantrag untersuchen wollte, ob sich Cholera über Wasser oder Luft ausbreitet. Spoiler-Alarm: Snow erhält die Subvention nicht und Rothman erklärt (satirisch), warum nicht, siehe:

https://pubmed.ncbi.nlm.nih.gov/26829161/

Unter Epidemiologen ist Rothman ein etwas seltsamer Mensch. Ursprünglich ein Zahnarzt, der sich für Naturwissenschaften interessierte. Er war/ist wichtig, weil sein großer Vorgänger und Förderer (Miettinen) völlig unklar über Epidemiologie schrieb. Rithman hat es geschafft, Miettinen aufschlussreich zu übersetzen. Allerdings gab es vor 1970 keine Epidemiologen.

In der COVID-Saga schneidet Rothman recht gut ab. Bis etwa Mitte 2021 vergaß er, etwas über die neue Krankheit zu sagen. Leider (wenn ich mich recht erinnere) hat er sich tatsächlich für eine Impfung ausgesprochen, aber das war erst weit in das Jahr 2021 hinein und wie wir alle wissen, war der Druck für die hohen Bäume groß, sich den damaligen Wahnvorstellungen anzupassen. Lassen Sie mich nur sagen, dass er nicht dadurch berühmt wurde, dass er sich in den Medien als COVID-Experte darstellte. Er hätte es tun können, aber er hat es nicht getan und das spricht für ihn.

6

Antwort
1. c am 01.07.2026 um 22:15 Uhr
  
  Einige bekannte Namen bei WUR, die ich sehr schätzte und von denen Huub Savelkoul während der ersten COVID-Welle in einem Talkshow-Tisch kurzzeitig für Vitamin D plädierte (ich dachte, es sei positiv), wurden ebenfalls schnell durch die Corona-Mühle geworfen. Das WUR ist zu einem WEF-HUB geworden und kritisches Verhalten wurde 2020 verboten. Einige Jahre zuvor musste ein Kind von mir ein Verfahren gegen einen Professor einer anderen Universität einleiten. Der Prozess wurde von meinem Kind gewonnen, aber es hieß: „Reden Sie nicht darüber, denn es wird Ihrem Diplom nicht gut tun, weil Sie der Universität einen schlechten Ruf einbringen könnten.“ Dann denken Sie, dass es die Schuld dieser Person war und dass es sich um einen Zwischenfall handelte, aber wir wissen es jetzt besser (schlimmer...). Aber auch, dass wir in „der Schlacht“ nicht allein sind, insbesondere nachdem wir den obigen Artikel gelesen haben. Danke noch einmal!
  
  3
  
  Antwort
Peter Engelfriet am 01.07.2026 um 22:42 Uhr

Es könnte auch interessant sein zu erwähnen, dass Sander Greenland (Co-Autor von Modern Epidemiology) Co-Autor der Studie von Fraiman et al. war. Artikel über die Nebenwirkungen der Impfstoffe basierend auf den Daten der klinischen Studie: https://research.bond.edu.au/en/publications/serious-adverse-events-of-special-interest-following-mrna-covid-1/

4

Antwort
J.G.M. van der Zanden am 01.08.2026 um 00:23 Uhr

Das ist zwar nicht völlig abseits des Themas, aber ich denke, viele Menschen können diesen Ausblick von 2026 bis 2050 auch zu schätzen wissen.
========================
Wir leben in turbulenten Zeiten.

Sie könnten einen hoffnungsvollen, positiven Masterplan 2050 mit einer „kontrollierten Explosion“ der parasitären Blasen und Exzesse gebrauchen, damit wir dann auf einer ehrlichen menschlichen Grundlage aus verlässlichem Geld und echter Arbeit aufbauen können.

Allgemeine menschliche Grundsätze dieses Masterplans 2050:
1. Ich denke, die 10 Gebote von Moses sind mehr als genug. Und vor allem: Du sollst nicht stehlen (und daher auch anderen keine Länder wegnehmen). Dann werden alle Kriege sofort enden. Souveränität und Selbstbestimmung sind „heilige“ Prinzipien. Russland zieht sich aus der Ukraine zurück. Die Ukraine gibt den Russen im Donbass Lebens- und Kulturraum. Israel gewährt den Palästinensern Wohnraum gemäß den UN-Grenzen von 1948; und Hamas und die Palästinenser erkennen Israel an. Die USA lassen Venezuela und Grönland in Ruhe. China (und die USA!) lässt Taiwan und Hongkong in Ruhe.
2. Ich greife auch gerne auf andere universelle Prinzipien zurück: die allgemeinen Naturgesetze und die Gesetze der Logik.
EU-Grundsätze
3. Es gibt keinen einheitlichen Weg für Europa, denn alle EU-Länder sind in ihren Kulturen und damit auch in ihren Normen und Werten unglaublich unterschiedlich. Sie alle haben daher ihre eigenen spezifischen Probleme. Gut, lass es so; Freiheit, Glück.
4. Deshalb muss die EU zur echten Subsidiarität zurückkehren. Also gemeinsam nur das tun, was notwendig oder für alle offensichtlich nützlich ist, und alles andere den einzelnen Ländern überlassen.
5. Das bedeutet: Reduzierung der EU-Regeln, der Bürokratie und des Personals um etwa 80 bis 90 %. Zurück zur EGKS. Versuchen Sie nicht, das Unvereinbare zu vereinen.
6. Der Euro kann weiterhin existieren. Wir müssen dann die 3 %- und 60 %-Regel strikt durchsetzen. Aber die EZB muss eine Inflation von 0 % anstreben, damit Bürger und Sparer/Rentenkassen nicht dauerhaft verarmen und große Kapitalbesitzer und der Staat (Schulden) nicht ungerechtfertigt bereichert werden. Also: Die EZB erhöht die Einlagenzinsen und lässt Spekulanten und Südeuropa mit ihren bizarren Schulden zurück, die vom Geld der zukünftigen Jugend leben; Hören Sie auf, die (Staats-)Schulden usw. zu erhöhen.
7. Angesichts der kulturellen Unterschiede vermute ich, dass dies impliziert, dass es einen Nord-Euro und einen Süd-Euro geben sollte. Es sei denn natürlich, dass sie auch in Südeuropa vernünftiger werden (wollen)...; dann können sie im Euro bleiben. Aber wir helfen ihnen nicht, klüger zu werden; das liegt in ihrer eigenen Verantwortung.

Die Niederlande

8. Für die Niederlande gilt eine recht einfache, aber leider noch nicht allgemein akzeptierte Reihe logischer Prioritäten in den Bereichen, in denen die Regierung eine Aufgabe hat und in denen das meiste Geld ausgegeben wird.

VWS
9. Stellen Sie sicher, dass sinnvolle Pflege nur auf der Grundlage der Priorität des Mehrwerts bereitgestellt wird. Und dafür sorgen, dass die Menschen gesünder leben und sich ernähren. Dann kann das Budget von VWS um 50 % reduziert werden. Die Wartelisten für Patienten mit schwerwiegenden psychischen Erkrankungen werden dann sofort verschwinden.

OCW
10. Stellen Sie sicher, dass die Bildung auf die Zeit vor 50 Jahren zurückgeht, als wir in den internationalen Rankings für Sprache, Rechnen und Mathematik noch die Nummer 1 waren. Nutzen Sie noch einmal die Methoden von vor etwa 50 Jahren, die ursprünglich auch der Pionier des „Fehlerfreien Rechnens in 12 Wochen“ verwendet hat. Dadurch kann/muss der Personalaufwand von ca. 30 % (Betreuer, Rucksackkoordinatoren, Förderlehrer, außerschulische Moloche ohne Mehrwert etc. etc.) auf jeden Fall wegfallen und die Klassen können etwas größer werden, wenn mehr Disziplin von den Schülern verlangt wird. Sonderschulen und Fachschulen werden wiederhergestellt. Dies spart etwa 40 % des Bildungsbudgets.
11. Sorgen Sie dafür, dass die Debatte in den Medien wieder eröffnet wird. Sie spielen eine beispiellos falsche Rolle (besonders sichtbar seit Corona), indem sie ihre eigenen (linken) Positionen priorisieren und positiv formulieren; und alle anderen Ansichten (insbesondere rechte und wissenschaftlich fundierte Kritik an der Regierungspolitik) aufzuheben oder extrem negativ umzuformulieren.

MinFin (dies kann nur international geregelt werden, wenn wir den Euro behalten)
12. Stellen Sie sicher, dass die DNB wieder das tut, was sie hätte tun sollen: Inflation = 0 % = Preisstabilität. Damit Eigentumsrechte an Spar- und Pensionskassen wieder gewährleistet und vor staatlichen Eingriffen oder Geldverwässerung geschützt werden
13. Und als DNB einen sehr effizienten Girokonto-Service mit gesetzlichem Zahlungsmittel bereitstellen, der ebenso wie Banknoten völlig anonym genutzt werden kann (also ein unbegrenzter digitaler Euro; und nicht das abgespeckte CBDC, mit dem man maximal 3.000 € zinslos (!) aufbewahren kann. Das ist Diebstahl vom Bürger und ein Kniestoß für die Bankenlobby.).
14. Den Banken verbieten, selbst Geld zu schaffen. Sie verleihen nur das, was gespart wird.
15. Stellen Sie sicher, dass Arbeit weniger oder gar nicht besteuert wird, Konsum und Gewinne jedoch besteuert werden. Das ist schwierig, weil das Kapital mit dem Ausland konkurriert. Aber es muss getan werden.
16. Die 4. Industrielle Revolution (Digitalisierung und KI) muss in eine Deflation führen, damit alle von dieser Innovation profitieren und nicht nur die Oberschicht, die Reichen und die Kapitalbesitzer. Anstelle der bewusst kontrollierten Mindestinflation von 2 % seit 1971 (Aufgabe von Gold und Dollar) [oder sogar 1920 Aufhebung des Goldstandards], auch in Zeiten der Innovation.

SZW
17. Die Regeln der Sozialhilfe (PW), WW und WIA werden zu 100 % im Geiste umgesetzt, insbesondere von UWV, Kommunen, Ärzten, aber auch von Unternehmen und Bürgern. Dann wird es mindestens rund 0,5 Millionen weniger Leistungen bei gleichbleibender Mitarbeiterzahl im Vergleich zu derzeit 8 Millionen geben. Nur wer aufgrund von Krankheit oder Behinderung wirklich nichts tun kann, erhält eine Leistung ohne Verpflichtungen. Für Betrug oder Missbrauch drohen hohe Bußgelder und Strafen. Sozialleistungen, Zulagen und Mindestlöhne müssen komplett umgestaltet werden, damit sich (mehr) Arbeit immer für alle lohnt. Das halbiert das Budget der SZW.
18. Um den sozialen Zusammenhalt zu fördern, haben Einwanderer erst nach 10 Jahren Anspruch auf Sozialleistungen. Hier kann also nur bleiben, wer für sich selbst sorgen kann. Ein Einwanderungsverbot ist nicht nötig, aber hier bekommt man einfach nichts, also faktisch ein Einwanderungsstopp. Wer sich nicht selbst versorgen kann, wird sofort abgeschoben. Genau wie in Australien, den USA und Kanada und allen Ländern mit „normalem Wirtschaftsdenken“.

EZK & Klima (mit der neusten Angabe aufhören!)
19. Stoppen Sie die ideologische Null-CO2-Ambition: Es ist wirtschaftliches Harakiri im Vergleich zu China, Indien und den USA, die weiterhin fossile Brennstoffe verwenden, und außerdem praktisch sinnlos (in Ermangelung einer bewiesenen und nachweisbaren Kausalität, dass dies überhaupt irgendetwas löst. Rob Jetten „36 Milliarden Euro gegen 0,000037 °C Erwärmung“; wenn das überhaupt wahr ist...).
20. Hören Sie also auf, Gas bewusst deutlich zu verteuern und Strom relativ billiger zu machen; und auch alle anderen E-Subventionen stoppen. Es sei denn, es lässt sich ein positiver Business Case für eine E-Umstellung vorlegen (das ist nur möglich, wenn die vollständige saisonale Speicherung rentabel ist...). Wo nötig, fossile Brennstoffe nutzen und auf die Kernfusion warten oder „normale“ Kernenergie nutzen, wenn das wirtschaftlich machbar ist.
21. Schluss mit der idiotischen Stickstoffdiskussion: Stickstoff ist ein guter Dünger; NL hat keine Natur, nur Kultur. Und die Wasserqualität scheint für die Wasserreinigung hervorragend zu sein. Mehr NOx und NH4 führt zu anderen Tieren. Na und?
22. Schluss mit dem Branchen-Bashing. Es ist hervorragend, dass es Umweltvorschriften gibt und diese strikt durchgesetzt werden. Aber nicht über die gleichen Qaly-Standards (ca. 30.000 €/Qaly) hinaus, die jetzt auch für das Gesundheitswesen gelten. Dann muss zum Beispiel Tata Steel noch lange nicht schließen, ist meine Erwartung. Es ist schon jetzt unermesslich sauberer als in den 1970er-Jahren.

DER
23. Sorgen Sie dafür, dass die Demokratie wieder wie vorgesehen funktioniert. In Koalitionen gibt es also keine Ausschlüsse von (extrem) links/rechts, sondern echte Repräsentativität. Seit Jahren sind etwa 75 % der Bevölkerung der Meinung, dass „etwas“ gegen die Einwanderung getan werden sollte. Aber aufgrund der Ausgrenzung und Sabotage der (extremen) rechten bis Mitte- und linken Parteien passiert überhaupt nichts. Das untergräbt das Vertrauen in die Regierung.
24. Stoppen Sie die (weitgehend geheime) Lobbyarbeit großer Unternehmen und staatlich subventionierter NGOs in der Politik. Stellen Sie sicher, dass Entscheidungen zu 100 % transparent sind. Das WOO muss durch die Verpflichtung der Minister ersetzt werden, in jeder Entscheidung ALLE relevanten Argumente, insbesondere Gegenargumente, ausdrücklich darzulegen. Heikler Punkt, denn Politik lebt von Schattenseiten, Tricks und Betrug... Aber damit muss Schluss sein. Dies untergräbt auch das Vertrauen in die Regierung und schürt Verschwörungstheorien.
25. Um die derzeitige Korruption und Ineffizienz endgültig zu stoppen, müssen die drei Bereiche der Gesellschaft (schrittweise) strikt voneinander getrennt werden, cfm. die Prinzipien der Sozialen Dreiparteien, damit sie sich nicht länger gegenseitig erpressen oder verunreinigen können:

A. Rechtsleben (Der Staat): Die Regierung beschränkt sich ausschließlich auf demokratisches Recht und Sicherheit (die 10 Gebote). Hier sind alle zu 100 % gleich. Der Staat hört auf, Meinungen, Wissenschaft oder Unternehmen zu subventionieren.

B. Das spirituelle Leben (Kultur, Bildung und Wissenschaft): Dieser Bereich muss 100 % frei sein. Kein staatlicher Lehrplan im Bildungswesen, keine subventionierte Medienvoreingenommenheit und keine „Politikwissenschaft“ (wie Klima, Stickstoff und Corona-Dogma). Wissenschaft muss wieder auf freier Erfindung und Naturgesetzen basieren, nicht auf politischer Wünschbarkeit.

C. Wirtschaftsleben: Dies ist der Bereich der freien Zusammenarbeit und des Handwerks (Ingenieure, Landwirte, Unternehmer). Hier der Business Case und die Logik der Kettenregel. Die Politik hört auf, den Markt durch ideologische Steuern (CO2/Stickstoff) oder Gelddiebstahl (Inflation) zu stören. Monopole, die ihre Stellung missbrauchen, werden natürlich von der Regierung bekämpft.

VROM
26. Die Immobilienblase muss durch die Abschaffung des Hypothekenzinsabzugs geplatzt werden (klingt heuchlerisch, weil meiner bereits abbezahlt ist). Das bedeutet aber, dass die nächste Generation nur dann Häuser kaufen kann, wenn ihre eigenen Eltern, die von dieser Blase profitiert haben, ihren Kindern bei der Investition helfen. Das ist nicht fair. Das wird aber schon eingeleitet, denn es wird auch mehr für den Staat bringen (haha...). Darüber hinaus müssen die Tabus und idiotischen Regeln gegen Neubauten unglaublich gelockert werden. Das Problem ist nicht „Bauen“, sondern vor allem Baugenehmigungen. Auch hier handelt es sich wieder um ein von der Regierung geschaffenes Problem.

Verteidigung & Souveränität/BuZa
27. Es muss eine Armee für interne Notfälle geben, die im Notfall die Polizei unterstützt oder sogar überstimmt. Als kleines Land ist die Armee immer zu klein, um Sie vollständig zu verteidigen. Deshalb müssen wir allen fremden Ländern freundlich und tolerant begegnen. Wir sind aktives Mitglied der Vereinten Nationen, um die internationale Rechtsordnung bestmöglich zu unterstützen. Das liegt im Interesse aller kleinen Länder. Es sollte argumentiert werden, dass die Gruppe der kleinen Länder im UN-Kontext auch über Atomwaffen verfügt, um große Länder abzuschrecken.
28. Wir haben in den Niederlanden keine wesentlichen Rohstoffe. Für einen gewissen Wohlstand sind wir daher per Definition auf das Ausland angewiesen. Die einzigen international relevanten Vermögenswerte sind Kenntnisse in den Bereichen Wasser, Landwirtschaft und Gartenbau. und etwas Erdgas. Und auch unser Allgemeinwissen, unsere Sprachkenntnisse und unser Handelsinstinkt. Deshalb ist es für ein Land von entscheidender Bedeutung, weise, vernünftig und daher gut gebildet zu sein. Und unsere (relativ begrenzten) Vermögenswerte für den internationalen Handel zu nutzen und unsere Vermögenswerte gegen relevante Rohstoffe und (Halb-)Fertigprodukte einzutauschen.

Die anderen Ministerien
29. Darüber hinaus sind (kleine) Verbesserungen in vielen Bereichen erforderlich: Kriminalität (insbesondere weniger Rückfälle; Drehtürkriminelle werden nicht länger geduldet, sondern dauerhaft eingesperrt oder „aufgeräumt“), Landwirtschaft (Megaställe und Massentierhaltung dürfen zugelassen werden), öffentlicher Verkehr nur, wenn er wirklich günstiger ist als der Individualverkehr usw. Besonders notwendig ist die Reduzierung der vielen komplexen und oft widersprüchlichen Vorschriften sowie die Größe der Landes-, Landes- und Kommunalverwaltung.

Ganz einfach, oder? Ein bisschen wie Platon. Ein bisschen à la Rudolf Steiner. Und ein bisschen wie Edin Mujagić
Leider wird dies nicht bald realisiert werden. Denn es gibt viel zu viele Interessenbindungen. Und verwirrende ideologische Positionen.
Aber hier und da tauchen Menschen mit solchen Erkenntnissen auf.
Hoffentlich geschieht dies schnell genug, bevor es zu einem Krieg und/oder einer Mega-Finanzkrise kommt (was mit ziemlicher Sicherheit auf die anhaltende Verarmung der Bürger und die Bildung von Schuldenblasen zurückzuführen ist...). Denn dann könnte die neue Welt von 2025 durchaus verwirklicht werden.

Geschieht dies nicht rechtzeitig, wird es leider schiefgehen.

Und wenn die Niederlande nicht rechtzeitig repariert werden, werden immer mehr erfolgreiche und kreative Menschen aus den Niederlanden nach Skandinavien, Afrika oder Asien fliehen ...

Vermisse ich etwas? Oder habt ihr noch bessere Ideen?

Dann melde sie.

Wir wünschen Ihnen ein erfolgreiches Jahr 2026 im Vorfeld des Jahres 2050!

5

Antwort
1. J.G.M. van der Zanden am 01.08.2026 um 15:48 Uhr
  
  Ich habe hier eine völlig neue Version erstellt, die vollständiger und konsistenter ist. Leider kann ich das alte nicht entfernen oder verbessern...
  
  Aktuelle Version verlinken:
  https://docs.google.com/document/d/1JkQfUGTG3nG3hy2eJ-YZAiZCYIu-R8BK/edit?usp=sharing&ouid=113155463720193786240&rtpof=true&sd=true
  
  Antwort

Geben Sie einen Kommentar ab Antwort abbrechen

Views (inst:8-10-'21): 1.019

← Jessica Rose, Kevin McKernan und ihre Katzen – nachträglicher GedankeDas Dilemma der antiinstitutionellen Wissenschaft →