Seitdem ich mich nur mit meinem kommunikationsanalytischen Hintergrund und einer Grundausstattung an Argumentationstheorie, Statistik, Logik, Wissenschaftsphilosophie usw. mit medizinischen und epidemiologischen Studien beschäftige, bin ich oft von den wissenschaftlichen Denkweisen überrascht, denen ich im Studium begegnet bin. Anfangs dachte ich, ich könnte daraus etwas lernen, aber allzu oft stieß ich auf interne Inkonsistenzen, implizite Annahmen und falsche Schlussfolgerungen; eigentlich hauptsächlich argumentationstheoretische Angelegenheiten. Wenn Sie dafür eine Antenne entwickelt haben, werden Sie dies als kontraintuitiv empfinden: Daher lohnt es sich, es zu überprüfen.
Ich sah, dass wissenschaftlicher Fachjargon als Abkürzung zur Umgehung logischer Denkprozesse genutzt wurde. Gerade in Bereichen, in denen es um viele Milliarden Dollar geht, werden legitime kritische Fragen mit dem Mantra übertüncht, dass jeder vergessen habe, woher sie kämen und wofür sie gedacht seien. Es scheint schlampiges Denken zu geben, Menschen verlassen sich auf die gegenseitige Bestätigung, wenn es ihnen passt (ohne überhaupt auf widersprüchliche Daten einzugehen), Menschen verstecken sich hinter komplizierten multifaktoriellen Korrekturen, während Rohdaten auf völlig gegensätzliche Schlussfolgerungen hinzuweisen scheinen usw. usw. Es stellte sich bald heraus, dass es nicht nur an meiner Unwissenheit lag.1Manchmal ist es überall Het-akademische Insolvenz in vier Unternehmen Dies wurde mir auch klar, als ich gegenüber Fachleuten (auch Akademikern) auf den entsprechenden Gebieten meine Zweifel – manchmal sogar Bestürzung – zum Ausdruck brachte.
Dann ist es ermutigend, wenn sich herausstellt, dass ein anerkannter wissenschaftlicher Leiter es viel früher gesehen hat. Diese Zweifel sind also nicht so idiotisch.
Kenneth J. Rothman hat es bereits 2014 aufgeführt. Wenn sich das nur die wissenschaftsanbetenden Dogmatiker und Wissenschaftspopularisierer zu Herzen nehmen würden ... aber ich fürchte, dass Max Planck recht haben wird: Das wird sicherlich noch eine Generation dauern. Und dann war er immer noch optimistisch.
Gleichzeitig sehe ich auch, warum dieser Ansatz Probleme bereitet: Nur wer scharf denken kann, wird auch weiterhin in der Lage sein, Wissenschaft auf diese Weise zu betreiben. Unsere wissenschaftliche Welt, insbesondere die großen Institute, ist teilweise mit gefügigen Mittelständlern gefüllt, und die gehen nicht einfach weg. Sie gehen sogar weiter als Forscher, die andere Prioritäten haben als Teamplayer zu sein, einen guten Ruf zu wahren oder mit politikbejahenden Vorschlägen Geld einzustreichen. Denken Sie einfach darüber nach, womit ein Institut mehr machen kann. Untergrabung oder Bestätigung des aufgebauten Konsenses? Der Fortschritt der Wissenschaft kann leicht als institutionenbedrohend angesehen werden. Und je grundlegender, desto antiinstitutioneller.
Bei solch einem strengeren Qualitätsstandard bleiben auch hartnäckige Schreier, die Jargon und Konsens verwenden, freundliche Experten und Legacy Science™-Experten auf der Strecke. Sie müssen in der Lage sein, Ihre eigenen Urteile zu fällen, fundierte Schätzungen vornehmen zu können (und sich dazu zu trauen), Ihre eigenen Gewissheiten zu hinterfragen, zu abstrahieren usw., und das ist nicht jedermanns Sache. Das ist sicherlich nicht „inklusiv“, denn eine Diskriminierung aufgrund des Gehirns ist natürlich nicht möglich. (s) Auch Einfaltspinsel sollten mitmachen können! Gerade wenn sie in der Wissenschaft unterrepräsentiert sind, ist positive Diskriminierung nur fair! Nur gemeinsam können wir aufholen!(/s)
Das bedeutet sicherlich nicht, dass jeder, der etwas schreit, immer ernst genommen werden sollte. Die Leitlinien zur wissenschaftlichen Integrität sind hierfür ein guter Leitfaden und können auch als Prüfstein dienen. Leider werden diese Richtlinien nicht mehr angewendet. Unsere führenden Institute ignorieren sie (nehmen Sie zum Beispiel die „Transparenz“ der Kernrichtlinie, die die anderen Kernrichtlinien tatsächlich überprüfbar macht).2Siehe auch den Artikel vom Juni 2021 über wissenschaftliche Integrität und behalten dennoch ihren wissenschaftlichen Status. Diese Richtlinien werden daher zu gegebener Zeit angepasst, damit alles wieder stimmt...
Auf diese Weise können sie weiterhin die sechs grundlegenden Fehler machen, die Rothman 2014 identifizierte und für die er auch verblüffende Beispiele lieferte. Prägnant und klar, daher die vollständige Übersetzung in der Hoffnung, dass seine Argumentation noch einmal entstaubt wird.
Über Kenneth J. Rothman
Kenneth J. Rothman ist ein amerikanischer Epidemiologe, der weltweit als einer der Begründer der modernen epidemiologischen Methodik bekannt ist. Er wurde 1945 geboren und ist vor allem für seine einflussreichen Arbeiten zu epidemiologischer Kausalität, Voreingenommenheit und Forschungsmethoden bekannt. Rothman erhielt seinen Doktortitel (Sc.D.) in Epidemiologie von der Harvard School of Public Health.
Einstellung zu gängigen medizinischen Dogmen:
Rothman betont immer wieder, dass Wissenschaft nicht zu einer Glaubensstruktur verkommen dürfe. Er plädiert für Transparenz, methodische Reinheit und eine weiterhin kritische Haltung gegenüber institutionellen Interessen – einschließlich des pharmazeutischen Einflusses in der klinischen Forschung.
Dies ist in seiner Arbeit deutlich zu erkennen statistische Signifikanz ist nicht gleich wissenschaftliche Wahrheit - Eine Botschaft, die heute dringender denn je ist.
Wichtige Arbeit:
Er schrieb das Standardwerk "Modern Epidemiology" – ursprünglich von ihm allein geschrieben, später in Zusammenarbeit mit Sander Greenland und Timothy Lash. Dieses Buch gilt als das 'Bibel' der empirischen Epidemiologie.
Wissenschaftliche Beiträge:
- Er führte das Konzept ein und systematisierte es verwirrend und Interaktion (Effektmodifikation).
- Er betonte die Bedeutung von Kausaldiagramme (Vorgänger von DAGs – Directed Asymmetric Graphs).
- Er wies auf die Grenzen von p-Werten und die Gefahr hin statistische Ritualisierung in der Medizin.
- Er kritisierte auch die übermäßige Abhängigkeit von „Signifikanzgrenzen“ in der Forschung, die zu irreführenden Schlussfolgerungen führen könne.
Institute und Zeitschriften:
Er ist der Gründer des Magazins Epidemiologie (gestartet 1990), das eine Alternative zu übermäßig konservativen, institutionell kontrollierten medizinischen Publikationen bieten sollte.
Unten finden Sie die Übersetzung seines Artikels3Das Originalstück ist hier https://doi.org/10.1007/s11606-013-2755-z.
Zusammenfassung
Wissenschaftliche Erkenntnisse ändern sich schnell, die Konzepte und Methoden der Forschung ändern sich jedoch langsamer. Um die Diskussion über veraltete Denkweisen bei der Durchführung von Forschung anzuregen, liste ich sechs Missverständnisse über Forschung auf, die noch lange bestehen bleiben, nachdem ihre Mängel offensichtlich geworden sind.
Die Missverständnisse sind:
- Es gibt eine Hierarchie der Forschungsdesigns; Randomisierte Studien bieten die größte Validität, gefolgt von Kohortenstudien, während Fall-Kontroll-Studien am wenigsten zuverlässig sind.
- Ein wesentliches Element für eine gültige Verallgemeinerung besteht darin, dass die Probanden eine repräsentative Stichprobe einer Zielpopulation darstellen.
- Wenn ein Term, der das Produkt zweier Faktoren in einem Regressionsmodell angibt, statistisch nicht signifikant ist, gibt es keine biologische Wechselwirkung zwischen diesen Faktoren.
- Bei der Kategorisierung einer kontinuierlichen Variablen besteht ein sinnvolles Schema zur Auswahl kategorialer Grenzwerte darin, perzentildefinierte Grenzwerte zu verwenden, beispielsweise Quartile oder Quintile der Verteilung.
- Man sollte immer P-Werte oder Konfidenzintervalle angeben, die für mehrere Vergleiche korrigiert wurden.
- Signifikanzforschung ist nützlich und wichtig für die Dateninterpretation.
Diese Missverständnisse halten sich in Zeitschriften, Klassenzimmern und Lehrbüchern hartnäckig. Sie bleiben bestehen, weil es sich um intellektuelle Abkürzungen handelt, die eine durchdachtere Herangehensweise an Forschungsprobleme verhindern. Ich hoffe, dass das Aufzeigen dieser Missverständnisse die notwendigen Diskussionen anstoßen wird, um diese veralteten Ideen endgültig zu begraben.
Kenneth J. Rothman, DrPH
Research Triangle Institute, Research Triangle Park, NC, VS; Boston University School of Public Health, Boston, MA, VS.
SCHLÜSSELWÖRTER: Forschungsdesign; Dateninterpretation; epidemiological methods; Repräsentativität; Bewertung der Interaktion; multiple comparisons; percentile limits; statistische Signifikanztests.
PMID:24452418 | PMCID:PMC4061362 | DOI:10.1007/s11606-013-2755-z
© Die Autoren 2014. Dieser Artikel ist Open Access auf Springerlink.com veröffentlicht
Es gibt immer noch überraschend viele Missverständnisse über die Durchführung von Forschungen mit menschlichen Probanden. Manche Missverständnisse bleiben bestehen, obwohl das Gegenteil gelehrt wird, andere wiederum, weil das Gegenteil gelehrt werden sollte. Um die Diskussion über diese Themen anzuregen, liste ich hier sechs hartnäckige Missverständnisse über Forschung auf und gebe eine kurze Zusammenfassung der Probleme, die jedes dieser Missverständnisse mit sich bringt.
Missverständnis 1. Es gibt eine Hierarchie der Studiendesigns: Randomisierte Studien bieten die größte Validität, gefolgt von Kohortenstudien, während Fall-Kontroll-Studien am wenigsten zuverlässig sind.
Randomisierte Studien gelten oft als „Goldstandard“ unter den Studientypen, sind aber selbst in der Theorie nicht perfekt. Darüber hinaus ist die Annahme, dass aus der Art der Studie auf die Vergleichsvalidität von Forschungsergebnissen geschlossen werden kann, falsch.
Obwohl einige glauben, dass Beweise aus einer randomisierten Studie genauso überzeugend sind wie logische Beweise, kann keine empirische Studie absolute Sicherheit bieten. Wenn randomisierte Studien perfekt wären, wie könnten sie dann zu unterschiedlichen Ergebnissen führen? Tatsächlich unterliegen sie mehreren Fehlern1. Natürlich gibt es zufällige Fehler, wie es bei einer Studie zu erwarten wäre, die auf einer zufälligen Zuordnung basiert. Es gibt aber auch systematische Fehler oder Verzerrungen. Beispielsweise werden randomisierte Studien in der Regel nach dem Intention-to-Treat-Prinzip analysiert, wobei die zunächst zufällig zugewiesenen Gruppen unabhängig von späteren Nichteinhaltungen verglichen werden. Die Nichteinhaltung führt dazu, dass die Wirkung der Behandlung unterschätzt wird. Diese Verzerrung wird normalerweise als akzeptabel angesehen, da sie durch die Vorteile einer zufälligen Zuweisung ausgeglichen wird. Allerdings ist eine Unterschätzung der Wirkungen in einer Sicherheitsstudie zur Aufdeckung von Nebenwirkungen der Behandlung nicht akzeptabel. Eine weitere wichtige Quelle für Verzerrungen in einer randomisierten Studie sind Fehler bei der Ergebnisbewertung, beispielsweise die Unterzählung von Ergebnisereignissen. Selbst wenn die Randomisierung zu Beginn der Studie für ein Gleichgewicht zwischen den Risikofaktoren der Gruppen sorgt, kann es im Laufe der Langzeitbeobachtung aufgrund unterschiedlicher Studienabbrecher oder Veränderungen in der Verteilung der Risikofaktoren zu einer zunehmenden Unausgewogenheit der Studiengruppen kommen. In Langzeitstudien kann es daher sein, dass der Nutzen einer zufälligen Zuordnung mit der Zeit abnimmt.
Kurz gesagt, das Studium ist alles andere als perfekt. Darüber hinaus liefern sowohl Kohorten- als auch Fallkontrollstudien bei richtiger Konzeption und Durchführung valide Ergebnisse. Es ist daher falsch, einer Studie, die auf einer Hierarchie von Forschungsdesigns basiert, unüberlegt mehr Aussagekraft zu verleihen2,3. Beispielsweise ist der Zusammenhang zwischen Zigarettenrauchen und Lungenkrebs auf der Grundlage von Erkenntnissen aus Kohorten- und Fall-Kontroll-Studien gut belegt. Dieser Zusammenhang konnte in einer randomisierten Studie nie eindeutig nachgewiesen werden. Es ist nicht einfach, Menschen zufällig einer Raucher- oder Nichtrauchergruppe zuzuordnen, aber wenn die Raucherentwöhnung im Rahmen einer vielschichtigen Intervention in der Randomized Multiple Risk Factor Intervention Trial untersucht wurde4, entwickelten diejenigen, die dazu ermutigt wurden, mit dem Rauchen aufzuhören, tatsächlich mehr Lungenkrebs als diejenigen, die nicht dazu ermutigt wurden, mit dem Rauchen aufzuhören. Die Ergebnisse der Studie haben die Ergebnisse der vielen Kohorten- und Fallkontrollstudien, die ohne Randomisierung durchgeführt wurden, nicht umgekehrt. Vielmehr wurde die Diskrepanz auf Probleme mit der Studie zurückgeführt.
Ein weiteres markantes Beispiel sind die Ergebnisse großer Kohortenstudien5,6 wiesen darauf hin, dass das Risiko einer koronaren Herzkrankheit bei postmenopausalen Hormonkonsumenten verringert war, spätere Ergebnisse aus zwei randomisierten Studien zeigten jedoch keinen Zusammenhang oder ein erhöhtes Risiko.7,8Die Reaktion in der wissenschaftlichen Gemeinschaft und der populären Presse9bestand darin, die Ergebnisse der Kohortenstudien in der Annahme zu diskreditieren, dass sie durch die randomisierten Studien widerlegt worden seien. Viele halten weiterhin an dieser Interpretation fest, aber in einer eleganten Neuanalyse stellen Hernan et al.10wiesen darauf hin, dass die Studiengruppen in den Kohortenstudien und den randomisierten Studien unterschiedlich waren und dass die Auswirkungen des Hormonkonsums nach der Menopause je nach Alter und Zeit seit der Menopause stark variierten. Als die Studien auf neue Hormonkonsumenten beschränkt waren, haben Hernan et al. zeigten, dass Unterschiede in der Verteilung von Alter und Zeit seit der Menopause alle offensichtlichen Diskrepanzen erklären könnten. Obwohl es üblich ist, solche Diskrepanzen auf inhärente Schwächen nicht-experimenteller Studien zurückzuführen, ist es zu einfach, die Gültigkeit auf der Grundlage einer angenommenen Hierarchie von Studientypen zuzuordnen.11
Ebenso sollten Diskrepanzen zwischen Kohortenstudien und Fall-Kontroll-Studien nicht oberflächlich durch einen angenommenen Validitätsvorteil von Kohortenstudien gegenüber Fall-Kontroll-Studien erklärt werden. Gut konzipierte Fall-Kontroll-Studien werden zu denselben Ergebnissen führen wie gut konzipierte Kohortenstudien. Wenn Konflikte auftreten, können sie auf Probleme in einer oder beiden Studienarten zurückzuführen sein. Obwohl Fall-Kontroll-Studien lange Zeit als veraltete Versionen von Kohortenstudien abgetan wurden, die von der Krankheit ausgehen und auf mögliche Ursachen zurückblicken, betrachten Epidemiologen Fall-Kontroll-Studien heute als konzeptionell identisch mit Kohortenstudien, mit Ausnahme eines Effizienzgewinns, der sich aus der Stichprobe der Nenner ergibt, anstatt eine vollständige Zählung durchzuführen. Tatsächlich ermöglichen diese Effizienzgewinne, dass in Fall-Kontroll-Studien mehr Ressourcen für die Expositionsbewertung oder Fallvalidierung aufgewendet werden können, was zu einer geringeren Verzerrung führt als in entsprechenden Kohortenstudien zum gleichen Zusammenhang.
Diejenigen, die Fall-Kontroll-Studien als veraltete Versionen von Kohortenstudien betrachten, ziehen manchmal die falsche Analogie, dass die Kontrollen den Fällen sehr ähnlich sein müssen, außer dass sie nicht die Krankheit haben, die den Fall definiert. Tatsächlich soll die Kontrollgruppe in einer Fall-Kontroll-Studie eine Stichprobe des Bevölkerungsnenners sein, der die Fälle hervorbringt, ein Ersatz für die vollständigen Nenner, die in einer Kohortenstudie ermittelt wurden. Die Kontrollgruppe muss daher der gesamten Forschungsgruppe ähneln und nicht den Fällen.12,13 Bei gutem Design können Fall-Kontroll-Studien die gleiche hervorragende Validität erreichen wie gut konzipierte Kohortenstudien, während eine schlecht konzipierte Studie unzuverlässig sein kann. Die Art der Studie sollte nicht als Maßstab für die Validität einer Studie herangezogen werden.
Missverständnis 2. Ein wesentliches Element für gültige Verallgemeinerungen aus einer Studie besteht darin, dass es sich bei den Probanden um eine repräsentative Stichprobe einer Zielpopulation handelt.
Dieses Missverständnis hängt mit der Ansicht zusammen, dass die wissenschaftliche Verallgemeinerung eine mechanische Extrapolation der Ergebnisse einer Stichprobe auf die Quellpopulation beinhaltet. Aber das beschreibt die statistische Verallgemeinerung; Die wissenschaftliche Verallgemeinerung ist etwas anders: Es ist der Prozess, eine korrekte Aussage über die Funktionsweise der Natur zu treffen.
Die wissenschaftliche Verallgemeinerung ist das ultimative Ziel der wissenschaftlichen Forschung, aber eine Voraussetzung dafür ist die Gestaltung einer Studie mit interner Validität, die dadurch verbessert wird, dass alle Störvariablen konstant gehalten werden. Wann haben wir jemals von Tierforschern gehört, die nach einer statistisch repräsentativen Stichprobe von Tieren suchen? Stattdessen ist ihr Ansatz fast das Gegenteil des Strebens nach Repräsentativität. Beispielsweise bevorzugen Biologen, die Mäuse untersuchen, Mäuse, die in Bezug auf Gene und Umwelt homogen sind und sich nur in Bezug auf die experimentell manipulierte Variable unterscheiden. Im Gegensatz zur statistischen Verallgemeinerung von Umfragen oder Stichproben, die nur eine Extrapolation von der Stichprobe auf die Quellpopulation erfordert, erfolgt die wissenschaftliche Verallgemeinerung durch fundierte Vermutungen, jedoch nur auf der sicheren Plattform einer gültigen Umfrage. Folglich sind Studien aussagekräftiger, wenn sie die Variabilität der Störfaktoren begrenzen, anstatt auf Repräsentativität zu zielen. Puppe und Hügel14untersuchten die Sterblichkeit männlicher britischer Ärzte im Zusammenhang mit ihren Rauchgewohnheiten. Ihre Ergebnisse galten als weitgehend verallgemeinerbar, obwohl ihre Studiengruppe hinsichtlich Geschlecht, Rasse, ethnischer Zugehörigkeit, sozialer Klasse, Nationalität und vielen anderen Variablen nicht repräsentativ für die Gesamtbevölkerung der Tabakkonsumenten war.
Wenn es eine berechtigte Frage darüber gibt, ob eine Gesamtassoziation je nach Untergruppe einer dritten Variablen, wie etwa Alter oder ethnischer Gruppe, variiert, kann es notwendig sein, Personen aus einem breiten Wertebereich dieser dritten Variablen einzubeziehen, aber selbst dann ist es kontraproduktiv, wenn die Studiengruppe repräsentativ für die Quellpopulation dieser Variablen ist. Das Ziel wäre in diesem Fall, Probanden einzubeziehen, die gleichmäßig über das Spektrum verteilt sind oder in einer Verteilung, die die Gesamteffizienz der Studie erhöht. Eine Stichprobe, die für die Quellpopulation repräsentativ ist, ist nicht optimal.15,16
Missverständnis 3. Wenn ein Term, der das Produkt zweier Faktoren in einem Regressionsmodell angibt, statistisch nicht signifikant ist, gibt es keine biologische Wechselwirkung zwischen diesen Faktoren.
Der Begriff „biologisch“ sollte hier im weitesten Sinne verstanden werden und umfasst biochemische, psychologische, verhaltensbezogene und physische Interaktionen. Das Problem besteht darin, dass Interaktionen normalerweise mithilfe von Regressionsmodellen bewertet werden, bei denen sich der Produktbegriff eher auf statistische als auf biologische Interaktionen bezieht.
Unter biologischer Interaktion versteht man zwei oder mehr Ursachen, die im selben Mechanismus wirken und deren Wirkungen voneinander abhängig sind. Es beschreibt einen natürlichen Zustand. Wenn Basiseffekte als Veränderungen des Krankheitsrisikos gemessen werden, kommt es zu einer synergistischen (d. h. positiven) biologischen Wechselwirkung, wenn die gemeinsame Wirkung zweier kausaler Faktoren größer ist als die Summe ihrer einzelnen Wirkungen.17Statistische Interaktion hingegen beschreibt nicht die Natur, sondern ein mathematisches Modell. Dies wird üblicherweise mit einem Produktterm für zwei Variablen in einem Regressionsmodell bewertet. Seine Größe hängt von der Wahl der Maße und der Messskala ab. Statistische Interaktion impliziert lediglich, dass die grundlegende funktionale Form eines bestimmten mathematischen Modells keine angemessene Beschreibung der Beziehung zwischen Variablen ist. Zwei Faktoren, die biologisch interagieren, können je nach verwendetem Modell statistisch interagieren oder auch nicht.
Produktbegriffe in Regressionsmodellen haben Einheiten, die schwer zu interpretieren sind. Wenn eine Variable der Fettverbrauch ist, gemessen in Gramm pro Tag, und eine andere die Anzahl der Packungsjahre gerauchter Zigaretten, wie ist dann eine Variable zu interpretieren, deren Einheit Gramm/Tag mit Packungsjahren multipliziert ist? Die Herausforderung bei der Interpretation solcher Produkttermkoeffizienten hat dazu geführt, dass der Schwerpunkt eher auf dem mit dem Koeffizienten verbundenen p-Wert als auf der Größe des Koeffizienten selbst liegt. Die Konzentration auf den p-Wert oder darauf, ob der Koeffizient eines Produktterms statistisch signifikant ist, verschlimmert nur das Problem der Verwechslung statistischer Interaktion mit biologischer Interaktion (siehe Missverständnis 6). Eine aussagekräftigere Bewertung der Interaktion bestünde darin, sich auf den Prozentsatz der Krankheitsfälle zu konzentrieren, die auf biologische Interaktionen zurückzuführen sind.17,18
Nehmen Sie ein einfaches Beispiel aus der TREAT-Studie (Trial to Reduce Cardiocular Events with Aranesp Therapy).19), die das Schlaganfallrisiko bei 4.038 Patienten mit Diabetes mellitus, chronischer Nierenerkrankung und Anämie bewertete, die nach dem Zufallsprinzip einer Gruppe mit Darbepoetin alfa oder einer Gruppe mit Placebo zugeordnet wurden. Bei Patienten ohne Schlaganfall in der Vorgeschichte betrug das Schlaganfallrisiko während des Studienzeitraums 2 % bei Patienten, die Placebo erhielten, und 4 % bei Patienten, die Darbepoetin alfa erhielten. Bei Patienten mit Schlaganfall in der Vorgeschichte betrugen die entsprechenden Risiken 4 % bzw. 12 %. Die Autoren stellten fest, dass der Risikoanstieg für Darbepoetin alfa bei Patienten mit Schlaganfall in der Vorgeschichte größer war, lehnten diese Wechselwirkung jedoch ab, da der Produktterm in einem logistischen Regressionsmodell statistisch nicht signifikant war. Das erhöhte Risiko, das auf Darbepoeitin alfa zurückzuführen ist, betrug 2 % bei Patienten ohne Schlaganfall in der Vorgeschichte und 8 % bei Patienten mit Schlaganfall in der Vorgeschichte, was auf eine starke biologische Wechselwirkung zwischen Darbepoeitin alfa und Schlaganfall in der Vorgeschichte hinweist. Wären die Risiken rein additiv, läge das Risiko bei Patienten mit beiden Risikofaktoren bei 6 % statt der tatsächlichen 12 %. Die Hälfte des Risikos bei Patienten mit beiden Risikofaktoren scheint auf biologische Wechselwirkungen zurückzuführen zu sein, obwohl die Autoren behaupten, dass es keine Wechselwirkungen gab.
Missverständnis 4. Bei der Kategorisierung einer kontinuierlichen Variablen besteht ein sinnvolles Schema zur Auswahl der Kategoriegrenzen darin, perzentildefinierte Grenzen zu verwenden, z. B. Quartile oder Quintile der Verteilung.
Es gibt zwei Gründe, warum die Verwendung von Perzentilen eine schlechte Methode zur Auswahl von Kategoriegrenzen ist. Erstens entsprechen diese Grenzen möglicherweise nicht den Teilen der Verbreitung, in denen biologisch signifikante Veränderungen auftreten. Angenommen, Sie führen eine Studie über die Vitamin-C-Aufnahme und das Skorbutrisiko in den Vereinigten Staaten durch. Wenn Sie die Vitamin-C-Zufuhr in fünf Gruppen aufteilen würden, würden Sie feststellen, dass der gesamte Zusammenhang zwischen Vitamin-C-Konsum und Skorbut auf die unterste Gruppe und innerhalb dieser Gruppe nur auf einen kleinen Anteil der Menschen beschränkt ist, die eine außergewöhnlich niedrige Vitamin-C-Zufuhr hatten. 10 mg Vitamin C pro Tag können Skorbut vorbeugen, aber diejenigen, die weniger als diese Menge zu sich nehmen, machen nur einen Bruchteil von 1 % der Bevölkerung in den Vereinigten Staaten aus.20Die Verwendung prozentualer Kategorien würde es unmöglich machen, die Auswirkung einer unzureichenden Vitamin-C-Zufuhr auf das Skorbutrisiko zu bestimmen, da jede Zufuhr über 10 mg/Tag im Wesentlichen gleichwertig ist. If we routinely use percentile cut points, we may not know if we are facing the same problem as when researching vitamin C and scurvy. Eine effektivere Alternative wäre, mit vielen engen Kategorien zu beginnen und benachbarte Kategorien zusammenzuführen, bis signifikante Risikounterschiede sichtbar werden.
Das zweite Problem bei perzentilbasierten Kategorien besteht darin, dass es schwierig ist, Ergebnisse zwischen Studien zu vergleichen, da Kategorien zwischen Studien, die Perzentilkategoriegrenzen verwenden, wahrscheinlich nicht übereinstimmen. Dieses Problem kann vermieden werden, indem Grenzwerte in den natürlichen Einheiten der Variablen ausgedrückt werden (z. B. mg/Tag für die Vitamin-C-Aufnahme). Es ist auch nützlich, Mittelwerte oder Mediane innerhalb von Kategorien anzugeben.
Missverständnis 5. Man sollte immer P-Werte oder Konfidenzintervalle angeben, die für mehrere Vergleiche korrigiert wurden.
Bei herkömmlichen Anpassungen für mehrere Vergleiche wird der P-Wert oder die Breite eines Konfidenzintervalls basierend auf der Anzahl der durchgeführten Vergleiche erhöht. When analyzing biological data that is full of real relationships, the premise for traditional adaptations is shaky and the adaptations are difficult to defend. Die Sorge vor Mehrfachvergleichen rührt von der Angst her, falsch signifikante Ergebnisse zu finden (Typ-I-Fehler im Fachjargon der Statistik). In Missverständnis 6 diskutieren wir die Probleme, die mit der Verwendung statistischer Signifikanztests für die Datenanalyse verbunden sind. Bevor wir uns jedoch mit diesen Problemen befassen, betrachten wir die Gründe für die Anpassung der gemeldeten Ergebnisse für mehrere Vergleiche.
Trotz der Tatsache, dass ein einzelner Signifikanztest eine 5-prozentige Chance (auf dem herkömmlich verwendeten Niveau) haben soll, signifikant zu sein, wenn die Nullhypothese wahr ist, und daher mehrere Tests bei korrekter Durchführung jeweils diese Eigenschaft aufweisen sollten, besteht die Sorge, dass die Durchführung mehrerer Tests die Wahrscheinlichkeit eines falsch positiven Ergebnisses erhöht. Natürlich steigt mit der Anzahl der Tests auch die Wahrscheinlichkeit, dass ein oder mehrere Tests falsch positiv ausfallen, aber das liegt nur daran, dass viele Tests durchgeführt werden. Anpassungen für Mehrfachvergleiche reduzieren diese Arten von Fehlern vom Typ I, allerdings auf Kosten einer Zunahme von Fehlern vom Typ II, bei denen es sich bei Vorliegen einer echten Beziehung um nicht signifikante Testergebnisse handelt. Wenn beobachtete Beziehungen alle das Ergebnis von Zufällen sind, können Fehler vom Typ I auftreten, Fehler vom Typ II jedoch nicht. Wenn umgekehrt die beobachteten Beziehungen alle tatsächliche Beziehungen widerspiegeln, können Fehler vom Typ II auftreten, Fehler vom Typ I jedoch nicht. Der Kontext jeder Analyse hat daher grundlegende Auswirkungen auf die Interpretation der Daten. Insbesondere ist es absurd, Anpassungen vorzunehmen, die Fehler vom Typ I auf Kosten einer Erhöhung von Fehlern vom Typ II reduzieren, ohne die geschätzten relativen Kosten und die Häufigkeit jedes Fehlertyps zu bewerten.
Wenn Wissenschaftler Zufallszahlen statt biologischer Daten untersuchen würden, wären alle signifikanten Ergebnisse, die sie melden, Fehler vom Typ I, und Anpassungen für mehrere Vergleiche wären sinnvoll; Einige Skeptiker glauben, dass Studien zu genomweiten Assoziationsscans dieser Situation nahe kommen.21 Wenn Wissenschaftler jedoch eher biologische Zusammenhänge als Zufallszahlen untersuchen, ist die Annahme, dass Fehler vom Typ I das größte Problem darstellen, möglicherweise falsch.22Eine strengere Bewertung der Notwendigkeit von Multiplizitätsanpassungen würde mit einer Bewertung der Haltbarkeit der Behauptung beginnen, dass es sich bei den Daten im Wesentlichen um Zufallszahlen handelt. Bei der Untersuchung von Experimenten zu paranormalen Phänomenen könnte Skepsis gegenüber den Ergebnissen ein Argument für Multiplizitätsanpassungen sein. Bei der Untersuchung der physiologischen Wirkungen pharmazeutischer Wirkstoffe sind reale Assoziationen zu erwarten und die Anpassungen sind schwieriger zu verteidigen. Die Untersuchung einzelner Nukleotidpolymorphismen in Bezug auf eine bestimmte Krankheit könnte ein Mittelweg sein. Ein theoretisch vertretbarerer Ansatz für dieses Problem ist ein Bayesian-Ansatz, bei dem Ex-ante-Glaubwürdigkeit verschiedenen Beziehungsebenen zugewiesen wird und Anpassungen mithilfe des Bayes-Theorems vorgenommen werden, um die posteriore Glaubwürdigkeit zu berechnen.23,24
Missverständnis 6. Signifikanzforschung ist nützlich und wichtig für die Dateninterpretation.
Die Signifikanzforschung hat zu weitaus mehr Missverständnissen und Fehlinterpretationen geführt als zu Klarheit bei der Interpretation von Forschungsergebnissen.25–28Ein Signifikanztest ist eine verschlechterte Version des P-Werts, einer statistischen Größe, die Präzision und Effektgröße kombiniert und zwei wesentliche Aspekte der Dateninterpretation verwechselt. Die Messung der Effektgröße und -präzision als separate Aufgaben ist ein direkterer und klarerer Ansatz zur Dateninterpretation.
Bei Studien, die darauf abzielen, Zusammenhänge zu messen und zu dem Schluss zu kommen, ob diese kausale Zusammenhänge widerspiegeln, sollte der Fokus auf dem Ausmaß dieser Zusammenhänge im Vordergrund stehen: Die Abschätzung von Effekten ist statistischen Tests eindeutig vorzuziehen. Im Idealfall schätzt eine Studie die Größe des Effekts ab und analysiert mögliche Fehler, die den Effekt verzerrt haben könnten. Systematische Fehler, wie z. B. Verzerrungen durch gemessene Faktoren, können mit analytischen Methoden behoben werden; Andere systematische Fehler, wie etwa die Auswirkungen von Messfehlern oder Selektionsverzerrungen, können mit Sensitivitätsanalysen (auch Bias-Analyse genannt) angegangen werden. Zufällige Fehler werden typischerweise in Konfidenzintervallen ausgedrückt, die einen Bereich von Parameterwerten liefern, die bis zu einem bestimmten Niveau mit den Daten übereinstimmen.
Es ist bedauerlich, dass ein Konfidenzintervall, aus dem sowohl eine Schätzung der Effektgröße als auch der Messgenauigkeit abgeleitet werden kann, normalerweise nur zur Beurteilung verwendet wird, ob es den Nullwert enthält oder nicht, und somit zu einem Signifikanztest wird. Signifikanztests sind ein schlechtes Klassifizierungssystem für Forschungsergebnisse; Starke Effekte können fälschlicherweise als Nullbefunde interpretiert werden, weil die Autoren das Fehlen einer statistischen Signifikanz fälschlicherweise als mangelnde Wirkung interpretieren, oder schwache Effekte können fälschlicherweise als wichtig interpretiert werden, weil sie statistisch signifikant sind. Anstatt als Ersatztests für die Signifikanz verwendet zu werden, sollten Konfidenzintervalle als quantitative Maße interpretiert werden, die das Ausmaß der Effektgröße und den Grad der Präzision angeben, wobei der genauen Lage der Grenzen des Konfidenzintervalls wenig Aufmerksamkeit geschenkt wird. Dieser Rat wird durch die „Uniform Requirements for Manuscripts Submitted to Biomedical Journals“ unterstützt, wird aber dennoch häufig übersehen, selbst von Gutachtern und Herausgebern von Zeitschriften, die diese Anforderungen unterstützen.29
Viele Missverständnisse entstehen durch das Vertrauen auf statistische Signifikanztests. Ein Beispiel hierfür ist die Fokussierung auf die statistische Signifikanz von Interaktionstermen statt auf die Messung der Interaktion, wie oben erläutert. Ein weiteres Beispiel ist die Bewertung von Dosis-Wirkungs-Trends, indem einfach angegeben wird, ob ein signifikanter Trend vorliegt oder nicht, anstatt das Ausmaß und idealerweise die Form dieses Trends anzugeben. Ein weiteres Beispiel ist der manchmal gegebene Rat, bei der Berichterstattung über Ergebnisse die Aussagekraft einer Studie zu berechnen, insbesondere wenn diese Ergebnisse statistisch nicht signifikant sind. Die Angabe der Aussagekraft einer Studie als Teil der Ergebnisse wird als „Post-hoc“-Berechnung der Aussagekraft bezeichnet.30Power-Berechnungen basieren auf einer Hypothese über den Grad der Assoziation, der von einer Null-Assoziation zu unterscheiden ist. Wenn jedoch die Forschungsergebnisse vorliegen, ist es nicht mehr notwendig, eine Hypothese über das Ausmaß der Assoziation zu formulieren, da Sie nun über eine Schätzung davon verfügen. Ein Konfidenzintervall für den geschätzten Zusammenhang spiegelt alle relevanten Informationen wider; eine Kapitalrechnung bringt nichts mehr.
Die unglückliche Konsequenz der Fokussierung auf statistische Signifikanztests besteht darin, dass dadurch eine dichotome Sicht auf Beziehungen entstanden ist, die quantitativ besser bewertet werden können. Diese Unterscheidung ist mehr als nur eine Feinheit. Jeden Tag kommt es zu erheblichen, bedauerlichen und vermeidbaren Fehlinterpretationen von Daten, die aus dem verwirrenden Nebel statistischer Signifikanztests resultieren. Die meisten dieser Fehler könnten vermieden werden, wenn der Schwerpunkt von statistischen Tests auf Schätzungen verlagert würde.
Fazit
Why do such important misconceptions about research persist? Diese Missverständnisse sind größtenteils ein Ersatz für nachdenklichere und schwierigere Aufgaben. Es ist einfacher, eine Diskrepanz zwischen einer Studie und einer nicht-experimentellen Studie zugunsten der Studie aufzulösen, ohne die aufwändige Analyse durchzuführen, die Hernan et al.10Het is gemakkelijk om te verklaren dat een resultaat statistisch niet significant is, waardoor ten onrechte wordt gesuggereerd dat er geen aanwijzingen zijn voor een verband, in plaats van kwantitatief te kijken naar het bereik van verbanden dat de gegevens daadwerkelijk ondersteunen. Deze misvattingen zijn een makkelijke weg, maar wanneer die weg vol is met anderen die dezelfde weg bewandelen, is er misschien weinig reden om de route in twijfel te trekken. Deze misvattingen worden inderdaad vaak in tijdschriften, klaslokalen en studieboeken in stand gehouden. Ik ben van mening dat de beste kans op verbetering ligt in het vergroten van het bewustzijn over deze kwesties, met een redelijk debat. Max Planck zei ooit: "Een nieuwe wetenschappelijke waarheid zegeviert niet door haar tegenstanders te overtuigen en hen het licht te laten zien, maar omdat haar tegenstanders uiteindelijk sterven en er een nieuwe generatie opgroeit die ermee vertrouwd is."31Voor zover deze cynische visie juist is, kunnen we verwachten dat verouderde concepten in het beste geval langzaam zullen verdwijnen. Ik hoop dat het onder de aandacht brengen van deze misvattingen de nodige discussies op gang zal brengen en een katalysator voor verandering zal zijn.
Dankwoord: Ik heb nuttige kritiek ontvangen van Susana Perez, Andrea Margulis, Manel Pladevall en Jordi Castellsague.
Belangenconflict: De auteur verklaart geen belangenconflict te hebben.
Corresponderende auteur: Kenneth J. Rothman, DrPH; Research Triangle Institute, Research Triangle Park, NC, VS (e-mail: KRothman@rti.org).
Open Access Dit artikel wordt verspreid onder de voorwaarden van de Creative Commons Attribution License, die elk gebruik, elke verspreiding en elke reproductie in elk medium toestaat, mits de oorspronkelijke auteur(s) en de bron worden vermeld.
REFERENTIES
- Hernán MA, Hernández-Díaz S, Robins JM. Gerandomiseerde studies geanalyseerd als observationele studies. Ann Intern Med. 2013;159:560–2. doi:10.7326/0003-4819-159-8-201310150-00709
- Ioannidis JPA. Waarom de meeste gepubliceerde onderzoeksresultaten onjuist zijn. PLoS Med. 2005;2(8):e124.
- Hiatt WR. Observationele studies naar de veiligheid van geneesmiddelen – aprotinine en het gebrek aan transparantie. N Engl J Med. 2006;355:2171–3.
- Shaten BJ, Kuller LH, Kjelsberg MO, Stamler J, Ockene JK, Cutler JA, Cohen JD. Longkankersterfte na 16 jaar bij MRFIT-deelnemers in interventie- en gebruikelijke zorggroepen. Multiple Risk Factor Intervention Trial. Ann Epidemiol 1997;7:125–36.
- Grodstein F, Manson JE, Colditz GA, et al. Een prospectieve, observationele studie naar postmenopauzale hormoontherapie en primaire preventie van hart- en vaatziekten. Ann Intern Med. 2000;133:933–41.
- Varas-Lorenzo C, García-Rodríguez LA, Pérez-Gutthann S, et al. Hormoonvervangende therapie en incidentie van acuut myocard infarct. Circulation. 2000;101:2572–8.
- Hulley S, Grady D, Bush T, Furberg C, Herrington D, Riggs B, Vittinghoff E. Randomisierte Studie mit Östrogen plus Gestagen zur Sekundärprävention koronarer Herzkrankheit bei postmenopausalen Frauen. Forschungsgruppe Herz- und Östrogen/Gestagen-Ersatzstudie (HERS). JAMA. 1998;280:605–13. doi:10.1001/jama.280.7.605.
- Manson JE, Hsia J, Johnson KC, et al. Östrogen plus Gestagen und das Risiko einer koronaren Herzkrankheit. N Engl J Med. 2003;349:523–34.
- Taubes G. Wissen wir wirklich, was uns gesund macht? New York Times, 16. September 2007.
- Hernán MA, Alonso A, Logan R, Grodstein F, Michels K, Willett WC, Manson JE, Robins JM. Observationele studies geanalyseerd als gerandomiseerde experimenten: een toepassing op postmenopauzale hormoontherapie en coronaire hartziekten. Epidemiology. 2008;19:766–79. doi:10.1097/EDE.0b013e3181875e61
- Concato J. Observationele versus experimentele studies: wat is het epidemiologische bewijs voor een hiërarchie? NeuroRx. 2004;1:341–7.
- Vandenbroucke JP, Pearce N. Case–control studies: basic concepts. Int J Epidemiol. 2012;41:1480–9. doi:10.1093/ije/dys147.
- Rothman KJ. Hoofdstuk 5, Soorten epidemiologische studies, in Epidemiology, An Introduction, 2e editie. Oxford University Press, New York, 2012.
- Doll R, Hill AB. De sterfte onder artsen in relatie tot hun rookgewoonten: een voorlopig rapport. Br Med J. 1954;ii:1451–5.
- Rothman KJ, Gallacher J, Hatch EE. Waarom representativiteit moet worden vermeden. Int J Epidemiol. 2013;42:1012–4. doi:10.1093/ije/dys223
- Rothman KJ, Gallacher J, Hatch EE. Als het gaat om wetenschappelijke gevolgtrekkingen, is een sigaar soms gewoon een sigaar. Int J Epidemiol. 2013;42:1026–8. doi:10.1093/ije/dyt124
- Rothman KJ. Hoofdstuk 11, Interactie meten, in Epidemiology, An Introduction, 2e editie. Oxford University Press, New York, 2012.
- Knol MJ, van der Tweel I, Grobbee DE, Numans ME, Geerlings MI. Schatting van interactie op een additieve schaal tussen continue determinanten in een logistisch regressiemodel. Int J Epidemiol. 2007;36:1111–8.
- Skali H, Parving HH, Parfrey PS, Burdmann EA, Lewis EF, Ivanovich P, Keithi-Reddy SR, McGill JB, McMurray JJ, Singh AK, Solomon SD, Uno H, Pfeffer MA. TREAT-onderzoekers: Beroerte bij patiënten met diabetes mellitus type 2, chronische nierziekte en bloedarmoede die worden behandeld met darbepoëtine alfa: de studie naar het verminderen van cardiovasculaire voorvallen met Aranesp- -therapie (TREAT). Circulation. 2011;124:2903–8.
- Aanbevolen dagelijkse hoeveelheden voor vitamine C, vitamine E, selenium en carotenoïden. Institute of Medicine, The National Academies Press, Washington, D. C., 2000.
- Dudbridge F, Gusnanto A. Schatting van significantiedrempels voor genomische associatiescans. Genet Epidemiol. 2008;32:227–34.
- Rothman KJ. Er zijn geen aanpassingen nodig voor meervoudige vergelijkingen. Epidemiology. 1990;1:43–6.
- Greenland S, Robins J. Empirisch-Bayesiaanse aanpassingen voor meervoudige statistische vergelijkingen zijn soms nuttig. Epidemiology. 1991;2:244–51.
- Greenland S, Poole C. Empirisch-Bayesiaanse en semi-Bayesiaanse benaderingen van toezicht op beroeps- en milieurisico's. Arch Environ Health. 1994;48:9–16.
- Rothman KJ. Een blijk van vertrouwen (redactioneel artikel). N Engl J Med. 1978;299:1362–3.
- Poole C. Voorbij het betrouwbaarheidsinterval. Am J Public Hlth. 1987;77:195–9.
- Rothman KJ. Op zoek naar significantie (redactioneel artikel). Ann Int Med. 1986;105:445–7.
- Gelman A, Stern H. Het verschil tussen 'significant' en 'niet significant' is op zichzelf niet statistisch significant. Amer Statistician. 2006;60:328–31.
- Uniform Requirements for Manuscripts Submitted to Biomedical Journals, http://www.icmje.org/manuscript_1prepare.html (geraadpleegd op 2 mei 2013)
- Smith AH, Bates MN. Confidence limit analyses should replace power calculations in the interpretation of epidemiologic studies. Epidemiology. 1992;3:449–52.
- Planck M. Wetenschappelijke autobiografie en andere artikelen, Philosophical Library, New York, 1968, vert. F. Gaynor (New York, 1949), pp. 33–34
Fußnoten
- 1Manchmal ist es überall Het-akademische Insolvenz in vier Unternehmen
- 2Siehe auch den Artikel vom Juni 2021 über wissenschaftliche Integrität
- 3Das Originalstück ist hier https://doi.org/10.1007/s11606-013-2755-z
Mooi betoog over de epidemiologische principes en details. TS Kuhn zei in 1962 al dat het “wetenschapsbastion” de vigerende paradigma’s blijft verdedigen tot die na lange strijd tegen de mainstream wetenschappers echt niet meer houdbaar zijn… https://www.lri.fr/~mbl/Stanford/CS477/papers/Kuhn-SSR-2ndEd.pdf
210 pagina’s, JGM! Met in de advisory committee onder andere Niels Bohr en Bertrand Russell….. En ik had al zo’n lange leeslijst.
Lees dan op zijn minst het Wiki Lemma…..
Maar zijn voorbeelden in zijn boek zijn wel erg sappig en de moeite waard…. Maar ik las dat boek al in 1975 of zo…. Toen had ik ook meer tijd als student Elektrotechniek…..
Toegevoegd aan de leeslijst. Het is voor mij een inhaalrace.
Overal waar ik kijk zie ik interessante dingen voorbij komen. Als kind keek ik uit naar de nieuwe Donald Duck, later de PEP, nu onder andere Virusvaria, en nog veel andere dingen. Toch nog wat intellectuele groei doorgemaakt in al die jaren:-).
Dank voor het delen van dit artikel Anton.
Rothman gaf jarenlang college op het erasmus mc, was makkelijk benaderbaar, maar wel een beetje een brombeer (studenten en collega’s waren een beetje bang voor hem). Maar hij gaf ontzettend goed college en heeft een, ja, Leuk, boek geschreven over epidemiologie: ‘epidemiology an intriduction’, wat ik een ieder die hier onder de lijn meeleest kan aanraden om te lezen. Het leest makkelijk en gebruikt weinig tot geen jargon.
Een artikel dat ook leuk is om te lezen is een satirisch van Rothman over een van de epidemiologische helden uit lang vervlogen tijd: John Snow. Snow is de ontdekker dat cholera zich via water verspreidt en niet via lucht (miasma). Indertijd was dat een grote en belangrijke ontdekking (we spreken halverwege 19e eeuw). Wat Rothman heeft gedaan in onderstaand stuk is alsof Snow in de huidige tijd leefde en via een subsidieaanvraag wilde onderzoeken of cholera zich via water of lucht verspreidt. Spoiler alert: Snow krijgt de subsidie niet en Rothman legt uit (satirisch) waarom niet, zie:
https://pubmed.ncbi.nlm.nih.gov/26829161/
Rothman is een beetje een vreemde eend in de bijt onder epidemiologen. Van oorsprong tandarts die zich interesseerde in wetenschap. Hij was/is belangrijk omdat zijn grote voorganger en promotor (Miettinen) totaal onduidelijk over epidemiologie schreef. Rithman heeft Miettinen inzichtelijk weten te vertalen. Let wel voor 1970 waren er geen epidemiologen.
Binnen de COVID saga komt Rothman er redelijk goed vanaf. Hij heeft tot ongeveer halverwege 2021 nagelaten ook maar iets te zeggen over de nieuwe ziekte. Helaas heeft hij zich (als ik het me goed herinner) wel uitgesproken voor vaccinatie, maar dat was dus pas ver in 2021 en zoals we allen weten was de druk hoog voor de hoge bomen om zich te conformeren naar de waan van die dag. Hij is, wil ik maar zeggen, niet beroemd geworden door zich in de media te portretteren als COVID deskundige. Had hij wel kunnen doen, maar heeft hij niet gedaan en dat spreekt voor hem.
Wat voor mij bekende namen bij de WUR die ik zeer hoog had zitten en waarvan Huub Savelkoul wel even aan een talkshowtafel voor vitamine d pleitte (vond ik positief) tijdens de eerste golf COVID, draaiden ook razendsnel hun goede naam door de coronamolen. De WUR is een WEF-HUB geworden en kritisch zijn werd in 2020 verboden. Al wat jaren eerder moest een kind van mij een zaak starten tegen een hoogleraar van een andere universiteit. De zaak werd door mijn kind gewonnen maar er werd bij gezegd “praat er niet over want dat doet jouw diploma geen goed omdat je de universiteit een slechte naam zou kunnen bezorgen”. Dan denk je dat het aan die persoon lag en een incident was maar inmiddels weten we beter (slechter…). Maar ook dat we niet alleen staan in “de strijd” en helemaal na het lezen van bovenstaand artikel. Dank weer!
Misschien ook interessant te vermelden is dat Sander Greenland (co-auteur van Modern Epidemiology) mede-auteur was van het Fraiman et al. artikel over de bijwerkingen van de vaccins op basis van de Clinical Trial data: https://research.bond.edu.au/en/publications/serious-adverse-events-of-special-interest-following-mrna-covid-1/
Niet helemaal Off-Topic, denk ik dat veel mensen deze alto 2026 outlook naar 2050 ook wel kunnen waarderen.
========================
We leven in een turbulente tijd.
Die kan een hoopvol positief Masterplan 2050 met een “gecontroleerde ontploffing” van de parasitaire bubbels en uitwassen wel gebruiken, zodat we daarna weer op een eerlijk menselijk fundament van betrouwbaar geld en reële arbeid kunnen bouwen.
Algemene menselijke principes van dit Masterplan 2050:
1. Ik denk dat de 10 geboden van Mozes meer dan genoeg zijn. En dan vooral: Gij zult niet stelen (en dus ook geen landen van anderen afpakken). Dan zijn alle oorlogen direct afgelopen. Soevereiniteit en zelfbeschikking zijn “heilige” uitgangspunten. Rusland trekt zich terug uit Oekraïne. Oekraïne geeft de Russen in de Donbas levens- en culturele ruimte. Israël geeft de Palestijnen levensruimte volgens de VN-grenzen van 1948; en Hamas en de Palestijnen erkennen Israël. De VS laten Venezuela en Groenland met rust. China (en de VS!) laat Taiwan en Hongkong met rust.
2. Verder grijp ik graag terug op andere universele principes: de algemene natuurwetten en de wetten van de logica.
EU principes
3. Er is niet één route voor Europa, omdat alle EU-landen ongelofelijk verschillend zijn qua culturen en dus qua normen en waarden. Ze hebben daarom ook allemaal hun eigen specifieke problemen. Prima, laat dat zo; vrijheid, blijheid.
4. Daarom moet de EU terug naar echte subsidiariteit. Dus alleen gemeenschappelijk doen wat moet of voor iedereen evident nuttig is en verder alles bij de individuele landen laten.
5. Dit betekent: de EU regels, bureaucratie en personeel met ca. 80 a 90% verkleinen. Ongeveer terug naar de EGKS. Probeer niet te verenigen wat onverenigbaar is.
6. De Euro mag blijven bestaan. De 3% en 60% regel moeten we dan wel keihard handhaven. Maar de ECB moet naar inflatie 0% sturen zodat burgers en spaarders/pensioenpotten niet consequent verarmd worden en de grootkapitaalbezitters en staat(schulden) ongerechtvaardigd verrijkt worden. Dus: ECB depositorente verhogen, speculanten en Zuid Europa met hun bizarre schulden die op de pof van toekomstige jeugd leven op de blaren laten zitten; stoppen met ophogen van (staats)schulden etc.
7. Gelet op het cultuur verschil impliceert dat, dat er een Noord-Euro en Zuid-Euro moet komen vermoed ik. Tenzij ze natuurlijk in Zuid-Europa ook verstandiger (willen) worden……; dan mogen ze in de Euro blijven. Maar wij helpen ze niet bij dat verstandiger worden; dat is hun eigen verantwoordelijkheid.
Die Niederlande
8. Voor NL geldt dan een vrij simpele, maar helaas nog lang niet algemeen onderschreven, set van logische prioriteiten, op de gebieden waar de overheid een taak heeft en waar het meeste geld in omgaat.
VWS
9. Zorg dat er alleen nog zinnige zorg verleend wordt op prioriteit van toegevoegde waarde. En zorg dat mensen gezonder leven en eten. Dan kan de begroting van VWS met 50% verminderd worden. Wachtlijsten van serieuze GGZ-patiënten zijn dan direct verdwenen.
OCW
10. Zorg dat onderwijs weer terug gaat naar 50 jaar geleden, toen we nog op Nummer 1 in de internationale lijstjes stonden met taal, rekenen en wiskunde. Gebruik weer de methodes van ca. 50 jaar geleden die de pionier van “Foutloos rekenen in 12 weken” oorspronkelijk ook gebruikte. Daardoor kan/moet de ca. 30% stafoverhead (begeleiders, rugzakjes coördinatoren, remedial teachers, boven schoolse molochen die geen waarde toevoegen, etc. etc.) sowieso weg, en kunnen de klassen weer wat groter worden als er ook meer discipline geëist wordt van leerlingen. Het speciale onderwijs en de technische scholen worden in ere hersteld. Dit scheelt ca. 40% op de onderwijsbegroting.
11. Zorg dat het debat weer opengegooid wordt in de media. Zij vervullen (met name zichtbaar sinds Corona) een ongehoord foute rol door hun eigen (linkse) standpunten prioriteit te geven en positief te framen; en alle andere opvattingen (met name rechtse en wetenschappelijk gefundeerde kritiek op het overheidsbeleid) te cancelen of extreem negatief te reframen.
MinFin (dit kan alleen internationaal geregeld worden als we de Euro houden)
12. Zorg dat de DNB weer doet wat die had moeten doen: Inflatie = 0% = prijsstabiliteit. Zodat eigendomsrechten op spaargeld en pensioenpotten weer geborgd worden en beveiligd worden tegen staatsingrijpen of monetaire verwatering
13. En zorg als DNB voor een zeer efficiënte rekening courant service met wettig betaalmiddel dat ook volledig anoniem onderling gebruikt kan worden net als bankbiljetten (dus een onbeperkte digitale Euro; en niet de uitgeklede CBDC waarmee je maximaal €3.000 renteloos (!) kunt stallen. Dat is diefstal van de burgers en een knieval voor de bankenlobby.).
14. Verbied banken om zelf nog geld te scheppen. Ze lenen alleen uit wat gespaard wordt.
15. Zorg dat arbeid minder/niet belast wordt maar consumptie en winsten juist wel belast worden. Dit is wel lastig, omdat kapitaal concurreert met het buitenland. Maar het moet wel.
16. De 4e industriële revolutie (Digitalisering en AI) moet leiden tot deflatie zodat iedereen profiteert van deze innovatie en niet alleen de bovenlaag, de rijken en de kapitaalbezitters. I.p.v. de sinds 1971 (loslaten van goud en dollar) [of zelfs 1920 loslaten van de goudstandaard] bewust gestuurde minimaal 2% inflatie, ook in tijden van innovatie.
SZW
17. De regels van de Bijstand (PW), WW en de WIA worden met name door UWV, Gemeenten, medici, maar ook door bedrijven en burgers gewoon 100% naar de geest uitgevoerd. Dan zijn er minimaal ca. 0,5 miljoen minder uitkeringen en idem meer personeelsleden op de huidige 8 miljoen. Alleen wie echt helemaal niks kan wegens ziekte of handicap krijgt een uitkering zonder verplichtingen. Er volgen stevige boetes en straffen op fraude of misbruik. De uitkeringen, toeslagen en minimumlonen moeten totaal omgebouwd worden, zodat voor iedereen (meer) werken altijd loont. Dit halveert de begroting van SZW.
18. Om sociale cohesie te bevorderen krijgen immigranten pas na 10 jaar recht op sociale uitkeringen. Dus alleen diegenen die in hun eigen levensonderhoud kunnen voorzien kunnen hier blijven. Er is geen verbod nodig op immigratie, maar je krijgt hier gewoon niks, dus défacto een immigratiestop. Wie zichzelf niet kan onderhouden wordt direct uitgezet. Net als in Australië, de VS en Canada en alle “normaal economisch denkende” landen.
EZK & Klimaat (stop met die laatste aanduiding!)
19. Stop de ideologische zero-CO2 ambitie: het is economische harakiri t.o.v. China, India en de VS die juist fossiel blijven inzetten en ook nog vrijwel zinloos (bij gebrek aan bewezen en bewijsbare causaliteit dat dit überhaupt iets oplost. Rob Jetten “€36 miljard tegen 0,000037 0C opwarming”; als dat al waar is….. ).
20. Stop dus met expres gas veel duurder maken en stroom relatief goedkoper; en stop ook met alle andere e-subsidies. Tenzij er een positieve business case te maken is van een e-transitie (dat kan pas als complete seizoenopslag rendabel is….). Gebruik fossiel waar nodig en wacht op kernfusie of doe toch “gewone” kernenergie als dat economisch uit kan.
21. Stop de idiote stikstof discussie: stikstof is goede mest; NL heeft geen natuur, alleen cultuur. En de waterkwaliteit blijkt prima te zijn voor waterzuivering. Meer NOx en NH4 leidt tot andere diertjes. So what?
22. Stop met industrie bashen. Uitstekend dat er milieuregels zijn en dat die streng gehandhaafd worden. Maar niet verdergaand dan dezelfde qaly-normen (ca. €30.000/Qaly) die nu ook voor de zorg gelden. Dan hoeft Tata-steel bijv. nog lang niet dicht is mijn verwachting. Het is namelijk al onnoemelijk veel schoner dan in de jaren ’70.
AZ
23. Zorg dat de democratie weer werkt zoals bedoeld. Dus bij coalities geen uitsluitingen van (extreem) links/rechts, maar echte representativiteit. Nu vindt al jaren ca. 75% van de bevolking dat er “iets” gedaan moet worden aan immigratie. Maar door uitsluiting en sabotage van (extreem) rechts door midden en linkse partijen gebeurt er helemaal niks. Dat vreet aan het vertrouwen in de overheid.
24. Stop de (grotendeels geheime) lobby van grote bedrijven en door de overheid gesubsidieerde NGO’s op de politiek. Zorg dat besluiten 100% transparant zijn. De WOO moet vervangen worden door de verplichting van ministers om ALLE relevante argumenten, met name ook tegen argumenten, expliciet bij elk besluit te noemen. Gevoelig punt, omdat de politiek juist gedijt bij schimmigheid, list en bedrog…. Maar dat moet stoppen. Dit vreet ook aan het vertrouwen in de overheid en voedt complottheorieën.
25. Om de huidige corruptie en inefficiëntie definitief te stoppen, moeten de drie levensgebieden van de samenleving (geleidelijk aan) strikt van elkaar gescheiden worden cfm. de principes van de Sociale Driegeleding, zodat ze elkaar niet langer kunnen chanteren of vervuilen:
a. Het Rechtsleven (De Staat): De overheid beperkt zich uitsluitend tot het democratische recht en de veiligheid (de 10 geboden). Hier is iedereen 100% gelijk. De staat stopt met het subsidiëren van meningen, wetenschap of bedrijven.
b. Het Geestesleven (Cultuur, Onderwijs & Wetenschap): Dit gebied moet 100% vrij zijn. Geen staatscurriculum in het onderwijs, geen gesubsidieerde media-bias en geen “politieke wetenschap” (zoals het klimaat-, stikstof en Coronadogma). Wetenschap moet weer gebaseerd zijn op vrije vinding en natuurwetten, niet op politieke wenselijkheid.
c. Het Economisch Leven: Dit is het domein van de vrije coöperatie en vakmanschap (ingenieurs, boeren, ondernemers). Hier regeert de businesscase en de logica van de keten. De politiek stopt met het verstoren van de markt via ideologische belastingen (CO2/stikstof) of monetaire diefstal (inflatie). Monopolies die misbruik maken van hun positie worden uiteraard wel door de overheid tegen gegaan.
VROM
26. De huizenbubbel moet doorgeprikt worden door de hypotheekrenteaftrek af te schaffen (klinkt wel hypocriet, want die van mij is al afgelost). Maar dit veroorzaakt wel dat de volgende generatie alleen huizen kan kopen als hun eigen ouders, die van die bubbel hebben geprofiteerd, hun kinderen helpen bij de investering. Dat is niet eerlijk. Maar dit gaat al wel in gang gezet worden, omdat het de staat ook meer oplevert (haha…). Bovendien moeten de taboes en idiote regels tegen nieuwbouw ongelofelijk versoepeld worden. Het probleem is niet “bouwen”, maar vooral vergunningen om te mogen bouwen. Dus ook hier weer een door de overheid gecreëerd probleem.
Defensie & Soevereiniteit/BuZa
27. Er moet een leger zijn voor binnenlandse noodsituaties en om politie in geval van nood te assisteren of zelfs te overrulen. Als klein land is het leger altijd te klein om je compleet te verdedigen. Dus moeten we vriendschappelijk en tolerant met alle buitenlanden omgaan. Daarbij zijn we actief lid van de VN om de internationale rechtsorde maximaal te steunen. Dat is in het belang van alle kleine landen. Er zou gepleit moeten worden dat de groep van kleine landen in VN-verband ook over kernwapens beschikt ter afschrikking van grote landen.
28. We hebben in NL geen essentiële grondstoffen. We zijn dus per definitie afhankelijk van buitenlanden voor een zeker welvaartsniveau. De enige internationaal relevante assets zijn water-, land- & tuinbouw kennis; en een beetje aardgas. En daarnaast onze algemene kennis, talenkennis en ons handelsinstinct. Daarom is het cruciaal om als land wijs, verstandig en dus hoog opgeleid te zijn. En onze (relatief beperkte) assets in te zetten om internationaal te handelen en onze assets te ruilen tegen relevante grondstoffen en (half)fabricaten.
De overige ministeries
29. Verder zijn er op vele terreinen (kleine) verbeteringen nodig: criminaliteit (vooral minder recidive; draaideurcriminelen echt niet meer tolereren maar definitief vastzetten of “opruimen”), landbouw [megastallen en bio-industrie mogen wel weg], OV alleen als het echt goedkoper is dan eigen vervoer, etc. Wat vooral nodig is, is het terugdringen van de vele complexe en vaak tegenstrijdige regelgeving en van de omvang van de rijks-, provinciale- en gemeentelijke overheid.
Simpel toch? Een beetje a la Plato. Een beetje a la Rudolf Steiner. En een beetje al la Edin Mujagić
Dit zal helaas niet gauw gerealiseerd worden. Want er zijn veel te veel gevestigde deelbelangen. En verdwazende ideologische standpunten.
Maar her en der kiemen er wel mensen op met dit soort inzichten.
Hopelijk gaat dat snel genoeg voordat er een oorlog en/of een mega financiële crisis komt (en die komt vrijwel zeker door de voortdurende verarming van de burgers en opbouwende schuldenbubbels…..). Want dan kan de nieuwe wereld 2025 misschien goedschiks gerealiseerd worden.
Gebeurt dat niet op tijd, dan zal het helaas kwaadschiks gaan.
En als NL niet tijdig gerepareerd wordt vluchten steeds meer succesvolle en creatieve mensen uit NL naar Scandinavië, Afrika of Azië…..
Mis ik nog iets? Of heb jij nog betere ideeën?
Meld ze dan.
Voorspoedig 2026 gewenst in aanloop naar 2050!
Ich habe hier eine völlig neue Version erstellt, die vollständiger und konsistenter ist. Leider kann ich das alte nicht entfernen oder verbessern...
Aktuelle Version verlinken:
https://docs.google.com/document/d/1JkQfUGTG3nG3hy2eJ-YZAiZCYIu-R8BK/edit?usp=sharing&ouid=113155463720193786240&rtpof=true&sd=true