Kategorien
Gesellschaft Statistik Wissenschaft

Das NO2 – Dilemma

Kürzlich veröffentlichte das Umweltbundesamt (UBA) eine Studie zur Gesundheitsbelastung durch Stickstoffdioxid NO2 unter der Überschrift: „Stickstoffdioxid führt zu erheblichen Gesundheitsbelastungen. UBA-Studie ordnet Gesundheitsbelastung durch Stickstoffdioxid in Deutschland ein“. In der Presse wurde die Zusammenfassung der Ergebnisse dieser Studie weit stärker verkürzt, als sie auf der Webseite des UBA ohnehin schon knapp dargestellt ist. Die Zahl von knapp 6000 Todesfällen und 437.000 Erkrankungen pro Jahr wurde medial verbreitet: „Stickoxide brachten 2014 Tausenden den Tod.“ (n-tv) Das war noch eine vergleichsweise sachliche Formulierung. Die Präsidentin des UBA, Maria Krautzberger, wird auf ihrer Pressekonferenz zitiert mit dem Satz: „Die Ergebnisse, die wir vorstellen, sind die Untergrenze“, die wirklichen Zahlen lägen wohl höher. Daraus leitete sie die Forderung ab, Grenzwerte weiter zu senken, was, so die weitere Folgerung in der Presse, ohne Fahrverbote für Diesel-PKW kaum möglich sei. Ein kleiner Satz aus der kurzen Pressemitteilung selbst wurde allerdings seltener (z.B. in der FAZ) mitgeteilt: „Epidemiologische Studien ermöglichen zwar keine Aussagen über ursächliche Beziehungen. Jedoch liefern sie zahlreiche konsistente Ergebnisse über die statistischen Zusammenhänge zwischen negativen gesundheitlichen Auswirkungen und NO2-Belastungen.“

Es lohnt sich, genauer hinzuschauen darauf, was die Studie tatsächlich leistet, was ihr Ziel ist und welche Methoden sie dafür wählt, außerdem welche Einschränkungen und Vorbehalte die Autoren machen. Verantwortet wird die Studie vom Helmholtz Zentrum München GmbH, Institut für Epidemiologie, Arbeitsgruppe „Environmental Risks“. Sie ist auf den Seiten des UBA frei verfügbar,  für den Laien aber nicht ohne weiteres verständlich. Es helfen die in der Studie selbst angebotene Einleitung, Methodenerklärung und ausführliche Zusammenfassung. Die Studie ist nicht allein für das Thema Stickoxide und ihre gesundheitlichen Auswirkungen aufschlussreich, sondern paradigmatisch dafür, auf welche Weise wissenschaftliche Studien durchgeführt, aufgegriffen, zusammengefasst, medial gedeutet und in ihrer extrahierten Quintessenz verbreitet werden. Die komplexe Differenziertheit einer solchen Studie kann darin fast völlig verlorengehen.

Der genaue Titel der Studie lautet: „Quantifizierung von umweltbedingten Krankheitslasten aufgrund der Stickstoffdioxid-Exposition in Deutschland.“ Es geht also um Quantifizierung, um die größenmäßige Feststellung der Verbreitung von Stickoxiden in Deutschland 2007 – 2014, ferner um den quantifizierten Anteil der Bevölkerung unterschiedlicher Altersgruppen und Wohngebiete, der wiederum unterschiedlichen Mengen von NO2 ausgesetzt ist, und schließlich, am wichtigsten, um zahlenmäßige Aussagen zu gesundheitlichen Folgen bzw. um die Art und Zahl der durch NO2 bedingten Krankheitsfälle einschließlich Todesfällen. Entsprechende Untersuchungen wurden natürlich nicht alle neu vom Helmholtz Institut durchgeführt, sondern die Studie sichtet vorhandene Untersuchungen zum Thema NO2 in vergleichbaren Ländern (USA, Kanada, Schweiz), greift auf vorhandene Modelle und Erhebungen zurück und verbindet sie mit dem Kenntnisstand aus epidemiologischen Untersuchungen und Ergebnissen. Dies wird akribisch aufgelistet, dokumentiert und vielfach tabellarisch zusammengefasst. Die Gründlichkeit und Transparenz der in der Studie unternommenen Aufarbeitung scheint mir kaum zu bemängeln.

Stadtverkehr
(c) BMVI

Zentral sind dabei die methodisch bedingten Voraussetzungen und Einschränkungen. Man halte sich das vor Augen: Es wird auf Fakten in Form von Messwerten an einzelnen Stationen im Lande zurückgegriffen, ferner auf Daten von Krankheitsfällen und -verläufen, die klinisch / epidemiologisch dokumentiert sind. Die vorhandenen Rohdaten sagen für sich noch gar nichts, solange sie nicht in ein computergestütztes Modell eingepasst werden, das zum Beispiel aus einzelnen Messdatenreihen die NO2-Konzentration für ein ganzes Land feinkörnig ( 1 qkm) hochrechnet. Dasselbe gilt für die Berechnung, welche Teile der Bevölkerung welcher Konzentration ausgesetzt sind: Es geht um Modellierungen und Hochrechnungen, wie sie in diesen und anderen Bereichen wissenschaftlich üblich und bewährt sind. Es bleiben aber Modelle. Diese Modelle der NO2 -Konzentration und Exposition werden nun korreliert mit ebensolchen Modellen (Hochrechnungen aus Einzeldaten entsprechend einem angenommenenen Verlaufsmodell) aus der Krankheitsstatistik und der epidemiologischen Forschung. Schließlich werden diese erhobenen Korrelationen bewertet, und zwar auf ihre Evidenz (Stichhaltigkeit, Beweiskraft) bezüglich eines Wirkungszusammenhangs zwischen NO2-Belastung und zu erwartenden Krankheitsbildern und -verläufen hin. Diese Bewertungen werden noch einmal differenziert nach starker, moderater und schwacher Evidenz. Ich fasse zusammen: Die Studie fasst andere Studien zusammen und wertet sie aus hinsichtlich vorhandener Modellrechnungen, Korrelationen und Bewertungen entsprechend wissenschaftlicher Methodik und Exaktkeit. Vor allem Computermodelle und die mathematische Statistik sind hierfür zentral. Dieses Verfahren ist nachvollziehbar und wissenschaftlich bewährt, denn wie sonst sollte man aus relativ verstreuten Einzeldaten (von z. B. einigen hundert Messstationen oder konkreten klinischen Verläufen) irgendeine allgemeine Aussage gewinnen und Schlussfolgerungen treffen? Dies geschieht nach bestem Wissen und bewährter Methodik. Aber es sind Modelle (mit begrenzten Rahmen- und Ausgangsbedingungen), Hochrechnungen (mit Fehlerquote), Korrelationen (statistische Zusammenhänge ohne Kausalität), Bewertungen (nach offengelegten Maßstäben) und Schlussfolgerungen, die sich nach Meinung der Autoren der Studie daraus ergeben. Darauf stützen sich dann die Darstellungen und Schwerpunkte in der Vorstellung der Studie durch das UBA und die Bewertungen und Meinungsäußerungen in den Medien. Nebenbemerkung: Ähnlich verfährt auch die Klimaforschung, allerdings auf der Basis eines weitaus größeren empirischen Datenmaterials. Denn schaut man sich die hier besprochene Studie auf die empirischen Daten hin an, dann ist das Material selbst vergleichsweise dürftig, am solidesten sind die an den Messstationen erhobenen Daten sowie klinische Befunde. Diese aber sind empirisch nicht zu verallgemeinern, sondern nur in Modellrechnungen darstellbar – wie in anderen Studien vorgelegt. Studien berufen sich also hier legitimatorisch auf andere Studien. Man muss dies als eine methodische Einschränkung werten.

Als Beispiel für Bewertungen und Maßstäbe, wie sie in der Studie verwandt werden, nenne ich hier den Begriff der „starken Evidenz“. Sie wird so definiert:

Starke Evidenz: Es liegt eine ausreichend große Anzahl von Studien vor, die eine konsistente Verbindung zwischen NO2 und Endpunkt aufzeigen. „Ausreichend“ kann je nach Endpunkt unterschiedlich definiert sein. Der Zusammenhang zwischen NO2 und Endpunkt ist bestätigt, d. h. mehrere Studien kommen zu einem vergleichbaren Ergebnis, und es liegen keine Studien vor, die dem Zusammenhang widersprechen (Nullergebnisse sind kein Widerspruch!). Der Zusammenhang wurde in verschiedenen Populationen mit variierenden Studienmethoden nachgewiesen. [S. 25]

„Endpunkt“ bedeutet die Krankheit bzw. den Krankheitsverlauf, der im Zusammenhang mit NO2-Belastung stehen könnte. Aufgelistet werden 12 Befunde, darunter Diabetes, Bluthochdruck, Herzinfarkt, Asthma. Die Bewertung „ausreichend bestätigt“ liegt dann vor, wenn mehrere Studien zu einem vergleichbaren Ergebnis kommen. Bemerkenswert ist dabei, dass ausdrücklich „Nullergebnisse kein Widerspruch!“ sind. Wenn also eine Studie keinen Zusammenhang zwischen NO2-Belastung und Befund herstellen kann, wird das faktisch als Bestätigung eines Zusammenhangs gewertet; ein Widerspruch liegt nur dann vor, wenn eine entsprechende Studie dem Zusammenhang von NO2-Belastung und medizinischem Befund ausdrücklich zuwiderliefe, also z. B. eine sinkende Asthmarate korrelierte. Dass „Nullergebnisse“ hier als Bestätigung gerechnet werden, halte ich in unserem Zusammenhang für höchst fragwürdig.

Darüber hinaus werden aber weitere Einschränkungen in der Studie selbst genannt. Denn einerseits gilt:

Wie den Übersichtsarbeiten der amerikanischen Umweltbehörde (U.S. EPA, 2016), des Schweizerischen Tropen- und Public Health Instituts in Basel (Swiss TPH; Kutlar Joss et al., 2015), des REVIHAAP-Projekts („Review of evidence on health aspects of air pollution“; WHO, 2013a) und von Health Canada (2016) zu entnehmen ist, konnten in Kurzzeitstudien Zusammenhänge zwischen einer Erhöhung der NO2-Belastung und einer Zunahme der Gesamtmortalität und insbesondere der Mortalität aufgrund von Atemwegs- und Herz-Kreislauferkrankungen gezeigt werden. [S. 19]

Die Studie spricht hier in anderem Zusammenhang von „biologischer Plausibilität“, was immer das genauer bedeuten mag. So weit, so gut. Aber andererseits räumt die Studie ein:

Die gesundheitlichen Wirkungen werden häufig auch bei niedrigen NO2-Konzentrationen gefunden (Brunekreef et al., 2012; Brunekreef and Holgate, 2002). Jedoch können einige der beobachteten gesundheitlichen Folgen derzeit noch nicht allein NO2 zugeschrieben werden, da andere verkehrsbedingte Luftschadstoffe ähnliche räumliche Verteilungen wie NO2 aufweisen. Speziell die sehr begrenzte Anzahl von Studien, die z. B. ultrafeine Partikel (Partikel mit einem aerodynamischen Durchmesser kleiner als 0.1 μm) als Störgröße in ihren Analysen berücksichtigen, lässt hier nur limitierte Schlussfolgerungen zu. Zudem ermöglichen epidemiologische Studien keine Aussagen über ursächliche Beziehungen. Die zahlreich vorhandenen epidemiologischen Studien liefern jedoch konsistente Ergebnisse über die Zusammenhänge zwischen NO2-Belastungen und ihren negativen gesundheitlichen Auswirkungen. [ebd.]

Hier sind wir am eigentlichen Knackpunkt. Zunächst kann man auch innerhalb der Logik der Studie fragen, wie plausibel die Korrelation, interpretiert als Wirkungszusammenhang, für bestimmte NO2-Konzentrationen ist, wenn sich offenbar einzelne Krankheitsbilder- und -verläufe gleichermaßen bei hoher und niedriger Konzentration feststellen ließen, also eher den Hinweis boten, dass da zwischen NO2 – Exposition und medizinischem Befund womöglich gar kein unmittelbarer Zusammenhang besteht, sondern die genannten „anderen Luftschadstoffe“ (warum nur „verkehrsbedingt“?) ebenso korrelieren – oder auch nicht. Aus meiner Sicht entwerten diese Aussagen und Einräumungen die weitreichenden Schlussfolgerungen der Studie ganz erheblich. Es geht nur um „Modelldaten“ und vermutete Zusammenhänge, um nicht weniger, aber auch nicht um mehr.

Dies gilt noch mehr für die beiden letzten Sätze in dem eben zitierten Absatz. Es sind nur „limitierte Schlussfolgerungen“ erlaubt, denn „epidemiologische Studien machen keine Aussagen über ursächliche Beziehungen“. Noch mehr und stärker gilt das für statistisch erhobene Korrelationen generell. Das räumt die Studie ebenfalls ein, ausdrücklich auch in dem zusammenfassenden Pressestatement. Korrelationen liefern keine Kausalität. Statt dessen muss man sich mit „konsistenten Ergebnissen über die statistischen Zusammenhänge“ begnügen, was immer das „konsistent“ im Einzelnen bedeutet. Das musste vor einigen Jahren auch Google erfahren, als es aus gehäuften Suchanfragen nach Grippemedikamenten eine Voraussage für auftretende Grippeerkrankungen ableiten wollte. Es konnte von der Wirklichkeit nicht gestützt werden, weil offenbar die Korrelate falsch angesetzt waren: Die Suche nach Grippemitteln korrelierte allenfalls mit der Sorge vor Grippeerkrankung, nicht aber mit tatsächlichen Erkrankungen. Die Ableitung von Wirkungszusammenhängen aus statistischen Mustern und Korrelationen bleibt immer problematisch, weil hier oft die Vermutung einer Konsistenz zu einer faktischen Evidenz umgedeutet wird. Dies scheint mir hier in der Studie durchgängig der Fall zu sein. Die in der Presse verkündeten Ergebnisse, zumal hinsichtlich von Mortalitätsraten, werden von der Studie in keiner Weise gedeckt. Es handelt sich allenfalls um statistische Möglichkeiten, sofern man alle anderen definierten Ausgangsbedingungen gelten lässt.

Der Satz „NO2 tötet“ ist eine unzulässige Verallgemeinerung und wissenschaftlich evident nicht belegbar. Die Gesamtmortalität wird als schwach bewertet (im oben eingeschränkten Sinn: es gibt nur widersprechende oder unzureichende Studien), allenfalls die „Respiratorische Mortalität“ (Atemwegserkrankungen) wird als korrelativ „stark“ bewertet, auch wenn sich das bei Kurzzeiteffekten nicht bestätigen ließ (vgl. S. 27). Auch hier gilt, dass der Zusammenhang mit anderen Luftbelastungen nicht ausreichend geklärt und ein Wirkungszusammenhang (Kausalität) nicht bestätigt werden konnte.

Aus den hier vorgestellten Beobachtungen und Überlegungen hinsichtlich der Aussagekraft und Tragweite der diskutierten Studie lässt sich so viel sagen: Die in der Pressemitteilung formulierte Verallgemeinerung des UBA ist schlicht durch die Studie nicht gedeckt, es handelt sich um eine einseitige Interpretation einer vermuteten Tendenz:

Die Studie zeigt unter anderem, dass acht Prozent der bestehenden Diabetes mellitus-Erkrankungen in Deutschland im Jahr 2014 auf Stickstoffdioxid in der Außenluft zurückzuführen waren. Dies entspricht etwa 437.000 Krankheitsfällen. Bei bestehenden Asthmaerkrankungen liegt der prozentuale Anteil der Erkrankungen, die auf die Belastung mit NO2 zurückzuführen sind, mit rund 14 Prozent sogar noch höher. Dies entspricht etwa 439.000 Krankheitsfällen.

Diese Tatsachenaussagen werden durch die Studie selbst nicht gestützt. Die in der Presse verbreitete Zahl von fast 6000 Todesfällen ‚durch NO2‘ entbehrt jeder evidenten Grundlage. Es handelt sich dabei um eine statistisch mögliche Randaussage im Rahmen der limitierten Aussagekraft der verschiedenen Studien und ihrer modellhaften Auswertung. Sie dramatisiert und skandalisiert in unzulässiger Weise. So wird aus transparenter Wissenschaft – Pseudowissenschaft. Unbestreitbar ist jedoch:

NO2 wirkt als sehr reaktives Oxidationsmittel. Die relativ geringe Wasserlöslichkeit von NO2 führt dazu, dass der Schadstoff nicht in den oberen Atemwegen gebunden wird, sondern in tiefere Bereiche des Atemtrakts (Bronchiolen, Alveolen) eindringt. Dort kann NO2 bei Kontakt mit Alveolargewebe Zellschäden auslösen und entzündliche Prozesse verursachen sowie zu einer Hyperreagibilität der Bronchien führen. Hyperreagibilität gilt als ein Risikofaktor für die Entwicklung allergischer Atemwegserkrankungen. [S. 19]

Darum sollte es gehen: Um eine angemessene Bewertung der Luftverschmutzung in unserem Land, maßgeblich verursacht durch den Straßenverkehr. Darüber besteht Einigkeit. Dass alles dafür getan werden muss, Umweltbelastungen, insbesondere Luftverschmutzung, Emissionen, zu reduzieren, steht außer Frage. Selbst vermutete und plausible Wirkungszusammenhänge zwischen verschiedenen Schadstoffen, darunter bestimmt auch NO2, CO2, Feinstaub usw., und dem vermehrten Auftreten von z. B. Atemwegs- und Koronarerkrankungen reichen aus, um politisch nachhaltig aktiv werden zu müssen. Eine wissenschaftlich verantwortete, aber eigentlich nur vermutete und als „evidenzbasiert“ behauptete Studie hilft hier eher nicht weiter. Sie befördert allenfalls eine Instrumentalisierung wissenschaftlich begrenzter Aussagen zu ideologischen Versatzstücken, mit denen die eigene Meinung legitimiert werden soll.

Reinhart Gruhn

Update: Siehe auch hier: Die erfundenen Toten (Spiegel)