Mammographie Screening:

Brustkrebs-Wahrscheinlichkeit
bei positiver Mammographie


Eine fünfzigjährige symptomlose Frau nimmt an einer Brustkrebs Früherkennungsuntersuchung teil. Sie hat einen "positiven" (verdächtigen) Mammographiebefund.

Wie hoch ist die Wahrscheinlichkeit, tatsächlich Brustkrebs zu haben?
(Antwort siehe im folgenden Text)

Wir schätzen die Aussagekraft von medizinischen Befunden - hier einem positiven Mammographiebefund - meist völlig falsch ein.

Die folgende, sehr interessante Arbeit sagt uns warum, und wie es besser geht.

Irren ist wahrscheinlich.
Medizinische Experten und Laien bewerten Risiken oft falsch.

Autor: Dr. Ulrich Hoffrage Max-Plank-Institut für Bildungsforschung, Berlin Impressum

Quelle: "einblick", Zeitschrift des deutschen Krebsforschungszentrums, Heft 1/1999

Zusammenfassung: Medizinische Tests bieten keine absolute Sicherheit. Vorliegende Krankheiten werden übersehen, und Gesunde erhalten positive Testergebnisse. So sind medizinische Diagnosen, die auf Tests beruhen, notwendigerweise mit Unsicherheit behaftet. Die Literatur zeigt, dass sowohl Laien als auch Ärzte große Schwierigkeiten haben, den positiven prädiktiven Wert eines Tests (d. h., die Wahrscheinlichkeit für das Vorliegen einer Krankheit bei gegebenem positiven Testergebnis) richtig einzuschätzen. In diesem Artikel wird gezeigt, dass diese Einschätzungen deutlich verbessert werden können, wenn die hierfür zur Verfügung gestellte statistische Information nicht--wie sonst üblich--in Wahrscheinlichkeiten, sondern in "natürlichen Häufigkeiten" gegeben wird. Natürliche Häufigkeiten resultieren aus der Aggregation einzelner Beobachtungen, die zufällig aus der zugrundeliegenden Population herausgegriffen worden sind. Die praktische Bedeutung dieser Möglichkeit, das Urteilen bei Laien und bei Experten zu verbessern, wird herausgestellt.

Laut Benjamin Franklin ist in dieser Welt nichts sicher außer dem Tod und der Steuer. Auch medizinische Tests bieten keine absolute Sicherheit. Idealerweise sollte ein medizinischer Test für eine bestimmte Krankheit bei allen Kranken positiv und bei allen Gesunden negativ ausfallen. In der Praxis treten jedoch in der Regel zwei Fehler auf: Vorliegende Krankheiten werden übersehen, und Gesunde erhalten positive Testergebnisse. So sind medizinische Diagnosen, die auf Tests beruhen, notwendigerweise mit Unsicherheit behaftet.

Wie schwer die Bedeutung medizinischer Testergebnisse einzuschätzen und verständlich zu machen ist, zeigt folgendes Beispiel: Eine 50jährige Frau ohne Beschwerden nimmt auf Anraten ihres Arztes jedes Jahr an einer Brustkrebs-Früherkennungsuntersuchung teil. Bei der letzten Untersuchung erhielt sie einen positiven Mammographie-Befund. Wahrscheinlich teilte der Arzt ihr daraufhin mit, dass sie mit großer Sicherheit Brustkrebs hat. Denn: Bei einer in den USA durchgeführten Studie schätzten 95 von 100 befragten Ärzten, dass die Wahrscheinlichkeit an Brustkrebs erkrankt zu sein für diese Frau zwischen 70 und 80 Prozent liegen würde. Folgende Informationen standen den Ärzten dabei zur Verfügung:

atsächlich beträgt die aus der gegebenen Information ermittelte Wahrscheinlichkeit, Krebs zu haben für die 50jährige Frau mit positivem Mammographie-Befund lediglich 7,5 Prozent. Dieser relativ niedrige Wert, dies muss betont werden, gilt nur für die geschilderte Situation - keine Symptome, Reihenuntersuchung.

Diese Abweichung des menschlichen Urteils von der wahrscheinlichkeitstheoretisch richtigen Lösung wurde in vielen Studien nachgewiesen. Sie könnte als Beleg dafür angesehen werden, dass Menschen nicht in der Lage sind, rationale Urteile unter Unsicherheit zu treffen. Folgendes Beispiel soll zeigen, dass dieser Schluß voreilig ist. Ein üblicher Taschenrechner kann Zahlen im Zehnersystem multiplizieren. Wird ein solcher Taschenrechner jedoch mit Zahlen des Zweiersystems, also Abfolgen von Nullen und Einsen gefüttert, produziert er zumeist unsinnige Ergebnisse, das heißt Zahlen, die im Zweiersystem nicht der richtigen Lösung entsprechen. Daraus kann jedoch nicht geschlossen werden, dass er nicht multiplizieren kann. Ähnlich ist es beim Urteilen unter Unsicherheit. Aus der Tatsache, dass Menschen Schwierigkeiten haben, Wahrscheinlichkeitsaufgaben richtig zu lösen, kann nicht geschlossen werden, dass sie keine rationalen Urteile unter Unsicherheit treffen können. Wie Taschenrechner auf ein bestimmtes Zahlensystem, so sind auch die kognitiven Algorithmen des Menschen auf bestimmte Formate eingestellt.

Es ist in der Tat anzunehmen, dass Menschen im Laufe der Evolution Algorithmen für den Umgang mit einer unsicheren Welt ausgebildet haben. Auf welches Format sind diese kognitiven Algorithmen eingestellt? Wohl kaum auf Wahrscheinlichkeiten und Prozentwerte, wie sie in den meisten Lehrbüchern für Medizin und Statistik verwendet werden. Wahrscheinlichkeiten und Prozente, wie sie auch im erwähnten Beispiel verwendet wurden, existieren erst seit wenigen Jahrhunderten - eine im Hinblick auf die Evolution menschlicher Intelligenz vernachlässigbare Zeitspanne. Unsere These ist, dass kognitive Algorithmen an das angepaßt sind, was wir "natürliche Häufigkeiten" nennen. Im Gegensatz zu Wahrscheinlichkeiten, Prozenten und relativen Häufigkeiten sind natürliche Häufigkeiten nicht normalisiert bezüglich der Basisraten von Kranken und Gesunden. Statt dessen beinhalten sie die absoluten Häufigkeiten, die man bei einer repräsentativ gezogenen Stichprobe beobachten würde. Die oben bereits gegebenen Informationen lassen sich wie folgt in natürlichen Häufigkeiten ausdrücken: Von je 1000 Frauen, die zwischen 40 und 50 Jahre alt sind, die keine Symptome haben und an einer Reihenuntersuchung teilnehmen, haben zehn Brustkrebs. Von diesen zehn Frauen erhalten acht einen positiven Mammographie-Befund. Von den restlichen 990 Frauen, die keinen Brustkrebs haben, erhalten 99 einen positiven Mammographie-Befund. Diese Darstellung entspricht formal der Darstellung in Wahrscheinlichkeiten, aber hier sieht man sofort, wie ein positiver Mammographie-Befund einzuschätzen ist: Von den 107 Frauen mit positivem Testergebnis haben nur acht tatsächlich Brustkrebs. Das entspricht 7,5 Prozent.

Wenn - wie vermutet - Menschen mit natürlichen Häufigkeiten besser umgehen können als mit Wahrscheinlichkeiten, so würde dies bedeuten, dass sich Urteile von medizinischen Laien und von Experten verbessern, wenn die Informationen in natürlichen Häufigkeiten statt in Wahrscheinlichkeiten gegeben werden. In einer Studie mit Personen ohne spezielles medizinisches Wissen und ohne einschlägiges Training in statistischem Denken haben wir mit einer kombinierten Ergebnis- und Prozeßanalyse die jeweils verwendeten Lösungsstrategien untersucht. Bearbeitet wurden 15 verschiedene Probleme wie zum Beispiel: Wie groß ist die Wahrscheinlichkeit an Brustkrebs erkrankt zu sein, wenn eine positive Mammographie vorliegt? Wie groß ist die Wahrscheinlichkeit einer HIV-Infektion, wenn das Ergebnis des HIV-Tests positiv war? Wie groß ist die Wahrscheinlichkeit eines Autounfalls, wenn man mit einem betrunkenen Fahrer mitfährt? Wurden die Informationen in Wahrscheinlichkeiten gegeben, wie es für heutige Textbücher und psychologische Experimente üblich ist, so wurde in nur 16 Prozent der Fälle die richtige Strategie verwendet. Wurden die Informationen hingegen in natürlichen Häufigkeiten gegeben, stieg dieser Wert auf 46 Prozent. Die Beurteilung von Risiken durch Laien kann also mit Hilfe einer einfachen Methode deutlich verbessert werden, ohne dass diese in statistischem Denken unterrichtet werden. Das Format, in dem die Informationen dargeboten werden, erleichtert die Denkarbeit.

Können auch medizinische Experten von dieser Methode profitieren? Eine Vielzahl von Studien belegen, dass Ärzte große Schwierigkeiten haben, die Wahrscheinlichkeit für das Vorliegen einer Erkrankung bei gegebenem positiven Testausgang einzuschätzen. So erschreckend dieser Befund klingt, er ist kaum überraschend, wenn man bedenkt, dass statistisches Denken in den meisten medizinischen Lehrbüchern in Form von Wahrscheinlichkeiten, Prozenten oder relativen Häufigkeiten gelehrt wird. Wir testeten 48 Ärzte mit einer mittleren Berufserfahrung von 14 Jahren, die an Universitätskliniken, privaten oder öffentlichen Krankenhäusern oder in privaten Praxen arbeiten. Jeder Arzt erhielt vier medizinisch-diagnostische Aufgaben. Bei zwei Aufgaben wurden die Informationen in Form von Wahrscheinlichkeiten und bei den beiden anderen in Form natürlicher Häufigkeiten gegeben. Erhielten die Ärzte die Informationen in Form von Wahrscheinlichkeiten, stimmten ihre Urteile nur in zehn Prozent der Fälle mit der mathematisch richtigen Lösung überein. Wurden die Informationen in Form natürlicher Häufigkeiten gegeben, waren es 46 Prozent. In den Worten eines Arztes: "Es ist jetzt anders, das kann ich mir ganz gut vorstellen. Es handelt sich um eine Anzahl, das ist visueller." Die Darbietung der Informationen in natürlichen Häufigkeiten bewirkte auch, dass die Ärzte schneller zu einer Einschätzung gelangten und dass sie entspannter, weniger nervös und weniger verunsichert waren. Das Ergebnis der Experten entsprach also - trotz ihrer langjährigen Erfahrung mit diagnostischen Urteilen - dem der medizinischen Laien. Ärzte profitieren also ebenso, wenn Informationen in natürlichen Häufigkeiten statt in Wahrscheinlichkeiten kommuniziert werden.

Wie kommunizieren Experten nun ihrerseits Risiken? Um diese Frage zu beantworten, hat ein junger Mann 20 öffentliche Gesundheitsämter in 20 deutschen Städten besucht, um insgesamt 20 HIV-Tests durchführen zu lassen. Vor jedem Test findet eine obligatorische Beratung statt, in der dem Ratsuchenden unter anderem erklärt werden sollte, was es bedeutet, wenn der HIV-Test positiv ausfällt. So konnte der junge Mann die Berater in einem halbstandardisierten Interview befragen. Kein einziger der 20 professionellen Aids-Berater hat die relevante Information in Form von natürlichen Häufigkeiten vermittelt. Vielmehr wurden alle numerischen Informationen in Form von Wahrscheinlichkeiten und Prozentwerten weitergegeben, was oft Verwirrung und Fehleinschätzung des Risikos zur Folge hatte.

Herbert George Wells, der Autor der Zeitmaschine, hat einmal gesagt, dass eine funktionierende Demokratie mündige Bürger braucht, die neben Lesen und Schreiben auch statistisches Denken gelernt haben. Wie die Studien zeigen, sind wir, was letzteres betrifft, bestenfalls auf halbem Weg. Die hier vorgestellten Erkenntnisse und Methoden können helfen, auf diesem Weg schneller voranzukommen.

Stand: 26.06.2004