Die Erde ist rund (P < 5%)

27.11.2013

Wozu brauchen wir welche Statistik, und was bedeutet das Wort "signifikant"? Während die Statistik des 20. Jahrhunderts an ihre Grenzen stösst, sind die 250 Jahre alten Ideen eines englischen Pfarrers wieder aktuell. Von Valentin Amrhein

Wie kommt eine Ärztin zu ihrer Diagnose? Die Abschätzung eines Krankheitsrisikos oder des Verlaufs einer Krankheit erfolgt auf Grundlage von Daten früherer Patienten. "Alle klinischen Entscheidungsprozesse basieren auf Statistik", sagt Andreas Papassotiropoulos, Leiter der Abteilung für molekulare Neurowissenschaften an der Universität Basel – um sogleich anzufügen: "Es gibt immer noch erschreckende Lücken im statistischen Wissen sowohl der Ärzte als auch der medizinisch und biologisch Forschenden." Er nennt das Beispiel eines Forschers, der in einem Vortrag Messwerte einer genetisch veränderten und einer normalen Maus zeigte. Auf die Frage, wie viele Mäuse er denn gemessen habe, sagte der Forscher: "Nur diese zwei; man sieht ja, dass es einen Unterschied gibt."

Warum bräuchte es in diesem Fall statistische Beratung? Nehmen wir an, wir interessieren uns für die Frage, ob Schweizer Männer grösser sind als Schweizer Frauen. Die einfachste Antwort erhalten wir, wenn wir wie beim Mäusebeispiel einen beliebigen Schweizer Mann und eine Schweizer Frau betrachten. Vielleicht wäre dieser Mann aber zufällig nicht grösser, sondern kleiner als die Frau. Wir würden dann aus unserer Beobachtung fälschlicherweise schliessen, dass Männer generell kleiner als Frauen sind. Üblicherweise nehmen Forschende deshalb grössere Stichproben und messen zum Beispiel die Körpergrösse von je 50 zufällig ausgewählten Männern und Frauen. Wie aber könnte man die Messwerte miteinander vergleichen? Es ist kaum sinnvoll, sich jeden Datenpunkt einzeln anzuschauen. Wir müssen die Daten vereinfachen, etwa indem wir den Durchschnitt der Männer und der Frauen vergleichen.

Im Durchschnitt tot

Nun ist der Durchschnitt ein statistisches Modell und entspricht nicht der Wirklichkeit. Keine einzige Person in der Schweiz wird tatsächlich auf den Nanometer genau so gross sein wie der Durchschnitt. Ein Sprichwort bringt es auf den Punkt: Wenn der Jäger am Hasen einmal links und einmal rechts vorbeischiesst, dann ist der Hase im Durchschnitt tot. "Man kann einem Patienten aufgrund des durchschnittlichen Verlaufs ähnlicher Krankheitsfälle nicht sicher sagen, wie es ihm morgen gehen wird", sagt Andreas Papassotiropoulos. Der Umgang mit dieser Tatsache erfordere ein gewisses statistisches Bewusstsein sowohl auf Seiten des Arztes wie auch des Patienten. Der Durchschnitt ist zwar ein gutes Modell, aber Ärzte müssen das Modell immer auch mit individuellen Daten über den einzelnen Patienten ergänzen. Und mit der aufkommenden personalisierten Medizin werden diese Daten immer umfangreicher. Weil Statistik in Forschung und medizinischer Praxis ständige Begleiterin ist und lebenslanges Lernen erfordere, müsse die Statistik-Ausbildung an den Hochschulen und Universitäten während des ganzes Studiums erfolgen, sagt Papassotiropoulos.

Wenn Statistik Spass macht

Schliesslich kann Statistik sogar Spass machen. Das merkt man spätestens, wenn man in einem Forschungsprojekt um die statistische Auswertung nicht mehr herum kommt. Und Statistik ist viel mehr als das Errechnen von durchschnittlichen Körpergrössen und die übersichtliche Präsentation der Daten. Solcher beschreibenden Statistik steht die so genannte schliessende Statistik gegenüber, in der es zum Beispiel darum geht, wissenschaftliche Hypothesen zu überprüfen und zu quantifizieren, wie "signifikant" ein Resultat ist. Was aber bedeutet statistische Signifikanz?

Zurück zum Bespiel mit den Körpergrössen. Das Grundproblem der Stichproben ist der so genannte Stichprobenfehler: Vielleicht haben wir ja rein zufällig grosse Männer und kleine Frauen ausgesucht. Ein einfacher statistischer Test kann zeigen, ob der Unterschied in den Mittelwerten der 50 Frauen und Männer so zuverlässig ist, dass wir tatsächlich auf die Gesamtheit der Menschen in der Schweiz Rückschlüsse ziehen können.

Um das Konzept der Signifikanz zu verstehen, muss man ein paarmal um die Ecke denken. Eine statistische Analyse geht üblicherweise von der so genannten Nullhypothese aus – in unserem Fall: dass Männer und Frauen genau gleich gross sind. Mit einem statistischen Modell kann man dann simulieren, wie gross die Unterschiede in den Mittelwerten der Körpergrösse von Männern und Frauen wären, wenn wir beliebig viele hypothetische Stichproben von je 50 Männern und Frauen nähmen. Wenn dabei der Grössenunterschied, den wir tatsächlich gefunden haben, in weniger als fünf Prozent der Fälle auftritt, sagt man, das Ergebnis sei signifikant: Der von uns gefundene Grössenunterschied wäre sehr unwahrscheinlich, gegeben, dass in Wirklichkeit Männer und Frauen gleich gross sind.