In vielen Diskussionen wird mit Statistik und Wahrscheinlichkeit argumentiert. Deshalb möchte ich hier einmal ein paar Zusammenhänge erläutern.

Zu Beginn einmal ein kleines Beispiel zu Corona. Frage: Wie groß ist die Wahrscheinlichkeit, beim Arztbesuch auf einen Corona-Kranken zu treffen?

Nehmen wir das serielle Intervall von 4 Tagen (s. RKI) als Zeitraum, in dem ein Erkrankter andere ansteckt. Die Zeit, in der ein Erkrankte seine Viren verteilt, ist sicher länger. Und nehmen wir einmal eine Inzidenz von 100 an. Dann sind in einer Großstadt mit 100 000 Einwohnern täglich etwa 400 ansteckende Erkrankte unterwegs.

Die Wahrscheinlichkeiten, bei einer Begegnung auf einen solchen Erkrankten zu treffen, sind unabhängig. Das bedeutet, ob ich bei einer Begegnung auf einen Erkrankten treffe, ist unabhängig davon, ob ich davor schon einen getroffen habe. Aus der Unabhängigkeit ergibt sich, dass sich die Wahrscheinlichkeiten für mehrere Ereignisse als Produkt der einzelnen Wahrscheinlichkeiten ergeben.

Beispiel Würfel: Die Wahrscheinlichkeit für eine 6 ist 1/6. Die Wahrscheinlichkeit für zwei 6 in zwei Würfen ist dann 1/36. Die Wahrscheinlichkeit für „keine 6“ in beiden Würfen ist (1 - 1/6) * (1-1/6) = 25/36 und die Wahrscheinlichkeit für „mindestens eine 6“ ist
W = 1 – „keine 6“ = 1- (1 - 1/6)^2 = 11/36.

Ebenso ist es beim Arztbesuch. Nehmen wir noch an, dass ich während der Wartezeit auf 20 Personen treffe. Dann ergibt sich die Wahrscheinlichkeit, mindestens einen ansteckenden Erkrankten zu treffen zu:
W = 1 - (1 – 400/100000)^20 (^ 20 heißt, 20 im Exponenten). Das ergibt W = 7,7 % bei dem Besuch in einer frequentierten Praxis. Und bei einer Inzidenz von 150 sind wir dann schon bei 11%. In einem Bus mit 40 Menschen und Inzidenz 100 ist mit 15 % ein ansteckender Erkrankter dabei, hoffentlich mit Maske.. Das ist nicht zu vernachlässigen. Nach dem Arztbesuch noch ein wenig bummeln und shoppen? Wohl eher nicht.
Hallo @Dick01,

Ich brauche normalerweise immer länger als die meisten anderen, um etwas zu verstehen. So leider auch diesmal.

Könntest Du bitte – auch für Nicht-Statistiker und Nicht-Virologen/Epidemiologen verständlich – noch einmal erklären, weshalb folgendes nach Deiner Auffassung zutrifft?

„Nehmen wir das serielle Intervall von 4 Tagen (s. RKI) als Zeitraum, in dem ein Erkrankter andere ansteckt. (…) Und nehmen wir einmal eine Inzidenz von 100 an. Dann sind in einer Großstadt mit 100 000 Einwohnern täglich etwa 400 ansteckende Erkrankte unterwegs.“

Tut mir leid, dass ich wieder einmal „auf dem Schlauch stehe“ und nicht alles sofort (wenn überhaupt) begreife….
Patriarch hat geschrieben: Hallo @Dick01,

Ich brauche normalerweise immer länger als die meisten anderen, um etwas zu verstehen. So leider auch diesmal.

Könntest Du bitte – auch für Nicht-Statistiker und Nicht-Virologen/Epidemiologen verständlich – noch einmal erklären, weshalb folgendes nach Deiner Auffassung zutrifft?

„Nehmen wir das serielle Intervall von 4 Tagen (s. RKI) als Zeitraum, in dem ein Erkrankter andere ansteckt. (…) Und nehmen wir einmal eine Inzidenz von 100 an. Dann sind in einer Großstadt mit 100 000 Einwohnern täglich etwa 400 ansteckende Erkrankte unterwegs.“

Tut mir leid, dass ich wieder einmal „auf dem Schlauch stehe“ und nicht alles sofort (wenn überhaupt) begreife….


Zunächst: Das ist nur eine Beispielrechnung, um die persönliche Relevanz zu verdeutlichen, und keine wissenschaftlich Untersuchung. Deshalb habe ich auch versucht, die Annahmen nahe an einer Untergrenze zu halten.
Um die Wahrscheinlichkeit zu berechnen, bei einer Begegnung auf einen ansteckenden Erkrankten zu treffen, muss ich wissen, wie groß deren Anteil ist also wie viele der 100 000 in meiner Stadt Saarbrücken davon existieren.
Ein Erkrankter wird nach wenigen Tagen ansteckend, tritt damit in die Gruppe ein, und nach einigen weiteren Tagen geht er in Quarantäne, tritt damit wieder aus. Dass viele nicht in Quarantäne gehen, weil sie beispielsweise keine oder nur geringe Symptome zeigen, habe ich mal vernachlässigt, würde die W. noch erhöhen. Im Augenblick wachsen die inzidenzen und der R- Wert ist über 1, habe ich ebenfalls vernachlässigt und bei 100 belassen, was bei einem Zeitraum über ein paar Tage erstmal ok ist. Nach einer Ansteckung wird ein Erkrankter nach wenigen Tagen selbst ansteckend ohne Symptome zu zeigen, 95% zeigen nach 10 - 14 Tagen Symptome. Der serielle Zeitraum ist die Zeit von der Ansteckung des Erkrankten bis zum Zeitpunkte, zu dem er den ersten Gesunden ansteckt, 4 Tage. Da zeigen sich aber noch keine Symptome, so dass dies sicher eine untere Grenze ist. Die Annahme ist also: Jeden Tag kommen 100 Erkrankte dazu und ebenso viele fallen wieder heraus, tatsächlich vernahclässige ich damit das Wachstum. Also bei 4 Tagen sind dann 400 ansteckende Erkrankte von den 100 000 Einwohnern unterwegs, denen ich begegnen kann.
Hallo @Dick01,

Heute scheint echt nicht mein Tag zu sein…. Ich hab’s immer noch nicht ganz verstanden…. :wink:

Die Inzidenz bezieht sich ja immer auf einen bestimmten Zeitraum. Das RKI verwendet bei Corona zwar die 7-Tage Inzidenz, Du eben die 4-Tage Inzidenz.

Also, Du schreibst, die Inzidenz beträgt jetzt 100 und die Gesamteinwohnerzahlliegt liegt bei 100 000.

Zur Berechnung der Inzidenz wird doch die Einwohnerzahl der Stadt (100 000) durch 100 000 dividiert 100 000 : 100 000 = 1
Danach wird die Zahl der Corona-Fälle durch dieses Ergebnis (1) geteilt 100 : 1 = 100.
Die Inzidenz beträgt demzufolge 100.

Aber, wenn bei einer Ursprungs-Inzidenz von 100 nach Deiner Annahme jeden einzelnen Tag sowohl 100 neue Fälle hinzukämen und zugleich auch 100 „alte“ Fälle verschwinden würden, dann bliebe doch die Ursprungs-Inzidenz von 100 für alle Zeiten konstant (alle anderen Faktoren ausgeklammert).

Woher kommen denn dann bloß nach 4 Tagen bei einer 4-Tage Inzidenz die von Dir angesprochenen 400 Corona-Fälle?
Ich kann Dick´s Berechnungen und Annahmen auch nicht folgen, aber Frauen können ja eh nicht rechnen (ausser bei der Scheidung) :D
Patriarch hat geschrieben: Hallo @Dick01,

Heute scheint echt nicht mein Tag zu sein…. Ich hab’s immer noch nicht ganz verstanden…. :wink:

Die Inzidenz bezieht sich ja immer auf einen bestimmten Zeitraum. Das RKI verwendet bei Corona zwar die 7-Tage Inzidenz, Du eben die 4-Tage Inzidenz.

Also, Du schreibst, die Inzidenz beträgt jetzt 100 und die Gesamteinwohnerzahlliegt liegt bei 100 000.

Zur Berechnung der Inzidenz wird doch die Einwohnerzahl der Stadt (100 000) durch 100 000 dividiert 100 000 : 100 000 = 1
Danach wird die Zahl der Corona-Fälle durch dieses Ergebnis (1) geteilt 100 : 1 = 100.
Die Inzidenz beträgt demzufolge 100.

Aber, wenn bei einer Ursprungs-Inzidenz von 100 nach Deiner Annahme jeden einzelnen Tag sowohl 100 neue Fälle hinzukämen und zugleich auch 100 „alte“ Fälle verschwinden würden, dann bliebe doch die Ursprungs-Inzidenz von 100 für alle Zeiten konstant (alle anderen Faktoren ausgeklammert).

Woher kommen denn dann bloß nach 4 Tagen bei einer 4-Tage Inzidenz die von Dir angesprochenen 400 Corona-Fälle?


Danke für den Hnweis. Die vom RKI gemeldete Inzidenz bezieht sich auf 7 Tage, hatte ich übersehen. Die Inzidenz von 100 sind dann 100 neue Fälle in den letzten 7 Tagen bei 100 000 Einwohner, also pro Tag aufgerundet 15 neue Fälle.
Die werden am Tag x ansteckend und bleiben es über 4 Tage und gehen dann in Quarantäne. Also 15 am Tag x, + 15 am Tag x+1 (die ersten 15 sind noch da), + 15 an x + 2, + 15 an x+3. Am 4 Tag sind also 60 ansteckend. Am 5 Tag fallen 15 raus, die vom Tag x, und es kommen 15 dazu etc. Bleibt also bei 60.
Sind deutlich weniger als die 400 und die Wahrscheinlichkeit beim Arztbesuch wird 1,2% und im Bus 2,4 %.
Der Mensch hat nur einen rudimentären Sinn für Größenordnungen und Wahrscheinlichkeiten, und kann nur mit dem Verstand und an ausgewählten Themen genauer differenzieren.
(Die nachfolgenden Ausführungen sind das Ergebnis eigener persönlicher Erfahrungen und Beobachtungen im Kollegenkreis zum Umgang mit Mengen- und Häufigkeitsangaben. Sie sind nicht wissenschaftlich belegt).

Größenordnungen werden oft in viel - mittel - wenig eingeteilt, wobei "viel" entspricht ungefähr 50-100%, "mittel" liegt bei 15-50%; erst die "wenig"-Kategorie wird genauer erfasst, denn der Durchschnittsmensch kann einigermaßen gut bis 20 zählen; darüber beginnt er zu schätzen. Mit Übung lernt man Einzelphänomene besser zu erfassen, z.B. kann ein Vogelkundler die Größe eines Schwarmes abschätzen, oder die Polizei die Anzahl der Demonstranten. Bei ungewohnten Themen versagt der Mensch hingegen sofort ("wie viele Grashalme wachsen auf einem Quadratmeter Wiese?")

Entsprechend wird Wahrscheinlichkeit (vulgo: Häufigkeit) in oft, mittel und selten eingeteilt. "Oft" ist etwas, was täglich bis wöchentlich persönlich widerfährt oder zumindest im engen Umfeld, "mittel" ist völlig undefiniert, und "selten" alles jenseits. Zu "selten" pflegt der Mensch ein schizophrenes Verhältnis: er überquert eine Autostraße ("passiert schon nichts") und betritt die Lottoannahmestelle ("könnte ja was gewinnen").

Covid-Erkrankungen liegen für den Durchschnittsbürger immer noch im Bereich der "seltenen" Ereignisse, womit er dem Phänomen mit einer Mischung aus Hoffen und Fürchten begegnet. Die Zahlen des RKI sind freundlich gemeint, aber als persönliche Handlungsanleitung völlig ungeeignet. Auch Politiker tun sich sehr schwer.

Frage an @dick:
Bei einem R-Wert von 1 steckt jeder Erkrankte genau eine weitere Person an. D.h., die Fallzahlen bleiben konstant, sie steigen nicht und sie fallen nicht.

Ist das korreliert mit der Inzidenz, d.h. beim Wert 100 bleibt die Situation konstant? Oder hab ich das aus deinem Beitrag falsch herausgelesen?
ist der 7-Tages-Wert deutschlandweit aktuell nicht bei deutlich über 100 - rasch steigend....?
so viel ich mich erinnern kann, war er vor Wochen noch unter 60....
da brauch ich keine Wissenschaft....
da reicht mein gesunder Menschenverstand aus....
BilderBerger hat geschrieben:
Entsprechend wird Wahrscheinlichkeit (vulgo: Häufigkeit) in oft, mittel und selten eingeteilt. "Oft" ist etwas, was täglich bis wöchentlich persönlich widerfährt oder zumindest im engen Umfeld, "mittel" ist völlig undefiniert, und "selten" alles jenseits. Zu "selten" pflegt der Mensch ein schizophrenes Verhältnis: er überquert eine Autostraße ("passiert schon nichts") und betritt die Lottoannahmestelle ("könnte ja was gewinnen").

Frage an @dick:
Bei einem R-Wert von 1 steckt jeder Erkrankte genau eine weitere Person an. D.h., die Fallzahlen bleiben konstant, sie steigen nicht und sie fallen nicht.

Ist das korreliert mit der Inzidenz, d.h. beim Wert 100 bleibt die Situation konstant? Oder hab ich das aus deinem Beitrag falsch herausgelesen?


Interessanterweise gibt es bei "Häufigkeit" einen Unterschied zwischen Männern und Frauen. Beispiel: Wie viele Beziehungen hattest Du? Bei der Antwort neigen Männer zum "Schätzen" und Frauen zum "Zählen". Was dazu führt, dass Männer eher zu viele und Frauen zu wenige nennen.

Aber zu Corona. Sowohl Inzidenz als auch R-Wert sind mehrtägig, da die täglichen Schwankungen aus unterschiedlichen Gründen z.B. Meldungen am Wochenende erheblich sind. Bei der Inzidenz werden immer die 7 vorhergehenden Tage kumuliert, also die Summe aller Neuansteckungen in den letzten 7 Tagen gebildet und das pro 100 000 Einwohner gerechnet. Das zeigt aber nur einen Teilaspekt des Wachstums an. Dabei sagt eine bestimmte Inzidenz nichts über Wachstum aus, also 100 sagt nicht, ob die Ausbreitung steigt oder fällt.

Der R-Wert wird standardmäßig über 4 Tage gemittelt, wurde aber im letzten Jahr vom RKI auf 7 Tage umgestellt. Die Reproduktionsrate ist so etwas wie der Exponent im exponentiellen Wachstum. Nehmen wir 10 Erkrankte und R = 1,3: 10 -> 13 -> 16,9 ->...Da gehen neben den Neuerkrankungen die Zahl bisher Erkrankten ein, die Zahl der Verstorbenen, die Zahl der Genesenen (muss geschätzt werden) etc. Und durch entsprechende Maßnahmen zur Kontaktbeschränkung wird der gedrückt.

Theoretisch wird der Verlauf durch Differentialgleichungen beschrieben. Dabei zeigen Modellrechnungen, dass sich ohne Gegenmaßnahmen in Deutschland etwa 88% der Bevölkerung infiziert hätten d.h. ca. 70 Mio. und damit fast 2 Mio. Tote.
https://de.wikipedia.org/wiki/SEIR-Modell
Gundulabella hat geschrieben: ist der 7-Tages-Wert deutschlandweit aktuell nicht bei deutlich über 100 - rasch steigend....?
so viel ich mich erinnern kann, war er vor Wochen noch unter 60....
da brauch ich keine Wissenschaft....
da reicht mein gesunder Menschenverstand aus....




Hallo @Gundulabella,

Wobei genau reicht Dir jetzt Dein „gesunder Menschenverstand“ aus, so dass Du die Wissenschaft nicht brauchst?

Mit meinem „gesunden Menschenverstand“ kann ich diese Frage nicht befriedigend beantworten (aber das hat jetzt nichts zu sagen, geht mir bei fast allen Dingen so).
mir reicht das Begreifen - und das zwischen den Zeilen lesen - wissenschaftlicher Berichte....
da brauche ich mich nicht selber als Wissenschaftler aufzuschwingen..... :wink:
Das hat zwar nicht direkt mit Wahrscheinlichkeit zu tun, aber ich möchte den R-Wert einmal plausibilisieren. Wer ein wenig Differential- und Integralrechnung im Gymnasium hatte, kann das problemlos nachvollziehen.

Dabei betrachten wir nur die Wachstumsphase, also wenn die Ansteckungsrate noch nicht durch die Gesamtpopulation und die Zahl der Genesenen gedrückt wird.

Dazu sei N(t) die Zahl der zur Zeit t Erkrankten. Wir machen nur die sofort einsichtige Annahme, dass das Wachstum von N proportional zu N ist. Also die doppelte Anzahl von Erkrankten ergibt auch die doppelte Anzahl von Neuinfektionen etc. Der Proportionalitätsfaktor sei r. Bekanntlich wird das Wachstum der Kurve N(t), die Steigung, im Punkt t durch ihre Ableitung N‘(t) beschrieben.

Dadurch ergibt sich: N‘(t) = r * N(t), oder nach Division durch N: N`(t) / N(t) = r.
Wir wissen, wenn wir y = log ( f (x) ) nach der Kettenregel ableiten, so ergibt sich
y´= f´(x) / f(x). In der obigen Gleichung für N steht also links die Ableitung des Logarithmus. Nun integrieren wir beide Seiten für die Zeit 0 bis t und erhalten
log N(t) – log N(0) = r * t. Nun log N(0) addieren und beide Seiten in den Exponenten ergibt
N(t) = N(0) * exp (r * t), also ein exponentielles Wachstum.

Betrachten wir N eine Zeiteinheit später, also N(t+1) = N(t) * exp (r) oder N(t+k) = N(t) * exp (r) *..* exp (r), also der Faktor genau k-mal angewendet. Im Beispiel oben war N(0) = 10 und R = exp (r) = 1,3.

Also im Grunde kann man sich mit Schulmathematik schon vieles plausibilisieren.
Gundulabella hat geschrieben: mir reicht das Begreifen - und das zwischen den Zeilen lesen - wissenschaftlicher Berichte....
da brauche ich mich nicht selber als Wissenschaftler aufzuschwingen..... :wink:




Es freut mich für Dich, dass Du Dir die Corona-Situation und die damit verbundenen extrem komplexen Zusammenhänge so ganz „ohne Wissenschaft“ erschließen kannst.

Ich versuche ja auch immer wieder mal, wissenschaftliche Berichte zu lesen – ob ich sie allerdings verstehe, da bin ich mir nie so ganz sicher.

Wenn ich gar versuche, „zwischen den Zeilen lesen zu wollen“, komme ich ohne eine gewisse „Wissenschaftlichkeit“ nicht besonders weit.

Das betrifft insbesondere alle Berichte/Studien, denen quantitative Studiendesigns zu Grunde liegen und die demzufolge teils recht anspruchsvolle Statistik beinhalten.

Insofern bin ich noch heute meiner (sehr kurvigen) ersten Statistikprofessorin dankbar, dass sie so frühzeitig mein Interesse auf die Schönheit der Gauß’schen Glockenkurve (die ja fast bei allen Statistiken im weitesten Sinne mit auftaucht) gelenkt hat. :wink:
sorry - wir reden da aneinander vorbei.....
Die oben beschriebene Wahrscheinlichkeit im Kontext Corona, dass von mehreren unabhängigen Ereignissen mindestens eines eintritt, kann auch bei anderer Gelegenheit recht hilfreich sein.
Nochmal genauer: Wenn es n unabhängige Ereignisse A1,.., An gibt, die mit Wahrscheinlichkeit q eintreten, so ist die Wahrscheinlichkeit, dass mindestens eines eintritt
W = 1 – (1 – q)^n (n als Exponent).

Vor einiger Zeit empfahl mir ein Finanzberater einen Fond. Darin enthalten 10 Aktien bekannter Firmen aus unterschiedlichen Branchen. Anlagezeitraum 5 Jahre festgelegt. Rendite war auch ok. Vorteil: Kein Verlustrisiko, da auf jeden Fall der eingezahlte Betrag wieder ausgezahlt wird. Nachteil: Sollte eine der Aktien innerhalb eines Jahres einmal mehr als 15% (soweit ich mich erinnere) verlieren, dann wäre, auch wenn sie später wieder an Wert gewinnt, die ganze Rendite perdu, also nur noch nach 5 Jahren der ursprüngliche Betrag fällig.

Nun bin ich kein Börsenspezialist und habe wenig Lust mich mit Firmenbilanzen zu beschäftigen. Also habe ich mir überlegt, wie hoch die Wahrscheinlichkeit sein könnte, nichts zu verdienen.

Wenn ich annehme, dass bei jeder einzelnen Firma der zwischenzeitliche Wertverlust innerhalb von 5 Jahren, was an der Börse kein leicht überschaubarer Zeitraum ist, mit einer Wahrscheinlichkeit von q = 5% eintritt, dann bin ich bei W = 40 %, dass er bei mindestens einer der Firmen eintritt und Rendite = 0 ist; bei q = 10% bin ich dann schon bei W = 65% für 0 Rendite. Das hat mich nicht begeistert.