Ungenauigkeit von Antikörpertests

Bei Antikörperstudien kann die Ungenauigkeit der Tests das Ergebnis grob verzerren. Die zentrale Größe ist hier die Specificity des Tests. Daran sieht man, wie wahrscheinlich es ist, dass der Test eine Person, die den Virus nicht trägt (also negativ ist), als fälschlicherweise als positiv eingestuft wird. Bei einer Specificity von 98 % werden zum Beispiel 2% aller noch-nie-Infizierten fälschlicherweise als positiv eingestuft. Das ist natürlich ein großes Problem wenn die tatsächliche Rate der Infektionen selbst nur einige Prozent beträgt. Es gibt verschiedene Wege das zu sehen.

Ein Weg wäre zu betrachten, wie wahrscheinlich es ist ein deutlich von Null verschiedenes Ergebnis zu finden, obwohl niemand in der Bevölkerung tatsächlich Antikörper trägt. Bei einer Specificity von 98 % würde man mit den folgenden Wahrscheinlichkeiten eine Infektionsrate von 3 % oder mehr finden, obwohl in der Realität niemand infiziert ist. Die Variable ist hier die Größe der Stichprobe, die Berechnung kann man mit der oberen kumulativen Verteilungsfunktion dieses Binominalrechners machen.

10014 %
5005 %
10001 %
5000circa 0 %

Vor allem bei kleinen Antikörperstudien gibt es also die Gefahr, dass eine Studie eine signifikante Verbreitung der Antikörper findet, die in der Realität gar nicht besteht. Glücklicherweise lässt sich dieses Problem durch die Erhöhung der Stichprobengröße einfach umgehen. Vor allem da sich erwartete False Positives auch herausrechnen lassen. Hier nochmal diesselbe Rechnung mit der Annahme schlauer Wissenschaftler. Also die Frage, wie wahrscheinlich es wäre bei der gegebenen Specificity eine Infektionsrate von 3 % oder mehr finden, wenn man vor der Auswertung die erwarteten False Positives abzieht:

1002 %
500circa 0 %
1000circa 0 %
5000circa 0 %

Geht es darum zu vermeiden, eine verbreitete Infektion zu finden wo keine ist, muss die Stichprobengröße also nicht ganz so groß sein, wie es die erste Tabelle impliziert. Durch Herausrechnen der erwarteten Anzahl von False Positives reichen schon N > 150, um nicht in diese Falle zu treten. Natürlich funktioniert das auch in die andere Richtung. Ab einer gewissen Stichprobengröße wird es, trotz der Ungenauigkeit der Tests, extrem unwahrscheinlich dass man eine Verbreitung im Stil des Herdenschutzes hat, obwohl man in der Studie kaum eine Verbreitung festgestellt hat.

Verlorene Lebensjahre pro Infektion

Eine interessante Metrik bei Krankheiten / Unfällen / Verbrechen ist die Anzahl verlorener Lebensjahre pro Ereignis. Hierbei wird nicht nur berücksichtigt, wie sich die Mortalität mit dem Alter verändert, sondern auch wie weit Betroffene jeweils von der Lebenserwartung entfernt sind. Die Differenz zur Lebenserwartung wird dabei als die Anzahl verlorener Lebensjahre im Falle eines Todes gewertet. Rechnet man das für Covid-19 durch mit a) dieser Verteilung der Mortalität und b) dieser Verteilung der Infektionen (nicht gut aufgebrochen, aber für eine Schätzung ausreichend), dann bekommt man folgendes:

  • Pro Infektion gehen 0,25 Lebensjahre verloren
  • Der Gruppe der 60-69 Jährigen gehen pro Infektion am meisten Lebensjahre verloren (circa 0,1 Lebensjahre)
  • Obiges Resultat kann man sich so denken: 60-69 Jährige haben zwar eine geringere Mortalität als 70-79 Jährige, aber ihnen geht pro Todesfall mehr Lebenszeit verloren als den 70-79 Jährigen.

Interessant ist auch die Frage, ob öffentliche Maßnahmen und die Zuwendung von Ressourcen sich an der reinen Verteilung der Mortalität orientieren sollten oder stattdessen an der Verteilung der verlorenen Lebenszeit. Während bei ersterem der Fokus auf dem Schutz der 80+ Jährigen liegen würde, ginge es bei letzterem vor allem um den Schutz von Menschen im “frischen Rentenalter”. Wie man es wohl macht bleibt es unfair.

Hinweis: Unerkannte Fälle würden diesen Wert stark beeinflussen. Kommen auf jeden erkannten Fall fünf unerkannte Fälle, eine konservative Schätzung, so wären es 0,05 verlorene Lebensjahre pro Infektion. Die Verhältnisse der Altersgruppen könnten sich dabei auch verschieben wenn das Verhältnis erkannter zu nicht-erkannter Fälle selbst altersabhängig ist.

Ist das Alter ein Risikofaktor bei Covid-19?

Da ältere Menschen eine deutlich höhere Lethalität bei Covid-19 zeigen als jüngere Menschen, scheint die obige Frage sich selbst zu beantworten. Die Lethalität ist für 80-Jährige etwa hundertmal höher als für 30-Jährige. Das alleine beantwortet die Frage jedoch nicht, da der typische 80-Jährige auch deutlich häufiger Diabetes, Bluthochdruck, eine Herzkrankheit und COPD hat als ein typischer 30-Jähriger. Um festzustellen, ob das Alter an sich ein Risikofaktor ist oder nicht, muss man einen “fairen Vergleich” machen.

Also nicht den typischen 80-Jährigen mit dem typischen 30-Jährigen vergleichen, sondern einen gesunden 80-Jährigen (kein Diabetes, kein Bluthochdruck, keine Herzkrankheit, kein COPD) mit einem gesunden 30-Jährigen. Denn trotz der offensichtlichen Ungleichheit in der Lethalität wäre es ohne eine solche Analyse denkbar, dass der Virus für einen 30-Jährigen mit all den genannten Risikofaktoren eine größe Gefahr darstellen kann als für einen gesunden 80-Jährigen.

Die Datenlage sagt im Moment leider Ja und Nein. Hier die Resultate einer Studie der Risikofaktoren, die im Lancet veröffentlicht wurde:

Der Blick sollte auf die Spalte Multivariable OR (Odds Ratio) fallen. Das zeigt die Erhöhung des Risikos wenn man alle relevanten Variablen gleichzeitig in ein Regressionsmodell nimmt. Kleine Anmerkung: Alle heißt hier Fünf. Die Anzahl an Variablen, die man in die Regression aufnehmen kann, ist praktisch durch die Anzahl Studienteilnehmer begrenzt. Als Faustformel gilt ein Prediktor pro zehn Teilnehmer. In der Studie wurden 54 Todesfälle betrachtet und entsprechend nur fünf Prediktoren gewählt.

An der Zeile Diabetes sieht man, dass nicht alles, was man erhöht bei Teilnehmern feststellt, wirklich ein Risiko darstellt. Manche Dinge sind einfach nur über eine Assoziation verknüpft. Ein blödes Beispiel, dass diese Idee veranschaulichen soll: Hätte man alle Patentien vorher gefragt, welche politische Einstellung sie haben, hätte man später feststellen können, dass es unter den Todesfällen mehr konservative Menschen gibt als in einer repräsentativen Vergleichsgruppe bzw. der Gruppe der Überlebenden. Das heißt natürlich nicht, dass konservative Einstellungen die Krankheit verstärken. Es ist nur eine assoziative Verbindung. Ältere Menschen sind eher konservativ. Ältere Menschen sterben eher an Covid-19. Entsprechend sterben konservative Menschen eher an Covid-19.

Wirklich interessant ist die Frage, was von einem Effekt übrig bleibt wenn man nach allen anderen Variablen bereinigt. Bereinigt man nach dem Alter, würde man sehen dass konservative Einstellungen kein Risikofaktor oder Schutzfaktor darstellen (OR = 1). Die Tabelle sagt also: Bereinigt man nach Diabetes, Bluthochdruck, eine Herzkrankheit und COPD, dann bleibt der Effekt des Alters bestehen. Das Alter ist also auch für sich genommen ein Risikofaktor. Ein gesunder 80-Jähriger ist durch den Virus gefährdeter als ein gesunder 30-Jähriger. Und wohl auch gefährdeter als ein 30-Jähriger mit einer handvoll Risikofaktoren.

Aber so richtig klar scheint das nicht zu sein. Ob ein Effekt übrig bleibt, kann davon abhängen welche Prediktoren verwendet werden. In dieser Studie wurden einige der obigen Risikofaktoren nicht aufgenommen, dafür aber der BMI hinzugenommen. Hier ist das Ergebnis:

Gemäß dieser Studie ist das Alter kein Risikofaktor. Auch Diabetes nicht. Hier zeigt sich nur das Geschlecht und der BMI als Risikofaktor. Mit etwas Fantasie auch der Bluthochdruck. Der P-Wert ist 0.08, also etwas höher als der normale Cut-Off, aber noch akzeptabel. Zumindest ist dieser p-Wert ein guter Hinweis darauf, dass kein p-Hacking betrieben wurde. Ehrliche Studien scheitern auch mal knapp.

Der Grund, wieso mehr alte Menschen an Covid-19 sterben, ist laut dieser Tabelle der bei alten Menschen erhöhte BMI und Blutdruck. Ein normalgewichtiger 80-Jähriger hätte die gleichen Chancen wie ein normalgewichtiger 30-Jähriger. Und sogar ein geringeres Risiko als ein übergewichtiger 30-Jähriger. Dieses Resultat darf man natürlich anzweifeln. Man sollte prinzipiell jedes Resultat jeder Studie anzweifeln solange es keine Replikationen gibt. Aber das Obige wäre der logische Schluss.

Diese Abweichungen in den Studien sollten kein Grund zur Sorge sein. Beide Studien sind sehr klein und es werden noch viele kleine Studien mit widersprüchlichen Ergebnissen erscheinen. Die Wahrheit wird sich in den Meta-Analysen zeigen.

PS: Bei der Interpretation der zweiten Studie habe ich etwas getrickst indem ich angenonmmen habe, dass ein höheres Risiko zur Notwendigkeit mechanischer Ventilation mit einem höheren Sterberisiko einhergeht. Die Schlussfolgerungen stehen und fallen mit der Richtigkeit dieser Annahme.

Faustformel zur Durchseuchung mit konstanter Rate

Nimmt man an, dass eine Population mit konstanter Rate (also einer gleichbleibenden Anzahl neuer Fälle pro Tag) durchseucht wird, dann lässt sich aus dem SEIR-Modell eine knappe und nützliche Faustformel für die maximale Anzahl neuer Fälle herleiten. Es gilt:

Maximale Rate = Betten-Kapazität / Dauer der Hospitalisierung

Wobei die Dauer der Hospitalisierung pro infizierter Person (und nicht etwa pro eingeliefertem Patient) berechnet wird. Solange die Durchseuchung mit dieser oder unterhalb dieser Rate erfolgt, wird das Gesundheitswesen der Pandemie standhalten. Schätzwerte für die Größen gebe ich unten an. Die Herleitung der Formel benötigt viel Schreibarbeit, folgt aber direkt aus nur zwei Annahmen:

  • Der Ausbruch erfolgt nach dem SEIR-Modell
  • Es gibt eine konstante Anzahl neuer Fälle pro Tag

Hier ist die Rechnung:

Die Differentialgleichung für E lässt sich durch Seperation der Variablen lösen, die Gleichung für I mit der Methode des integrierenden Faktors. Beide Lösungen genügen den Anfangsbedingungen E(0) = E0 und I(0) = I0. TE ist die Inkubationszeit, TI die symptomatische Zeit. Die Lösungen zeigen, dass nach einem kurzen Einschwingvorgang auch die Anzahl der Exponierten und Anzahl der Infizierten einen konstanten Wert einnehmen, auf dem sie bis zum Ende der Durchseuchung bleiben. Diese Grenzwerte sind wie folgt:

Anzahl Exponierte = Anzahl neuer Fälle pro Tag * Inkubationszeit

Anzahl Infizierte = Anzahl neuer Fälle pro Tag * Symptomatische Zeit

Letzteres unter der Annahme, dass E0 und I0 etwa Null sind. Behält man diese Annahmen bei und nimmt zur Vereinfachung noch TI >> 1 an, dann folgt die obige Formel. Welche Werte ergeben sich für Deutschland? Es gibt derzeit etwa 30.000 Betten mit Beatmungsmöglichkeit. Nehmen wir an, dass 20.000 davon für Covid-19-Patienten zur Verfügung stehen.

Bei der mittleren Dauer der Hospitalisierung ist es wichtig, auch jene miteinzubeziehen, die nicht ins Krankenhaus müssen. Mit einer Dunkelziffer von 1:5 von erfassten zu nicht-erfassten Fällen, folgt nach dieser Statistik, dass etwa 3 % aller Infizierten ins Krankenhaus müssen. Wir nehmen an, dass diese im Mittel dort 13 Tage verbleiben. Die mittlere Dauer der Hospitalisierung wäre also:

0.97 * 0 Tage + 0.03 * 13 Tage = 0,4 Tage pro infizierter Person

Damit folgt, dass das deutsche Gesundheitswesen etwa 50.000 neue Infektionen pro Tag abfangen könnte (1). Ohne Ausbau der Betten wäre das die maximale Rate, mit der die Bevölkerung durchseucht werden kann. Eine Durchseuchung von 42,5 Millionen Menschen (50 Millionen notwendig für Herdenschutz minus 15 % schon infiziert) wäre damit frühstens in 28 Monaten zu schaffen. Nimmt man jedoch an, dass die Anzahl verfügbarer Betten für Covid-19-Patienten auf 40.000 gesteigert werden kann, was machbar klingt, so würde sich dies auf 14 Monate reduzieren.

(1) Zum Vergleich: Laut Schätzung von Harald Lesch beträgt die Kapazität des deutschen Gesundheitswesens 40.000 neue Fälle pro Tag