Wie Vorhersagbar sind Menschen?

In der Physik ist es keine Seltenheit, den Ausgang eines Experimentes mit einer Genauigkeit von 10-20 Nachkommastellen vorhersagen zu können. Die unbelebte Natur, zumindest der makroskopische Teil davon, zeigt wenig bis keine Varianz. Physiker fragen sich nicht, welcher R² für Modelle akzeptabel ist, weil die Zusammenhänge i.d.R. so perfekt sind, dass sich die Frage erübrigt. Unerklärbare Varianz ist etwas, mit dem sich vor allem Sozialwissenschaftler quälen müssen. Was nicht die Schuld der Wissenschaftler ist. Die Vorhersagbarkeit der belebten Natur kommt sehr schnell an eine Grenze kommt, ohne dass man etwas dagegen tun könnte. Hier eine Demonstration.

Selbstbewusstsein lässt sich recht gut aus Neurotizismus vorhersagen. Nimmt man Extroversion hinzu, wird die Vorhersage noch besser. Ebenso wenn man das Gewicht, Erfahrungen der Jugend und Impulsivität hinzunimmt. Ansonsten gibt es in dem Datensatz mit n = 530 Leuten und mehr als 100 Variablen nichts mehr, was die Vorhersage noch verbessern könnte. So sieht das Modell mit den fünf Faktoren aus:

Für psychologische Verhältnisse ein exzellentes Modell: Hohe standardisierte Regressionskoeffizienten, niedriger p-Wert für jeden Faktor, hohes R². Aber wie genau sind die Vorhersagen daraus? Wie oft würde man auf Basis dieses Modells eine korrekte Vorhersage für das Maß an Selbstbewusstsein einer Person machen? Wertet man Vorhersageerfolg so, dass der berechnete Wert innerhalb einer halben Standardabweichung des berichteten Werts liegt (eine faire Schwelle, bedenkt man, dass die meisten Menschen innerhalb von -2 bis 2 Standardabweichungen liegen), dann ergibt sich ein Vorhersageerfolg von 52 %. Mit Neurotizismus alleine 47 %.

Man sollte das jetzt nicht mit einem Münzwurf vergleichen, da es hier nicht um eine Vorhersage Ja/Nein ging. Die Wahl der Schwelle entspricht grob einer Unterteilung der Skala in acht Einheiten. Der Vorhersageerfolg basierend auf bloßer Zufallsschätzung wäre 1/8 = 12,5 % gewesen. Das Modell bringt also definitiv eine Verbesserung gegenüber einer Zufallsschätzung. Es ist nicht nutzlos. Aber auch nicht sonderlich verlässlich.

Man könnte einwerfen, dass es sich nur um einen Fall handelt, aber meine Erfahrung mit psychologischen Datensätzen widerspricht dem ganz klar. 50/50 bei einer Fehlertoleranz von 0,5 Standardabweichungen ist eine typische Grenze, an die man bei der Vorhersage mit sehr guten Modellen kommt. 60/40 wäre schon eine Revolution. Der Grund ist sehr einfach: Viel unerklärbare Varianz. Im Datensatz finden sich dutzende Leute, bei den alle Risikofaktoren für geringes Selbstbewusstsein vorhanden sind, die jedoch keinerlei Probleme in dieser Hinsicht zeigen. Und andere, bei denen keiner der Risikofaktoren vorhanden ist und trotzdem unter geringem Selbstbewusstsein leiden. Es gibt keine cleveren Techniken, um solche unerklärbare Varianz zu domestizieren. Man muss einfach akzeptieren, dass die unbelebte so gebaut ist und die Vorhersagbarkeit entsprechend prinzipiell beschränkt ist.

Es gibt die Hoffnung, dass Hirnscans dieses Problem lösen könnten. Statt die Leute zu fragen, misst man sie und die unerklärbare Varianz verschwindet. Bisher ist das nicht geschehen. Zumindest mit den modernen Mitteln bleibt die Varianz auch bei Hirnscans enorm. Zum Beispiel BPD-Skala und Amygdala-Volumen. Ein kleineres Amygdala-Volumen führt in der Tendenz zu höheren Werten auf der BPD-Skala, aber der Vorhersageerfolg bei diesem Zusammenhang liegt ebenso im Bereich 50/50. Wieder eine deutliche Verbesserung zur Zufallsschätzung, aber es bleibt viel Unklarheit übrig.

Leave a Reply

Fill in your details below or click an icon to log in:

WordPress.com Logo

You are commenting using your WordPress.com account. Log Out /  Change )

Google photo

You are commenting using your Google account. Log Out /  Change )

Twitter picture

You are commenting using your Twitter account. Log Out /  Change )

Facebook photo

You are commenting using your Facebook account. Log Out /  Change )

Connecting to %s