Wie kann man mittels Regression die Veranlagung abschätzen?

Eine Frage, die sich in den seltensten Fällen zufriedenstellend beantworten lässt, ist die Frage wieviel eines Verhaltens oder Glaubens durch eine Veranlagung entsteht (und somit permanent bzw. kaum beeinflussbar ist) und wieviel durch bewusste Entscheidungen entsteht (und somit gut steuerbar ist). Regressionsmodelle bieten mannchmal die Möglichkeit, die Veranlagung grob abzuschätzen.

Zuerst der Hinweis: Hier ist mit Veranlagung nicht nur die genetische Komponente gemeint, sondern Genetik plus alle Elemente der frühen Kindheit, die permanente Auswirkung über restlichen Verlaufs des Lebens zeigen. Also Geschlecht, Big Five, Bindungsmuster, Harmonie im Elternhaus, Drogenkonsum der Eltern, Instabilität der Eltern, Erziehungsstil, Vernachlässigung, etc … Solche Variablen sollen hier unter dem Begriff Kausal zusammengefasst werden.

Eine einfache Methode um ein Gefühl dafür zu bekommen, wieviel einer Sache starre Veranlagung und wieviel formbarer Lebensstil ist, ist es einen Blick auf die erklärte Varianz zu werfen. Diese wird in Regressionsmodellen mit dem R^2 (r-squared) erfasst wird. Das Verhältnis des R^2, der sich aus der Vorhersage ausschließlich mittels der kausalen Variablen ergibt, und des R^2, der sich aus der Vorhersage mittels aller erfassten Variablen ergibt, liefert eine erste Schätzung für die Veranlagung in %.

Erklärt sich der größte Teil der Varianz alleine durch die kausalen Variablen, bleibt nur noch wenig Raum für Formbarkeit im späteren Leben und die Verhaltensweise bzw. der Glaube ist in gewisser Weise in Stein gemeißelt. Erklärt sich fast nichts der Varianz durch kausale Variablen, so ist bei der Sache die Veranlagung keine relevante Komponente.

Die Methode bietet jedoch einige Fallen, vor denen man sich in Acht nehmen muss. Erstens sollte man, da man alle Variablen unabhängig der Signifikanz in die Regression einfließen lässt, den reinen R^2 zur Analyse verwenden und nicht den adjusted R^2. Der adjusted R^2 bestraft ein Modell für jede insignifikante Variable, so dass diese Kennzahl auch sehr gut dafür taugt, ein Modell zu entwickeln, das mit der geringstmöglichen Menge an Variablen die größtmögliche Varianz erklärt. In diesem Fall möchte man das jedoch (ausnahmsweise) nicht. Hier geht es nur um die gesamte Menge der erklärten Varianz und das ist der reine R^2.

Die größte Falle ist aber die Unvollständigkeit des Datensatzes. Man muss annehmen, weil es nicht anders geht, dass die erfassten Variablen alle Variablen sind, die in der Welt existieren. Oder zumindest, dass nicht-erfasste Variablen das Resultat nicht maßgeblich verändern. Man misst die Veranlagung schließlich nur durch die kausalen und nicht-kausalen Variablen, die man vor sich hat.

Um den Gedanken mit einem Beispiel zu untermauern: Vorgestellt wir würden einen Datensatz vor uns haben, der akribisch genau drei dutzend kausale Variablen erfasst, aber darüberhinaus nur eine handvoll weitere Variablen. So würde man mit der obigen Methode immer zu sehr hohen Schätzungen für die Veranlagungen kommen und dies nur, weil sonst kaum mehr etwas vorhanden wäre, um zusätzliche Varianz erklären zu können. Das Gleiche würde passieren, wenn man neben den vielen kausalen Variablen zwar auch viele weitere Mediatoren erfasst hat, all diese aber für die untersuchte Sache irrelevant sind.

Die Methode ist also nur dann aussagekräftig, wenn man sich sicher sein kann, dass neben den wichtigsten kausalen Variablen auch die für den untersuchten Faktor relevantesten Mediatoren im Datensatz sind. Und genau hier liegt “der Hund begraben”. Dies dürfte nämlich leider oft nicht der Fall sein und hier sollte man den Resultaten der Analyse entsprechend nur begrenzt Glauben schenken.

Ein Durchforsten von Datensätzen mit dieser Methode zeigt, dass bei grundsätzlichen psychischen Phänomenen wie Lebenszufriedenheit, Depression, Schlafproblemen, Erschöpfung, Need for Control, Locus of Control, etc … die Veranlagung meistens um die 50 % liegt, während bei bei allgemeinen Einstellungen und Meinungen wie Furcht vor Verbrechen, Zustimmung zu Überwachung, Glaube an Aliens, etc … sich eine eher geringe Veranlagung um die 20 % ergibt.

Leave a Reply

Fill in your details below or click an icon to log in:

WordPress.com Logo

You are commenting using your WordPress.com account. Log Out /  Change )

Google photo

You are commenting using your Google account. Log Out /  Change )

Twitter picture

You are commenting using your Twitter account. Log Out /  Change )

Facebook photo

You are commenting using your Facebook account. Log Out /  Change )

Connecting to %s