Körpergröße bei Männern als psychologischer Faktor

Gibt es einen Unterschied in der Persönlichkeit zwischen kleineren und größeren Männern? Bevor ich eine (nicht DIE) Antwort gebe, erstmal ein Wort zur Interpretation statistischer Unterschiede. Die Aussage “Frauen sind empathischer als Männer” ist korrekt, jedoch handelt es sich hier um eine Aussage über die Mittelwerte der beiden Gruppen, keine Aussage über bestimmte Individuen. Die richtige Interpretation der obigen Aussage ist: Wählt man zufällig eine Frau und einen Mann, dann ist die Wahrscheinlichkeit, dass die zufällig gewählte Frau einen höheren Wert auf der Empathie-Skala erzielt als der Mann, größer als 50 % (der genaue Wert ist 60 %). Bei zehn zufälligen Ziehungen würde man also erwarten, dass in sechs Fällen die Frau empathischer ist und in vier Fällen der Mann. Auf diese Weise sind auch alle folgenden Unterschiede zu interpretieren. Es geht nie um Individuen, sondern immer um Unterschiede im Mittel.

Jetzt, wo Einigkeit über die Interpretation besteht, hier ein Unterschied, der deutlich zu Tage kommt in dem Datensatz (n = 254): Kleinere Männer sind im Mittel empfänglicher für eine große Bandbreite psychischen Problemen als große Männer. Ich mache den Anfang beim Selbstbewußtsein. In der Gruppe der Männer, die sich im Bereich 160 cm Körpergröße bewegen, berichten knapp 65 % (2 von 3) von einem geringen Selbstbewußtsein. In der Gruppe der Männer um 185 cm sind es nur 35 % (1 von 3). Der Übergang scheint recht kontinuierlich zu sein.

Kleinere Männer scheinen auch empfänglicher für praktisch alle Arten von Ängsten zu sein. Die Skala unten ist eine Zusammenfassung typischer Phobien (Flugzeug, Achterbahn, Sozial, und so weiter). Die Effektstärke ist beachtlich. Zur Einordnung: Eine effektive Psychotherapie wie z.B. CBT kann Symptome um 1 bis 1,5 Standardabweichungen senken. Der Unterschied zwischen der Gruppe der kleineren und größeren Männern beträgt knapp 1 Standardabweichung. Er fällt also deutlich ins Gewicht.

Kleinere Männer erzielen im Mittel auch einen höheren Wert auf einer Borderline-Skala. Hier sieht man ebenfalls eine beachtliche Effektstärke:

Änhliches gilt für suizidale Gedanken:

Auch bei Psychopathie (gemessen mittels dem “Dirty Dozen” Fragebogen der dunklen Triade) erzielen kleinere Männer im Mittel höhere Werte, wobei sich hier am oberen Ende der Skala ein plötzlicher Anstieg gegen den Trend zeigt. Unmöglich zu sagen, ob es sich um einen realen Effekt handelt oder nur um eine bedeutungslose statistische Schwankung. Beides ist gut denkbar.

Narzissmus gehört ebenfalls zur dunklen Triade und wurde hier mit dem gleichen Fragebogen erfasst. Entgegen dem, was man im Allgemeinen vermuten mag, erzielen größere Männer geringere Werte auf der Narzissmus-Skala als kleinere Männer.

Diese psychische Aufwühlung macht sich auch im Schlaf bemerkt. Kleinere Männer berichten von einer größeren Häufigkeit intensiver Träume:

Und häufigeren Alpträumen:

Wenig überraschend auch von mehr Schlafproblemen, aber ich habe vergessen den Graphen abzuspeichern. Vielleicht liegen die Schlafprobleme aber nicht nur an der psychischen Aufwühlung. Pragmatischere Gründe sind denkbar, denn kleinere Männer verdienen im Mittel weniger:

Und berichten häufiger, dass sie mit Finanzproblemen kämpfen:

Trotz all diesen Empfänglichkeiten sind kleinere Männer im Mittel nicht weniger glücklich als größere Männer. Wobei man mit etwas Fantasie auch hier eine U-Kurve (umgekehrt) sehen kann. Ob realer Effekt oder bloße Schwankung muss leider offen bleiben.

Einer der gängisten Meinung über große Männer ist, dass sie beim anderen Geschlecht mehr Erfolg haben. Interessanterweise gibt es hierfür keine Hinweise. Große Männer sind nicht seltener Single:

Produzieren nicht mehr Kinder:

Und haben auch nicht häufiger Sex:

Zumindest gemäß dieses Datensatzes scheint die (absolute) Körpergröße kein bedeutendes Selektionsmerkmal zu sein. Vielleicht weil bei Paaren die relative Körpergröße der Partner wichtiger ist als die absolute Körpergröße des Mannes? Andere Körpermerkmale relevanter sind? Oder die Persönlichkeit mehr zählt? Wie dem auch sei, das Nullresultat springt ins Auge.

BMI – Normal und Ideal

Die Welt ist über die letzen Jahrzehnte deutlich dicker geworden. Das gilt nicht nur für westliche Länder (USA, praktisch alle europäischen Staaten), sondern auch für viele Entwicklungsländer (Mexiko, Brasilien, Türkei). Dadurch hat sich eine Diskrepanz ergeben zwischen BMI-Werten, die von der Medizin empfohlen werden (Idealbereich), und den Werten, die in den Gesellschaften tatsächlich gemessen werden (Normalbereich). Wie groß ist diese Diskrepanz in Deutschland?

Dazu muss man neben dem Mittelwert auch die Standardabweichung kennen. Laut Our World in Data (Scrollen zur Kategorie Obesity / BMI) ist der mittlere BMI in Deutschland zwischen den Jahren 1975 und 2016 von 24,7 auf 27,5 (Männer) beziehungsweise 24,3 auf 26,0 (Frauen) gestiegen. Die Standardabweichung lässt sich medizinischen Publikationen entnehmen, zum Beispiel hier und hier. Sie beträgt grob 0,15*BMI für Männer, was dem Wert 4,1 bei dem obigen Mittelwert entspricht, und 0,22*BMI für Frauen, oder 5,5.

Damit ergeben sich unter Zuhilfenahme eines beliebigen Rechners für die Normalverteilung (ich nutze immer diesen) folgende Bereiche für Deutschland:

Männer: 27,5 ± 4,1

33 % liegen innerhalb 25,8 und 29,2 (z = 0,42)
50 % liegen innerhalb 24,7 und 30,3 (z = 0,68)
75 % liegen innerhalb 22,8 und 32,2 (z = 1,15)
90 % liegen innerhalb 20,7 und 34,4 (z = 1,66)

Frauen: 26,0 ± 5,5

33 % liegen innerhalb 23,7 und 28,3 (z = 0,42)
50 % liegen innerhalb 22,3 und 29,7 (z = 0,68)
75 % liegen innerhalb 19,7 und 32,3 (z = 1,15)
90 % liegen innerhalb 16,9 und 35,1 (z = 1,66)

Der Normalbereich in Deutschland liegt also bei 25-30 für Männer und 22-30 für Frauen. In diesem um den Mittelwert zentrierten Bereich liegt der BMI von 50 % der Deutschen des jeweiligen Geschlechts. Das natürlich unter der Annahme einer repräsentativen Altersverteilung. Beschränkt man sich auf junge Männer oder Frauen, verschiebt sich der Normalbereich in Richtung niedrigerer Werte, für eine Beschränkung auf ältere Männer und Frauen in Richtung höherer Werte.

Die Diskrepanz zu den Empfehlungen der Medizin ist sehr deutlich. Bei Männern spricht man zwischen 20-25 von Idealgewicht (leider verwirrenderweise auch oft Normalgewicht genannt), 26-30 von Übergewicht und ab 31 von Adipositas. Für Männer in Deutschland, das stimmt auch für sehr viele andere Länder, ist Übergewicht seit ein bis zwei Jahrzehnten die Norm. Nur 25 % der Männer (jeder Vierte) liegen im Idealbereich.

Bei Frauen ist die Situation ähnlich. Hier liegt der Idealbereich bei 19-24, der Bereich von Übergewicht bei 24-30 und der Bereich von Adipositas bei 31 aufwärts. Auch wenn die Überschneidung von Normal- und Idealbereich in diesem Fall etwas größer ist, gilt auch hier, dass Übergewicht die Regel ist. Gemäß dem Mittelwert und der Standardabweichung liegen nur 35 % der Frauen (jede Dritte) im Idealbereich.

Über Gründe für die Entwicklung der letzten Jahrzehnte will ich nicht spekulieren. Ich kann aber noch die Risikofaktoren für erhöhte BMI-Werte aus einem Datensatz mit n = 361 Leuten (USA) anfügen:

  • Alter
  • Persönlichkeit: Geringe Conscientiousness (Gewissenhaftigkeit)
  • Persönlichkeit: Hohe Neigung zu Ungeduld
  • Persönlichkeit: Hohe Neigung zu Langeweile
  • Ernährung: Hoher Konsum zuckerhaltiger Getränk
  • Ernährung: Hoher Konsum von Fleisch
  • Ernährung: Hoher Konsum frittierter Lebensmittel
  • Ernährung: Hoher Konsum von Pizza
  • Ernährung: Geringer Konsum von Nüssen
  • Ernährung: Selten kochen
  • Bewegung: Selten spazieren gehen
  • Bewegung: Selten trainieren (Mid-Intensity bis High-Intensity)

Alles nur korrelativ. Manches davon wird tatsächlich ursächlich sein, anderes davon nur Indikator für ursächliche Faktoren, welche an anderer Stelle aufgelistet oder durch die Umfrage gar nicht erfasst wurden. Das jeweilige Signifikanzniveau ist mindestens p < 0,05.

Wieso man sich auf das Altern SEHR freuen sollte

Unter Begriff Ageism werden Vorurteile gesammelt, die man unter jungen Menschen oft über alte Menschen hört. Viele denken hier an Einsamkeit, Traurigkeit, Bitterkeit, Schwäche. Von der Realität können diese Vorurteile aber kaum weiter entfernt sein. Tatsächlich gilt: Mit dem Alter wird alles besser und zwar sehr deutlich. Altern bringt Herzlichkeit, Glück, Entspannung, Stabilität. Behaupten kann man natürlich viel, deshalb lasse ich ab hier die Daten (n = 582 / USA / Alter: 14 bis 86) sprechen.

Mit dem Alter dreht sich die Persönlichkeit sehr deutlich ins Positive. Menschen werden im Mittel extrovertierter (weniger schüchtern, kontaktfreudiger):

Das Merkmalcluster Sozialverträglichkeit (Herzlichkeit, Empathie, Rücksicht) bekommt einen deutlichen Schub:

Das Gleiche gilt für das Cluster Gewissenhaftigkeit (Verlässlichkeit, Ordentlichkeit):

Und noch schöner: Alle Aspekte des Clusters Neurotizismus (Ängstlichkeit, emotionale Instabilität, Selbstwertprobleme, negativer Fokus) erfahren eine klare Entspannung.

Vor dem Hintergrund des abnehmenden Neurotizismus leuchtet es ein, dass man umso glücklicher wird, je älter man wird. Senioren fühlen sich viel glücklicher als Menschen mittleren Alters:

Der reduzierte Neurotizismus bringt auch einen besseren Schlaf. Schlafprobleme lösen sich nach und nach auf:

Einschlafen geht schneller:

Und Alpträume werden seltener:

Alle Aspekte der dunklen Triade beginnen sich ebenso zu verabschieden. Es zeigt sich eine deutlich geringere Tendenz zu Psychopathie:

Eine Reduktion bei machiavellistischen Denkmustern:

Und auch weniger Narzissmus:

Kleiner Zusatz: Bei den Clustern Sozialverträglichkeit, Psychopathie und Machiavellismus zeigen sich Geschlechterunterschiede. Das Drehen ins Positive geschieht bei Frauen schneller und deutlicher.

Sozialverträglichkeit:

Psychopathie:

Machiavellismus:

Für Borderline gilt dasselbe wie für die dunkle Triade: Es verabschiedet sich.

Ebenso die suizidale Ideation:

Ältere Menschen fühlen sich viel seltener grundlos erschöpft. Auch das ist wohl eine Folge des sinkenden Neurotizismus.

High-Intensity-Training funktioniert später natürlich nicht mehr so gut:

Aber zumindest was spazieren gehen angeht, zeigt sich bei Senioren keine signifikante Abnahme. Viel Bewegung ist auch im Seniorenalter gut möglich:

Dass man etwas dicker wird, lässt sich trotzdem nur schwer vermeiden:

Das Einkommen sinkt wieder, was man aber vor der Hintergrund des deutlich erhöhten Lebensglücks sicherlich verschmerzen kann:

Noch zwei Hinweise: Die Freude am Reisen bleibt auch im hohen Alter bestehen!

Und die Freude am Tanzen scheint sogar ein kleines bisschen zuzunehmen:

Es zeigt sich also ein Bild, dass sich klar von den gängigen Vorurteilen unterscheidet. Einsamkeit, Traurigkeit und Bitterkeit ist eher etwas für jungen Menschen. Ältere Menschen sind im Mittel kontaktfreudiger, sozialer, verlässlicher, positiver und vor allem glücklicher als junge Menschen. Vieles davon tritt auch schon viel früher ein, ab den 40ern und 50ern. Es handelt sich nicht um einen plötzlichen Wandel mit dem Eintritt in das Rentenalter, sondern um einen stetigen Prozess des Besserns. Wie dem auch sei, jede Metrik sagt ganz klar: Man darf sich auf das Altern freuen.

Was ist eine Standardabweichung? Was sind Z-Werte?

Der Mittelwert m ist die populärste Kennzahl der Statisik und sie ist i.d.R. das Erste, was berechnet wird, wenn man Daten beurteilen bzw. zusammenfassen möchte. Die Standardabweichung s fristet im Gegensatz dazu eher ein Schattendasein und das, obwohl sie genauso wichtig und nützlich bei der Beurteilung von Daten ist. Während der Mittelwert angibt, welche Werte man im Mittel erwarten kann, gibt die Standardabweichung an, wie weit die Werte um diesen Mittelwert streuen.

Eine Welt, in der die Körpergröße eine hohe Standardabweichung besitzt, würde sehr anders aussehen als eine, in der man nur eine geringe Standardabweichung hat. Und das selbst dann, wenn man in beiden Fällen denselben Mittelwert hat. Angenommen es leben auf Insel A Menschen, die im Mittel eine Körpergröße von m = 180 cm und eine Standardabweichung von s = 7 cm haben. In diesem Szenario würde man erwarten, dass circa 70 % (siehe Faustregeln unten) der Menschen eine Körpergröße zwischen 180-7 = 173 cm und 180+7 = 187 cm besitzen. Und 95 % der Menschen auf Insel A liegen zwischen 180-2*7 = 166 cm und 180+2*7 = 194 cm. Menschen unter einer Größe von 160 cm oder über 200 cm wären also auf dieser Insel eine ziemliche Seltenheit. Bei einer Stichprobe mit sehr vielen Menschen würde man auch Menschen mit solch extremen Körpergrößen finden, aber sie würden deutlich aus der Masse herausstechen. Diese Körpergrößen liegen auf Insel A weit außerhalb der gewöhnlichen Schwankungsbreite.

Anders wäre das auf Insel B mit demselben Mittelwert m = 180 cm und einer Standardabweichung s = 15 cm. Hier haben circa 70 % der Menschen eine Körpergröße 165 cm bis 195 cm. Und 95 % eine Körpergröße 150 cm bis 210 cm. Menschen um die 160 cm oder 200 cm Körpergröße würden hier nicht sonderlich herausstechen, trotz der deutlichen Entfernung zum Mittelwert. Extreme Körpergrößen beginnen hier eher ab 140 cm für das eine Ende der Skala und 220 cm für das andere Ende. Um beurteilen zu können, welche Werte innerhalb normaler Schwankungen liegen und welche Werte extrem sind, ist es also unbedingt notwendig die Standardabweichung zu kennen. Der Mittelwert gibt keinen Auskunft darüber. Als Faustformel kann man sich merken:

  • 70 % der Werte liegen zwischen Mittelwert minus einer Standardabweichung (m-s) und Mittelwert plus einer Standardabweichung (m+s)
  • 95 % der Werte liegen zwischen Mittelwert minus zwei Standardabweichungen (m-2*s) und Mittelwert plus zwei Standardabweichungen (m+2*s)

Das gilt zwar strikt nur dann, wenn die Werte normalverteilt sind, aber auch für andere Verteilungen (sofern nicht radikal verschieden) sind es verlässliche Richtwerte. Noch ein weiteres Beispiel, gefolgt von einem Argument dafür, wieso man am besten gleich den Schritt zum “Z-Wert” machen sollte. Angenommen es wird ein Test zur Messung von Selbstbewusstsein entworfen. 30 Fragen, je nach Antwort gibt es pro Frage 0-3 Punkte. Je höher die Punktzahl, desto besser das Selbstbewusstsein. Die Gesamtzahl der Punkte kann also zwischen 0 und 90 liegen. Angenommen man würde den Test 1000 Leuten vorlegen und fände einen Mittelwert von 60 Punkten. Wie ist das Selbstbewusstsein einer Person zu beurteilen, die nur 50 Punkte erreicht hat? Normale Schwankung? Grund zur Sorge?

Das hängt offensichtlich davon ab, wie weit die Punktzahl für gewöhnlich schwankt. Ohne die Standardabweichung zu kennen, lässt sich diese Frage nicht beantworten. Beträgt die Standardabweichung s = 10 Punkte, so gäbe es keinen Grund zur besonderen Sorge. Man darf erwarten, dass 70 % der Resultate (gegeben wie zukünftig) zwischen 50 und 70 Punkten liegen. Und 95 % der Resultate im Bereich von 40 bis 80. Wo genau man den Punkt “Grund zu besonderer Sorge” anlegt, ist natürlich nirgendwo definiert, aber die Punktzahl 50 liegt noch klar in der Zone normaler Schwankungen.

Solche Diskussionen werden deutlich einfacher und einheitlicher, wenn man statt der beiden Begriffe Mittelwert und Standardabweichung den Begriff Z-Wert heranzieht. Der Z-Wert gibt direkt an, wo ein Wert im Bezug auf den Mittelwert unter Berücksichtigung der Schwankungsbreite liegt. Die Punktzahl 50 entspricht dem Z-Wert z = -1 weil dieser genau eine Standardabweichung unter dem Mittel liegt. Die Punktzahl 40 entspricht analog z = -2. Für die andere Richtung hat man z = 0 für die Punktzahl 60 (der Mittelwert), z = 1 für die Punktzahl 70 und z = 2 für die Punktzahl 80.

Auch bei der Körpergröße lassen sich leicht Z-Werte angeben. Nochmal zu Insel A mit einem Mittelwert m = 180 cm und einer Standardabweichung s = 7 cm. Eine Körpergröße von 180 cm entspricht z = 0, die Größe 187 cm entspricht z = 1, die Größe 173 cm entspricht z = -1, die Größe 194 cm entspricht z = 2, die Größe 166 cm entspricht z = -2, und so weiter. Eine Diskussion in Z-Werten ist sehr nützlich weil man nicht immer an den exakten Skalenwerten interessiert ist und sich die Berechnung der Schwankungsbereiche erspart. Angenommen Wissenschaftler entwickeln eine Skala für Narzissmus. Den Leser interessiert der Mittelwert m = 4,1 und die Standardabweichung s = 0,4 i.d.R. recht wenig. Diese Werte haben keine klare direkte Interpretation und würden sich außerdem auch ändern, wenn man die Skala modifiziert. Etwa indem man mehr Fragen hinzunimmt oder die Anzahl erreichbarer Punkte pro Frage verändert.

Was aber trotzdem eine direkte Aussagekraft behält sind die Z-Werte. Weiß man, dass ein Teilnehmer ein Resultat entsprechend z = 2 erhalten hat, dann weiß man dass dies einer ziemlich deutlichen Erhöhung von Narzissmus entspricht. Weiß man, dass ein ein Teilnehmer ein Resultat entsprechend z = 2 bei der Selbstbewusstseinskala erhalten hat, dann weiß man dass dies einer ziemlich deutlichen Erhöhung des Selbstbewusstseins entspricht. Und weiß man, dass ein Mensch eine Körpergröße entsprechend z = 2 hat, dann weiß man dass dies einer ziemlich deutlichen Erhöhung der Größe entspricht. Egal welche Skala verwendet wird, es lohnt sich in Z-Werten zu denken, weil hier Mittelwert und Schwankungsbreite schon sinnvoll verarbeitet sind.

Die Z-Werte meiner Persönlichkeit sind grob:

  • Extraversion: z = +0,5
  • Sozialverträglichkeit / Empathie: z = +1,5
  • Gewissenhaftigkeit: z = -1,5
  • Offenheit: z = +2,0
  • Stabilität: z = -1,0

Diese Werte machen Sinn und lassen sich gut beurteilen ohne die jeweiligen Mittelwerte und Standardabweichungen der Big-Five-Skalen zu kennen. Eine Diskussion mit Mittelwerten und Schwankungsbreiten wäre deutlich aufwendiger gewesen und hätte den Blick auf das Zentrale wohl nur verwaschen. Die Z-Werte machen die Einordnung so klar wie möglich.

Zurück zur Standardabweichung. Sie eignet sich also gut zur Beurteilung von Abweichungen zum Mittelwert, ist jedoch auch bei der Beurteilung von Effektstärken extrem nützlich. Angenommen man möchte wissen, wie groß der Einfluss von Koffeinkonsum auf die Einschlafdauer ist. Dazu sammelt man Daten (Wieviel Koffein trinkst du pro Tag? Wie lange brauchst du normalerweise zum Einschlafen?) und führt eine Regression durch. Der Königsweg zur Beurteilung der Effektstärke läuft über den standardisierten Regressionskoeffizienten Beta. Beta hat eine sehr klare und nützliche Interpretation. Der Wert gibt an, um wieviel Standardabweichungen sich Y ändert, wenn man X um genau eine Standardabweichung erhöht. Für unseren Fall: Um wieviele Standardabweichungen sich die Einschlafdauer ändert, wenn man den Koffeinkonsum um eine Standardabweichung erhöht.

Angenommen man fände Beta = 0,5. Man kann dann sagen, dass Leute, deren Koffeinkonsum z = 1 Standardabweichung erhöht ist, eine Erhöhung der Einschlafdauer um z = 0,5 Standardabweichungen haben. Und Leute, deren Koffeinkonsum z = 2 Standardabweichungen über dem Konsum-Mittelwert liegt, müssen mit einer Erhöhung der Einschlafdauer um z = 1 Standardweichung über dem Einschlafdauer-Mittelwert rechnen. Leute, die es schaffen ihren Koffeinkonsum um z = 3 Standardabweichungen zu senken, werden mit einer Senkung der der Einschlafdauer um z = 1,5 Standardabweichungen belohnt. Der Wert Beta erfasst also sehr klar die Stärke des Zusammenhangs, ohne auf die Details der jeweiligen Skalen eingehen zu müssen.

In diesem speziellen Fall wäre es tatsächlich sinnvoll, etwas weiterzurechnen, um die obigen Aussagen in bekannte Einheiten umzurechnen (z.B. Minuten Reduktion in der Einschlafdauer bei Reduktion es Konsums um 100 ml). Aber das ist nicht immer so. Man denke z.B. an den Zusammenhang zwischen emotionaler Stabilität und Gedächtnis. Oder Zustimmung zu Verschwörungstheorien und Angst vor Kontrollverlust. Hier gäbe es keine gängigen Einheiten zur Umrechnung. Der standardisierte Regressionskoeffizient Beta, und somit die Interpretation über Standardabweichungen, ist der Königsweg weil der Wert so schön skalenunabhängig ist. Und die Diskussion um Effektstärken somit auch einfach und einheitlich macht.

Man könnte hier noch einen Hinweis zum p-Wert anfügen. Das Statistik-Programm spuckt zu jedem Beta noch einen p-Wert raus. Dieser Wert sagt nichts über die Stärke eines Effekts. Er ist nur die Verlässigkeit des Resultats gegeben den Daten. Ein Wert p < 0,001 oder auch p < 0,01 sagt, dass man sich recht sicher sein darf, dass der Beta-Wert und alle Schlussfolgerungen daraus der Realität entsprechen. Es sind also genügend Daten vorhanden um der Regression “blind” glauben zu schenken. p < 0,05 ist schon etwas kritischer. Man kann den Wert Beta nehmen und seine Schlussfolgerungen ziehen, sollte sich der Sache aber nicht zu sicher sein. Eventuell interpretiert man hier eine zufällige Schwankung in den Daten als einen Effekt, der in der Realität gar nicht existiert. Und für p > 0,05 sollte man den Wert Beta verwerfen. Eventuell gibt es diesen Effekt. Aber man hat definitiv nicht genügend Daten, um sich dessen sicher zu sein.