Messung von Ungleichheit: Der Gini-Koeffizient

Der Gini-Koeffizient bekommt sehr wenig Liebe. Nur sehr selten berichten Medien darüber, was diese Zahl bedeutet, wie sie sich von Land zu Land unterscheidet und wie sie sich von Jahr zu Jahr ändert. Das ist enttäuschend, denn der Gini-Koeffizient macht einen zentralen Aspekt der Gesellschaft sichtbar: Die Ungleichheit. In der Regel die Ungleichheit im Einkommen, aber der Gini lässt sich auch für Wohlstand und Bildung berechnen.

Wie kann man Ungleichheit messbar machen? Ausgangspunkt ist die Lorentz-Verteilung. Angenommen man kenne das Einkommen jeder einzelnen Person im Land: I1, I2, I3, … , IN (insgesamt N Personen). Durch Addition kommt man zum Gesamteinkommen im Land: I = I1+I2+I3+…+IN. Zur Vereinfachung nehmen wir an, dass die Einkommen schon der Größe nach geordnet sind, also I1 < I2 < I3 < … < IN.

Uns interessiert jetzt, welcher Anteil p des gesamten Einkommens auf die 10 % der Bevölkerung fällt, die das geringste Einkommen haben. 10 % der Bevölkerung sind L = 0,1*N Leute. Wir addieren also das Einkommen der L Leute mit dem geringsten Einkommen, I10% = I1+I2+I3+…+IL, und teilen diesen Wert durch das gesamte Einkommen: p = I10% / I. Damit wissen wir, welcher Anteil p des Gesamteinkommens auf die unteren 10 % fällt. Hätte jede Person im Land dasselbe Einkommen, dann wäre p = 10 %. In der Praxis fällt aber auf die unteren 10 % deutlich weniger als 10 % des Gesamteinkommens.

Die Lorentz-Verteilung gibt an, wieviel Prozent p des Gesamteinkommens auf die unteren x Prozent der Bevölkerung fällt. In guter Näherung folgt die Verteilung in jedem Land der Formel:

p = x^a

Mit dem Parameter a, der als einziger zusätzlicher Input benötigt wird und sich aus einer Datenerhebung im Land ergibt (zur Schätzung später mehr). In Deutschland ist a = 1,9. Auf die unteren 10 % der Bevölkerung fällt der Anteil p = 0,1^1,9 = 0,013 = 1,3 % des Gesamteinkommens. Auf die unteren 20 % fällt p = 0,2^1,9 = 0,047 = 4,7 %. Und so weiter. Noch extremer ist der Unterschied etwa in Zimbabwe, wo a = 3 gilt. Auf die unteren 10 % fällt hier der Anteil p = 0,1^3 = 0,001 = 0,1 % des Gesamteinkommens. Auf die unteren 20 % fällt p = 0,2^3 = 0,008 = 0,8 %. Und so weiter.

Diese Werte geben schon einen guten Einblick in die Ungleichheit in einem Land, aber es wäre nützlich, die Ungleichheit in einer einzigen Zahl zu sammeln. Und diese Zahl dann auch leicht interpretierbar zu machen. Der Gini-Koeffizient schafft all das. Hier ein Graph aus dem Wiki-Eintrag für den Gini-Koeffizienten, den man für nicht-kommerzielle Zwecke verwenden darf:

Wie schon erwähnt ergibt sich für den Fall, dass jede Person im Land dasselbe Einkommen hat, eine Gleichheit von p und x, also p = x. Auf die unteren 10 % fällt 10 % des Gesamteinkommen, auf die unteren 20 % fällt 20 %, etc … Das ist die Gerade im Graphen. Die tatsächliche Verteilung ist durch die Lorentz-Kurve gegeben. Man sieht (durch grobes Ablesen), dass in diesem Beispiel auf die unteren 50 % etwa 20 % des gesamten Einkommens fällt. Es lassen sich hier zwei Flächen abgrenzen. Die Fläche A zwischen Gerade und Lorentz-Verteilung und die Fläche B unter der Lorentz-Verteilung. Die Gesamtfläche ist A+B.

Bei sehr geringer Ungleichheit wird die Lorentz-Verteilung nah an der Geraden liegen und die Fläche A wird klein im Verhältnis zur Gesamtfläche sein. Bei großer Ungleichheit gibt es hingegen viel Abstand zwischen der Geraden p = x und der tatsächlichen Verteilung des Einkommens p = x^a und entsprechend nimmt A einen höheren Anteil an der Gesamtfläche ein. Bei extremer Verteilung des Einkommens, alle Leute außer einer Person haben das Einkommen Null, würde A die gesamte Fläche einnehmen. Es bietet sich also an, die Ungleichheit durch das Verhältnis Fläche A zu Gesamtfläche A+B auszudrücken. Genau so ist der Gini-Koeffizient definiert:

G = Diskrepanzfläche/Gesamtfläche

G = A/(A+B)

Da die Anteile x und p zahlenmäßig jeweils im Bereich 0 bis 1 liegen müssen, ist die Gesamtfläche leicht zu berechnen. Es ist ein Dreieck mit Grundseite 1 und Höhe 1, also A+B = (1/2)*1*1 = 0,5. Für die Fläche A muss man von der Gesamtfläche die Fläche unter der Lorentz-Kurve abziehen:

A = 0,5 – [Integral 0 bis 1] x^a dx

Daraus folgt für den Gini-Koeffizient:

G = (a-1)/(a+1)

Und für den umgekehrten Weg, von Gini zu Lorentz:

a = (1+G)/(1-G)

Für Deutschland mit a = 1,9 erhält man also G = 0,9/2,9 = 0,31, für Zimbabwe mit a = 3 folgt G = 2/4 = 0,5. Die Regel lautet: Je kleiner der Gini-Koeffizient, desto kleiner die Ungleichheit im Land. Der internationale Vergleich zeigt, dass Werte unter 0,3 exzellent sind, Werte unter 0,35 ganz gut, Werte über 0,4 problematisch und Werte über 0,45 kritisch. Auch der Zeitverlauf ist nützlich. In Deutschland gab es schon vor der Pandemie einen Trend zu mehr Ungleichheit, die Pandemie hat das beschleunigt.

Zur besseren Interpretation eines Gini-Wertes empfehle ich die Berechnung des folgenden Verhältnisses. Zuerst berechnet man aus dem gegebenen Gini G den Lorentz-Exponent a, siehe vorherige Formel. Auf die unteren 10 % der Bevölkerung fällt p = 0,1^a des Gesamteinkommens, auf die oberen 10 % fällt der Anteil p = 1-0,9^a (also 100 % des Gesamteinkommens minus das, was auf die unteren 90 % fällt). Das Verhältnis der Anteile von Top 10 % zu Bottom 10 % ist somit:

r = (1-0,9^a)/0,1^a

In Deutschland mit G = 0,32 / a =1,9 fällt auf die Top 10 % der Bevölkerung r = 16 mal mehr am Gesamteinkommen als auf die Bottom 10 %. In Zimbabwe mit G = 0,5 / a = 3 fällt auf die Top 10 % der Bevölkerung sogar r = 271 mal mehr (kein Schreibfehler) als auf die Bottom 10 %. Man erkennt an diesem Verhältnis, wie enorm der Schritt von G = 0,32 zu G = 0,5 wirklich ist. Deshalb lohnt es sich auch, den Gini zur Interpretation in r umzurechnen.

Achtung: Hier tappt man leicht in eine Falle. Das Verhältnis r drückt aus, wie das Verhältnis der Anteile am Gesamteinkommen von Top 10 % zu Bottom 10 % liegt. Das ist nicht identisch zum Verhältnis der mittleren Einkommen von Top 10 % zu Bottom 10 %, also das, was man bekommt, wenn man das mittlere Einkommen in der Gruppe der Top 10 % Verdiener durch das mittlere Einkommen in den Bottom 10 % teilt. Es lässt sich zeigen, dass für das Verhältnis des mittleren Einkommens von Top 10 % zu Bottom 10 % in in guter Näherung gilt:

r’ = 19^(a-1)

In Deutschland gerundet r’ = 14 und in Zimbabwe r’ = 361. Die Herleitung davon führt schlussendlich zu einer weiteren wichtigen Formel, nämlich der Berechnung des Anteils der Bevölkerung, die unterhalb eines bestimmten Einkommens liegt. Die Lorentz-Formel sagt, dass auf die unteren x Prozent der Bevölkerung x^a Prozent des Gesamteinkommens I fällt. Das summierte Einkommen der unteren x Prozent der Bevölkerung ist also I*x^a. Die unteren x Prozent der Bevölkerung sind N*x Personen. Das Einkommen PRO PERSON in den unteren x Prozent ist demnach I*x^a / (N*x) = (I/N)*x^(a-1). Dabei ist I/N = i einfach das mittlere Einkommen über die gesamte Bevölkerung. Das mittlere Einkommen einer Person in den unteren x Prozent lässt sich damit wie folgt schreiben:

q = i*x^(a-1)

Um sinnvolle Vergleiche zwischen verschiedenen Gruppen der Bevölkerung machen zu können, muss man noch einen Schritt weiter gehen. Es soll das mittlere Einkommen einer Person berechnet werden, die zwischen den Perzentilen x bis x+h liegt, mit h einem kleinen Schritt. Die unteren x+h Prozent haben das summierte Einkommen I*(x+h)^a, die unteren x Prozent das summierte Einkommen I*x^a. Die Leute zwischen x und x+h verdienen insgesamt I*((x+h)^a-x^a). In diesem Bereich sind x+h-x = h Prozent aller Leute, also h*N Menschen. Das Einkommen pro Person jener zwischen x und x+h ist also:

m(h) = i*((x+h)^a-x^a)/h

Wer schon viel mit Differentialrechnung zu tun hatte, hat jetzt vielleicht ein Deja-Vu-Moment. Alles hinter dem i ist der Differenzquotient bei Ableitung von x^a. Mit Grenzwert h -> 0 kommt man zum Differentialquotient. Dieser drückt das mittlere Einkommen einer Person BEIM Perzentil x aus.

m = lim(h->0) m(h) = i*a*x^(a-1)

Das mittlere Einkommen einer Person beim Perzentil x = 0,95 im Verhältnis zum mittleren Einkommen einer Person beim Perzentil x = 0,05 ist:

r’ = (i*a*0,95^(a-1))/(i*a*0,05^(a-1)) = 19^(a-1)

Daher kommt die obige Näherung für das Verhältnis des mittleren Einkommens von Top 90 % zu Bottom 10 %. Es lässt sich aber auch mehr damit machen. Eine wichtige Frage ist, welcher Anteil der Bevölkerung unter einer gewissen Einkommensgrenze Ig fällt. Damit könnte man zum Beispiel aus dem Gini (mit Umweg über Lorentz) auch den Anteil der Bevölkerung in Armut berechnen, sofern die Einkommensgrenze für Armut bekannt ist. Das mittlere Einkommen Ig wird beim Perzentil Ig = i*a*xg^(a-1) erreicht. Daraus ergibt sich für den Anteil Leute unter der Einkommensgrenze Ig:

xg = (Ig/(i*a))^(1/(a-1))

Es fehlt jetzt noch ein wichtiger Punkt, nämlich: Wie bekommt man den Gini-Index praktisch aus gegebenen Daten?

In der Regel kennt man eine handvoll Datenpunkte im Stile: Die unteren x1 Prozent haben p1 Prozent des Gesamteinkommens, die unteren x2 haben p2, die unteren x3 haben p3, etc … Eine naheliegende Möglichkeit ist der Fit der Daten an die Kurve p = x^a, wobei sich jener Exponent a ergibt, der die Summe der quadratischen Abstände von Punkte zu Kurve minimiert. Steht nur die lineare Regression zur Verfügung, was in den vielen Statistik-Paketen der Fall ist, so kann man einfach die Daten mit y = ln(x) und q = ln(p) transformieren. Es ist dann: q = a*y. Der Exponent a ergibt sich in diesem Fall also aus der Steigung der q-y-Kurve. G folgt stets aus G = (a-1)/(a+1).

Ein schnellerer Ansatz ist, für jeden Datenpunkt den Exponenten zu berechnen und das geometrische Mittel der Exponenten für a zu verwenden. Aus jedem Paar xk und pk folgt ak = ln(pk)/ln(xk). Das Produkt aller ak ist (ln(p1)/ln(x1))*(ln(p1)/ln(x1))*… Bei insgesamt n Datenpunkte davon noch die n-te Wurzel bzw. das hoch 1/n für das geometrische Mittel:

a = ( (ln(p1)/ln(x1))*(ln(p1)/ln(x1))*… )^(1/n)

Ein Beispiel: In einer Bevölkerung haben die unteren x1 = 10 % den Anteil p1 = 0,8 % des gesamten Einkommens, x2 = 20 % den Anteil p2 = 3 % und x3 = 50 % den Anteil 16 %. Über das geometrische Mittel ergibt sich für den Lorentz-Exponenten:

a = ( ln(0,008)/ln(0,1)*ln(0,03)/ln(0,2)*ln(0,16)/ln(0,5) )^(1/3)

a = (2,1*2,2*2,6)^(1/3) = 2,3

Und für den entsprechenden Gini:

G = (a-1)/(a+1) = 1,3/3,3 = 0,39

Der Gini-Koeffizient macht messbar, was sonst nur schwer in Zahlen zu fassen ist, aber für das Funktionieren einer Gesellschaft sehr wichtig ist: Die Ungleichheit. G > 0,4 ist ein guter Indikator dafür, dass ein großer Teil des Geldes in den Taschen weniger verschwindet und beim Rest der Gesellschaft ein gefährlicher Mangel entsteht. Das ist typisch für Länder mit viel Korruption. G um 0,3 drückt hingegen eine gesunde Ungleichheit aus. Eine Ungleichheit, bei der es sich für das Individuum lohnt, mehr Einsatz zu zeigen um mehr Wohlstand zu erhalten, ohne dass die Gefahr besteht, dass Teile der Gesellschaft in Armut abrutschen. G < 0,2 (nirgends beobachtet, aber theoretisch möglich) würde die Motivation für mehr Einsatz jedoch zerstören. Es gäbe dann soviel Umverteilung, dass das Plus, welches man aus dem Einsatz erhält, den Einsatz nicht Wert wäre. Der Gini-Index kann somit als Aussage über die Umverteilung betrachtet werden. Bei G um 0,3 ist das richtige Maß erreicht, für höhere Werte sollte die Umverteilung angekurbelt, für geringere Werte gebremst werden.

Hier noch der Hinweis, dass der Gini, wenn auch gerne auf das Einkommen angewandt, Ungleichheit für jede beliebige Lorentz-verteilte Variable messen kann. Lorentz-verteilt sind zum Beispiel viele der Variablen, die der 80/20-Regel folgen. Etwa: 20 % der Kunden nehmen 80 % der Zeit des Servicepersonals ein. Die 80/20-Regel ist, bei Annahme von Lorentz-Verteilung, identisch mit der Aussage a = 7,2 bzw. G = 0,76 und es gilt alles, was aus den obigen Formel dafür folgt. Auch die Anwendung auf Bundesebene ist kein Muss. Der Gini kann seperat für Regionen und gar einzelne Firmen berechnet werden. Bei all dem sollte man beachten, dass die Faustregel “G um 0,3 ist ideal” dann keine Gültigkeit mehr hat. Diese Grenze ergibt sich aus Erfahrungswerten bei der Anwendung des Gini auf das Einkommen auf Ebene von Ländern. Andere Variablen und andere Entitäten bringen andere Erfahrungswerte.

Statistik, Umfragen & Sonstiges

Messung von Ungleichheit: Der Gini-Koeffizient

Leave a comment Cancel reply

Share this:

Related

Leave a comment Cancel reply