Spaniens vermeintlicher Jungenüberschuss: Ein statistisches Phantom
Über lange Zeit hinweg bot Spanien eines der rätselhaftesten demografischen Phänomene der westlichen Welt. Die offiziellen Geburtenstatistiken legten nahe, dass zwischen Mitte der 1970er-Jahre und dem Jahr 2000 überdurchschnittlich viele Jungen im Vergleich zu Mädchen geboren wurden. Zeitweise kletterte das Verhältnis auf 109 Jungen auf 100 Mädchen – der höchste gemeldete Wert unter den Industrienationen jener Zeit.
Ein aktuelles IZA-Forschungspapier von Manuel Bagues und Carmen Villa zeigt nun, dass dieses Ungleichgewicht keine demografische Realität widerspiegelte. Stattdessen deckt die Untersuchung auf, dass diese statistische Anomalie das Resultat systematischer Kodierungsfehler war, die während der Umstellung Spaniens auf computerisierte statistische Prozesse entstanden.
Ein demografisches Mysterium
In den meisten Populationen ist das Geschlechterverhältnis bei der Geburt biologisch bedingt erstaunlich stabil und liegt bei etwa 105 bis 106 Jungen pro 100 Mädchen. Die offiziellen spanischen Zahlen lagen fast ein Vierteljahrhundert lang weit über diesem Bereich, was zu zahlreichen Erklärungsversuchen führte.
Forscher schrieben die erhöhten Werte einst Faktoren wie dem Alter der Mutter, der Geburtenreihenfolge oder Umwelteinflüssen zu. In jüngerer Zeit spekulierten Studien sogar, dass die Verbreitung von Ultraschalltechnologie es Eltern ermöglicht habe, das Geschlecht vorab zu erfahren, was zu einer gezielten besseren pränatalen Betreuung von Jungen und damit zu einer höheren männlichen Überlebensrate geführt habe. Solche Interpretationen implizierten weitreichende geschlechtsspezifische Unterschiede bei der pränatalen Vorsorge – und potenziell zehntausende zusätzliche Todesfälle bei weiblichen Föten.
Der Fehler im System
Bagues und Villa belegen nun, dass diese Anomalie nicht auf demografisches Verhalten, sondern auf eine fehlerhafte Datenverarbeitung zurückzuführen ist.
Beim Abgleich von Geburtenregisterdaten mit Zensusdaten stellten sie fest, dass die Zensus-Kohorten völlig normale Geschlechterverhältnisse aufweisen. Die Diskrepanz beschränkt sich ausschließlich auf die Daten des Geburtenregisters zwischen 1975 und 2000. Zudem identifizierten die Autoren unplausible Schwankungen in den monatlichen Verhältnissen je Provinz, die weit über den statistischen Zufall hinausgehen und auf eine systematische Falschkodierung weiblicher Geburten als männlich hindeuten.
Ein weiteres Indiz: In Zeiträumen und Regionen mit den extremsten Werten fehlten ungewöhnlich häufig Angaben zum Geburtsgewicht, was auf breitere Probleme bei der Datenverarbeitung schließen lässt. Da die Anomalien zudem in den vorläufigen Statistiken weitgehend fehlen und erst in den finalisierten Mikrodaten auftauchen, steht fest: Die Fehler wurden erst in der letzten Phase der Datenaufbereitung eingeführt.
Lehren für Forschung und Statistik
Das Auftreten der Anomalie korreliert exakt mit Spaniens Übergang von der manuellen zur computergestützten Datenverarbeitung im Jahr 1975. Die Erkenntnisse bedeuten, dass frühere demografische Deutungen der spanischen Geburtenzahlen revidiert werden müssen. Zudem werfen sie ein kritisches Licht auf internationale Forschungsdatenbanken, da die fehlerhaften spanischen Werte ungeprüft in Statistiken internationaler Organisationen einflossen.
Die Studie unterstreicht, wie wichtig die Validierung administrativer Daten ist: Einfache Konsistenzprüfungen und Vergleiche mit unabhängigen Quellen hätten das Problem schon Jahre zuvor aufdecken können. Die Autoren fordern daher, dass Statistikbehörden bei unvermeidbaren Fehlern betroffene Zeiträume explizit kennzeichnen sollten, um künftige Fehlinterpretationen von vornherein zu verhindern.
Lesen Sie die englischsprachige Studie hier im Volltext.
Related news