Projekte
Am Lehrstuhl für Statistik und ?konometrie sind aktuell verschiedene Forschungsprojekte verankert. Die Seite liefert einen ?berblick zu aktuellen und abgeschlossenen Projekten.
Aktuelle Forschungsprojekte
NeDaMo
Für den Bundesverkehrswege- und Mobilit?tsplan braucht es kleinr?umig differenzierte, aktuelle und belastbare Daten. Klassische Verkehrserhebungen und amtliche Statistiken sto?en dabei an ihre Grenzen. Digitale Datenquellen wie anonymisierte Mobilfunkdaten bieten hier neue, vielversprechende M?glichkeiten. Erste Studien zeigen jedoch deutliche Einschr?nkungen: Die Kundenstruktur der Netzbetreiber unterscheidet sich systematisch, und Marktanteile variieren je nach Bev?lkerungsgruppe. Eine direkte Nutzung für Mobilit?tssch?tzungen ist daher bislang nur eingeschr?nkt m?glich. Als Anschlussprojekt des Projekts VerBindungen, ist das Ziel des Projekts NeDaMo, diese Mobilfunkdaten methodisch aufzubereiten und mit klassischen amtlichen Quellen zu verknüpfen, um sie für verkehrs- und mobilit?tsplanerische Zwecke nutzbar zu machen. Neue statistische Verfahren sollen dazu beitragen, Verzerrungen durch ungleiche Netzabdeckung oder soziodemografische Unterschiede zu korrigieren. Gleichzeitig soll eine freiwillige erg?nzende Erhebung durchgeführt werden, um Qualit?tslücken zu schlie?en. Am Ende sollen qualitativ hochwertige Datens?tze entstehen, die valide Aussagen zu Start- und Zielorten von Bürger:innen erm?glichen – und damit datenbasierte Mobilit?tsprognosen erlauben. Diese Mobilit?tsprognosen sollen dann in den Bundesverkehrswege- und Mobilit?tsplan integriert werden.
Fragen sind dabei:
| Partner: Statistisches Bundesamt, Bergische Universit?t Wuppertal, Universit?t Trier, Deutsche Telekom GmbH, Teralytics GmbH, Statistisches Landesamt IT.NRW, Bundesagentur für Arbeit Koordination: Prof. Dr. Markus Zwick (Statistisches Bundesamt) Teilprojektleitung: Prof. Dr. Timo Schmid Projektmitarbeiter/-innen: Dr. Florian Meinfelder, Johanna Einhorn F?rderer: mFUND-Initiative des Bundesministeriums für Digitales und Staatsmodernisierung Projektlaufzeit: 04/2025 – 03/2028 |
Bamberg Survey of Language Variation and Change (BSLVC)
Dieses Projekt untersucht die Verwendung lexikalischer und grammatischer Strukturen in den weltweiten Variet?ten des Englischen. Ein interdisziplin?rer Ansatz erm?glicht es, die Daten der umfangreichen BSLVC-Datenbank statistisch auszuwerten und damit (supra-)regionale Muster sowie Globalisierungstrends zu identifizieren. Ein zentrales Ziel ist die Entwicklung neuer statistischer Methoden zur Analyse hierarchisch strukturierter, ordinaler Daten, die in Fragebogenerhebungen generiert werden. Die Ergebnisse sollen der linguistischen Fachgemeinschaft durch eine interaktive Plattform und didaktisierte Ressourcen zug?nglich gemacht werden.
Ausgangslage und Problemstellung Die empirische Arbeit im Bereich der weltweiten Englisch-Variet?ten stützt sich haupts?chlich auf Korpora. Diese Methode hat jedoch Nachteile, da vergleichbare Korpora oft fehlen, soziodemografische Informationen lückenhaft sind und seltene oder schwer nachweisbare Merkmale in Textdaten nicht ausreichend erfasst werden k?nnen. Das BSLVC-Projekt nutzt Frageb?gen, um diese Lücken zu schlie?en. Allerdings stellen die daraus resultierenden Daten, die im Likert-Format vorliegen und hierarchisch strukturiert sind, die statistische Analyse vor Herausforderungen. In der Linguistik ist die Auseinandersetzung mit der korrekten Analyse von ordinalen Daten noch in den Anf?ngen, und es mangelt an geeigneten, zug?nglichen Werkzeugen für die statistische Modellierung von komplexen, hochdimensionalen Daten.
Ziele des Projekts Das interdisziplin?re Projekt zwischen Linguistik und Statistik verfolgt drei Hauptziele:
Ausgew?hlte Literatur: S?nning, Lukas, Manfred Krug, Fabian Vetter, Timo Schmid, Anne Leucht, and Paul Messer. (2024): Latent-Variable Modelling of Ordinal Outcomes in Language Data Analysis. Journal of Quantitative Linguistics 31 (2): pp.77–106.
| Koordination: Projektmitarbeiter/-innen: Michael Mühlbauer, Florian Scholze
|
Internet-Surveys für kleinr?umige Auswertungen
Das Projekt soll an einem realistischen Datensatz überprüfen, inwieweit ein Bias durch eine Online-Umfrage über die Kontrolle von demographischen Merkmalen reduziert werden kann. Ein solcher Datensatz muss drei Merkmalsgruppen unterhalten: Analysevariablen, deren Populationswerte man sch?tzen will, sowie Internetvariablen, die das Teilnahmeverhalten operationalisieren, und schlie?lich Kontrollvariablen, für die Populationswerte bekannt sind und die zur Kalibration eingesetzt werden k?nnen. Da Online-Umfragen h?ufig zur Prognose von Wahlen eingesetzt werden, sollte der Evaluationsdatensatz Merkmale zur Parteipr?ferenz enthalten. Au?erdem sollte er die H?ufigkeit der Internet-Nutzung erfassen. Diese H?ufigkeit kann zur Operationalisierung der Teilnahme an Online-Umfragen genutzt werden. Die Daten des European Social Survey (ESS) erfüllen diese Voraussetzung. Zudem ist der Datenzugang leicht und wird über eine Fernabfrage von Tabellen hervorragend unterstützt. Eventuell k?nnen auch noch andere Datens?tze, z.B. das Sozio-?konomische Panel (SOEP) für erg?nzende Analysen genutzt werden. Eine spezielle Erhebung des Statistischen Bundesamtes, die Umfrage zu Informations- und Kommunikationstechnologie (IKT-Umfrage), erhebt sehr detailliert die Ausstattung von privaten Haushalten mit Informationstechnologie und deren Nutzung. Aufgrund der regelm??igen Wiederholungen der Umfrage lassen sich Trends in der Nutzung und der Internet-Abdeckung von privaten Haushalten ermitteln.
Ausgew?hlte Literatur: Prücklmair F. and Rendtel U. (2025): Alternative Selection Mechanisms in Online Surveys. Working Paper | Partner: Koordination: Projektmitarbeiter/-innen: F?rderer: Projektlaufzeit: |
Extreme Poverty – Building Evidence for Effective Action
The programme will investigate what is driving extreme poverty, and test potential poverty measures and solutions to support the design and implementation of effective policies, programmes and strategies. The programme will work in eight focus countries: Bangladesh, Ethiopia, India, Madagascar, Mozambique, Myanmar, Nigeria and Tanzania. Research under the programme is organised into three themes: 1. Identifying and testing better poverty measures for a changing world. 2. Investigating poverty trends and drivers to 2030 including those that may serve to perpetuate or reduce extreme poverty over the next ten years. 3. Explaining what works to tackle extreme poverty through a range of types of research, including a series of impact and operational evaluations. By 2030, we seek for governments and key decision makers in multiple contexts to have better access to data, diagnostics and resources that will inform and influence policy and practice, hereby accelerating the eradication of extreme poverty. We aim to have a broad influence through drawing-on, engaging with and developing the networks of the consortium partners, FCDO and World Bank to support uptake of our research beyond the ExPov focus countries. From a methodological perspective we will experiment with using a range of statistical and analytical techniques and new sources of data to yield measures of poverty that are more granular (available at smaller geographical areas); more frequent and also less dependent on having access to traditional sources of data, particularly census data; so providing new approaches to overcome the ‘data gap problem’. | Partner: Koordination: Teilprojektmitarbeit: F?rderer: Projektlaufzeit: |
Abgeschlossene Forschungsprojekte
VerBindungen
Zu Fu?, mit dem Fahrrad, mit Bus, Bahn oder dem Auto – jeden Tag legen die Menschen in Deutschland mehr als drei Milliarden Kilometer zurück. Wie k?nnen wir die Infrastruktur so gestalten, dass es m?glich ist, unsere Wege sicher, schnell und ressourcenschonend zurückzulegen? Ein Schlüssel dafür ist, das Mobilit?tsverhalten m?glichst gut zu verstehen. Neben den amtlichen Datenquellen und klassischen Verkehrserhebungen, dr?ngt sich die Nutzung von Floating Car Data (FCD) und Mobilfunkdaten auf, denn nach zuverl?ssiger Anonymisierung lassen sich typische Mobilit?ts-strukturen kleinr?umig herleiten. Das Forschungsprojekt ?VerBindung“ will dieses Themenfeld beleuchten und Chancen sowie M?glichkeiten dieser neuen digitalen Daten aufzeigen. Ausgangslage für das Projekt ist der kleinr?umige Datenbedarf des Bundesministeriums für Verkehr und digitale Infrastruktur (BMVI) im Rahmen des Bundesverkehrswegeplans. Vier Fragestellungen stehen dabei im Vordergrund: 1. Wie viele Personen m?chten bzw. bewegen sich von wo nach wo – also welche Quelle-Ziel-Verflechtungen gibt es? 2. Zu welchem Zweck m?chten bzw. bewegen sich die Personen von wo nach wo? 3. Wie ist die Erreichbarkeit für diese Quelle-Ziel-Verflechtungen im Vergleich PKW und ?PNV? 4. Wo halten sich wann wie viele Personen auf? | Partner: Koordination: Teilprojektleitung: Projektmitarbeiter/-innen: F?rderer: Projektlaufzeit: |
Zeitstabile Sch?tzverfahren für die Household Finance and Consumption Survey
Im Mittelpunkt dieses Projekts steht die Entwicklung geeigneter Methoden für die Sch?tzung von Indikatoren basierend auf Daten verschiedener Panelwellen des Household Finance and Consumption Survey (HFCS), wenn multiple imputiert wurde und der Stichprobenumfang klein ist. Das Projekt ist die Fortsetzung des Projekts QUESSAMI (2016-2018). Die HFCS-Daten beschreiben u.a. Verm?genskomponenten, Einkommen und Konsum der europ?ischen Haushalte. Besonders das Verhalten von Subgruppen, so genannter ?Small Domains“, kann für das Verstehen makro?konomischer Theorien von gro?er Bedeutung sein Eine Herausforderung liegt darin, verl?ssliche Sch?tzer auf Domainebene zu erhalten, wie etwa tief regional gegliederte Ebenen. Die folgenden zwei Probleme (Querschnitt) wurden bereits innerhalb des Projekts QUESSAMI gel?st:
Ein drittes Problem ist die Zeitdimension (L?ngsschnitt) einer Panelbefragung:
Der HFCS Datensatz ist eine Panelbefragung in der fehlende Werte und kleine Stichprobenumf?nge in der Analyse beachtet werden müssen. Zeitliche Inkonsistenzen in der Analyse erscheinen nicht nur bei Indikatoren wie dem Mittelwert, der sensibel gegenüber Ausrei?ern ist, sondern auch bei robusteren Indikatoren wie dem Anteilswert. Daher ist die Erweiterung der Methode, die in dem Projekt QUESSAMI entwickelt wurde, für Panelbefragungen (L?ngsschnitt) und weitere Indikatoren essenziell, um genaue Ergebnisse über die Zeit zu erhalten, und dadurch strukturelle Ver?nderungen von ?konomischen Variablen wie dem Privatverm?gen beobachten zu k?nnen. Nach heutigem Stand gibt es zu diesem Thema noch keine relevanten Resultate, so dass dieses Projekt diese Lücke wie folgt schlie?en m?chte:
Die Ergebnisse dieses Projekts bieten der Politik valide Daten als Entscheidungsgrundlage für verschiedenste Fragestellungen, wie etwa die Auswirkungen von politischen Entscheidungen auf die regionale Verteilung von Verm?gen.
Ausgew?hlte Literatur:
| Koordination: Projektmitarbeiter/-innen: F?rderer: Projektlaufzeit: |
Ermittlung der Verteilung studentischen Wohnens in Berlin
Im Rahmen des Projektes ?Ermittlung der Verteilung studentischen Wohnens in Berlin“ soll untersucht werden, wie sich die Studierenden der Berliner Hochschulen auf die lebensweltlich orientierten R?ume verteilen. Sind die genauen Wohnstandorte der Studierenden bekannt, lassen sich wichtige Fragen nach dem ben?tigten Wohnraum und der nachgefragten Infrastruktur beantworten, sowie Projekte zugunsten Studierender zielgerichteter umsetzen. Als Datenquellen dienen unter anderem der Zensus 2011, die Belegung der Studentenwohnheime, wie auch die Anzahl der Studierenden nach Wohnort auf der Ebene der Postleitzahlbezirke für gro?e Berliner Universit?ten/ Hochschulen (u.a. Freie Universit?t, Humboldt Universit?t, Technische Universit?t) für die Jahre 2005, 2010 und 2015 im Vergleich. Weitere Informationen finden Sie hier und hier.
Ausgew?hlte Literatur:
| Koordination: F?rderer: Projektlaufzeit: |
Pr?zise Sch?tzverfahren für die Household Finance and Consumption Survey
Im Mittelpunkt dieses Projektes steht die Entwicklung geeigneter Methoden für qualitativ hochwertigeSch?tzer auf der Basis der Household Finance and Consumption Survey (HFCS). Hierfür werden multiple Imputationsmethoden mit Small-Area-Sch?tzern kombiniert, um neue Sch?tzmethoden herzuleiten. Die Erhebung des HFCS-Netzwerkes ist der erste Versuch, Verm?gensdaten auf Haushaltsebene für einige europ?ische L?nder zu erhalten. Die HFCS-Daten beschreiben unter anderem verschiedene Verm?genskomponenten sowie die Verteilung von Verbindlichkeiten und vorhandenem Kapital (Geldverm?gen) unter den europ?ischen Haushalten. Die Statistiken dieser Daten k?nnen beispielsweise herangezogen werden, um potenzielle Einflüsse der Fiskal-, Geld- und Regulierungspolitik zu analysieren. Darüber hinaus kann das Verhalten von Subgruppen, so genannter ?Small Domains“, für das Verstehen makro?konomischer Theorien von gro?er Bedeutung sein. Die Herausforderung liegt hierbei darin, hochwertige Sch?tzer auf Domainebene zu erhalten, wie etwa für Altersgruppen kreuzklassifiziert mit den teilnehmenden europ?ischen Staaten. Dieser Herausforderung liegen zwei Probleme zugrunde:
Eine M?glichkeit zur L?sung des ersten Problems sind Small-Area-Methoden, welche zu einer gr??eren Genauigkeit in den Sch?tzungen der interessierenden Parameter führen. Im zweiten Fall besteht ein dringender Bedarf fehlende Werte zu erg?nzen, um verl?ssliche Sch?tzungen zu erhalten. Dies kann mit verschiedenen Imputationsmethoden realisiert werden. Die Kombination von multipler Imputation und Small-Area-Sch?tzung ist essenziell, um genaue Ergebnisse für Haushaltssubgruppen auf Basis der HFCS-Daten zu erhalten, da wir hier sowohl mit dem Problem der kleinen Stichprobenumf?nge, als auch dem der niedrigen Antwortrate konfrontiert sind. Nach heutigem Stand gibt es zu diesem Thema noch keine relevanten Resultate, so dass dieses Projekt diese Lücke wie folgt schlie?en m?chte:
Die Ergebnisse dieses Projektes bieten der Politik valide Daten als Entscheidungsgrundlage für verschiedenste Fragestellungen, wie etwa von Kreditzugang und -beschr?nkungen oder von Verm?genseffekten auf den Konsum.
Ausgew?hlte Literatur:
| Koordination: Projektmitarbeiter/-innen: F?rderer: Projektlaufzeit: |
Construction of socio-demographic indicators with digital breadcrumbs (Mobile data)
In diesem Projekt wurde ein statistisches Sch?tzverfahren entwickelt, welches Handy-Metadaten und Zensusinformationen miteinander verknüpft, um Informationen über die aktuelle Situation in Bezug auf Armut, Alphabetisierung und andere soziodemografische Indikatoren im Senegal zu erhalten. Die Analyse basiert auf der These, dass sich die Situation einer Bev?lkerungsgruppe in ihrem Handy-Nutzungsverhalten niederschl?gt und deshalb beispielsweise alphabetisierte Nutzer ihr Handy anders verwenden als Nutzer, die nicht oder nur bedingt lesen und schreiben k?nnen. Da Handy-Metadaten zur Produktion von Indikatoren genutzt werden, wie sie u.a. in der Messung des Erfolgs von Nachhaltigkeitszielen herangezogen werden, wird in Kooperation mit den Mobilfunkanbietern Orange und Sonatel sowie den Beh?rden im Senegal untersucht, wie diese Daten die Umsetzung von nationalen Entwicklungspl?nen und internationalen Monitoring-Anforderungen unterstützen k?nnen. Weitere Informationen finden Sie ?hier“.
Ausgew?hlte Literatur:
| Partner: Koordination: Projektmitarbeiter/-innen: F?rderer: Projektlaufzeit: |
Innovations in Small Area Estimation Methodologies
Dieses Projekt setzt sich mit Innovationen von Methoden der ?Small Area Estimation (SAE)“ auseinander, da diese zunehmend genutzt werden und zuverl?ssige Statistiken ?u?erst wichtig für politikrelevante Forschungen sind. SAE Methoden generieren robuste, verl?ssliche und konsistente Statistiken bei geografischen Ma?st?ben, für welche Survey Daten entweder nicht existieren oder zu dürftig sind, um Sch?tzer von zul?ssiger Pr?zision zu erhalten. Der Bedarf an komplexen Statistiken steigt, bringt allerdings auch signifikante methodische und angewandte Herausforderungen mit sich. Das Projekt zielt darauf ab, neue SAE Methoden zu entwickeln, welche die Bedürfnisse der Nutzer und Entwickler der SAE besser bedienen, verschiedene methodische Ans?tze zur SAE zu überbrücken, SAE für die Beantwortung von stichhaltigen Fragen der Sozialwissenschaften einzusetzen und SAE innerhalb der quantitativen Sozialwissenschaften durch die Erschaffung von methodisch umfassenden und zug?nglichen Ressourcen zu etablieren. Weitere Informationen finden Sie ?hier“.
Ausgew?hlte Literatur:
| Partner: Koordination: Teilprojektleitung: F?rderer: Projektlaufzeit: |
Producing small area estimates of income related indicators for municipalities in Mexico
In diesem Projekt werden für das statistische Amt in Mexiko ?small area estimates“ von linearen und nicht-linearen Armutsindikatoren (Gini, Armutsgef?hrungsquote oder Quintile Share Ratio) für Gemeinden in Mexiko entwickelt, um Informationen über soziodemografische Merkmale zu erhalten. Die Sch?tzer für die Indikatoren werden erzeugt, indem man zwei modellgestützte Methoden heranzieht: Zum einen den ?Empirical Best Prediction“ Ansatz und zum anderen eine Methode, die auf der Sch?tzung der gesamten Verteilung des Einkommens basiert (?Microsimulation via Quantiles“). Eine synthetische Sch?tzung unter einem multinomialen Modell wird für die Bestimmung der multidimensionalen Armut verwendet, welche sich durch die zwei Dimensionen ?Einkommen“ und ?soziale Benachteiligung“ definiert. Die in diesem Projekt entwickelten Sch?tzer werden dem statistischen Amt Mexiko (CONEVAL) zur Verfügung gestellt.
Ausgew?hlte Literatur:
| Partner: Koordination: Teilprojektleitung: F?rderer: Projektlaufzeit: |
Multidimensional poverty estimation using small area estimation - Two perspectives
Mehr und mehr setzt sich in der Internationalen Entwicklungszusammenarbeit die Erkenntnis durch, dass sich ?Armut“ durch ein monet?res Armutsma? wie etwa das Pro-Kopf-Einkommen nur unzureichend beschreiben l?sst. Andere Dimensionen wie z.B. Gesundheit, Bildung, Ern?hrung etc. spielen eine mindestens ebenso wichtige Rolle und sind nur bedingt mit den monet?ren Armutsma?en korreliert. In diesem Projekt werden statistische Methoden der Small Area Estimation (SAE) entwickelt, um mehrdimensionale Armut auf regionaler Ebene effizient zu sch?tzen. Dabei werden parametrische und semi-parametrische Sch?tzverfahren zur Modellierung der kategorialen abh?ngigen Variablen verwendet.
Ausgew?hlte Literatur:
| Partner: Koordination: F?rderer: Projektlaufzeit: |
Deep Mobility
Informierte politische Entscheidungen basieren auf allen Verwaltungsebenen zu einem wesentlichen Teil auf Bev?lkerungsdaten der amtlichen Statistik. Deren Erhebung ist teuer und zeitaufw?ndig und erfolgt daher selbst in entwickelten Industriestaaten nur alle zehn Jahre in Form einer Volksz?hlung bzw. durch stichprobenartige Erhebungen. Damit fehlen in den Industriel?ndern repr?sentative Datens?tze für weite Gegenden oder einzelne Kommunen. In den L?ndern des globalen Südens ist die Datenlage z. B. infolge fehlender finanzieller Mittel oder Bürgerkriegen oftmals veraltet, unvollst?ndig oder mit zu gro?en Informationslücken behaftet. Deep Mobility l?st dieses Problem durch die Auswertung von Mobilfunkmetadaten als Hilfsdaten für die amtliche Statistik. Seit 2014 forscht das Gründerteam zu dem Thema und hat einen neuartigen Ansatz entwickelt, um aus Kommunikations- und Mobilit?tsmustern sozio-demografische Schlüsselindikatoren wie z. B. zu Armut oder Alphabetisierungsgrad für kleine geografische Gebiete zu bestimmen. Hierbei wird eine Sch?tzmethode aus der r?umlichen Statistik angewandt, um mit Hilfe von Mobilfunkmetadaten einen h?heren Grad an Regionalisierung vorhandener Befragungsdaten zu erreichen. Eine weitere Besonderheit des Verfahrens besteht in einem rigorosen Datenschutzansatz in Form einer modularen Engine. Dadurch k?nnen insbesondere Stichprobenumfragen pr?zisiert und regionalisiert werden. | Koordination: Projektmitarbeiter/-innen: F?rderer: Projektlaufzeit: |