Auch wenn es die mathematischen Gleichungen und Algorithmen nicht immer vermuten lassen: Statistiker liefern wichtige Erkenntnisse für unsere Gesellschaft. (Foto: Henry Klingberg/pixelio.de)

Donald B. Rubin referiert auf einer Bamberger Statistik-Tagung (Fotos: 球探足球比分stelle)...

... zu der Susanne R?ssler geladen hatte.

Was machen eigentlich Statistiker?

Erkl?rungen mithilfe einer hochkar?tig besetzten Tagung und anhand eines fiktiven Beispiels

Conference on Applications of Missing-Data Procedures: Hinter diesem sperrigen Titel verbirgt sich eine Tagung, bei der einige der bedeutendsten Statistiker unserer Zeit referieren werden. Allen voran der meistzitierte Statistiker der Welt, Donald B. Rubin, seit 25 Jahren Professor an der renommierten Harvard University – und Ehrendoktor der Universit?t Bamberg. Rubin ist Ideengeber und Entwickler zahlreicher weltweit anerkannter Verfahren und Algorithmen zum Umgang mit und zur Erg?nzung von fehlenden Daten, dem übergeordneten Thema der Tagung. Rubin wird im Dezember 70 Jahre alt und ist nicht nur Ehrengast, sondern auch Anlass der Zusammenkunft, zu der seine akademische Tochter Prof. Dr. Susanne R?ssler, Inhaberin des Lehrstuhls für Statistik und ?konometrie an der Universit?t Bamberg, geladen hat. Susanne R?ssler ist Expertin für Umfragen und Stichprobenziehungen, Mitglied der Zensus-Kommission und eine von drei Tr?gern des deutschlandweit einzigen Masterstudiengangs zu diesem Forschungsfeld. Für ihre Tagung bekommt sie ma?gebliche Unterstützung von der Bamberger Graduate School of Social Sciences (BAGSS), die einen Gro?teil der anfallenden Kosten übernimmt und aus den Reihen ihrer Doktorandinnen und Doktoranden auch Tagungsteilnehmer stellt.

Neben Rubin kann die Organisatorin noch mit vielen weiteren ?Hochkar?tern“ aufwarten, doch jetzt erst einmal zu den Inhalten: R?ssler und ihre ?Familie“, wie sie ihre Referenten liebevoll nennt, treffen sich am 19. Juni zwischen 9 und 16 Uhr und am 20. Juni 10 und 17 Uhr, um sich über fünf Problemfelder innerhalb des statistischen Forschungsgebiets ?Umgang mit und Erg?nzung von fehlenden Daten“ auszutauschen: Messfehler, kausale Schlussfolgerungen, Anonymisierung von vertraulich zu behandelnden Daten, Umgang mit gro?en Mengen fehlender Daten sowie Datenfusion. Was zun?chst v?llig abstrakt und weltfremd klingt, ist die Basis für viele wichtige Erkenntnisse, die unser Leben direkt oder indirekt betreffen.

Beispiel: Schule

Was das praktisch bedeutet, zeigt folgendes fiktives Beispiel: Ein frischgebackener Schulleiter m?chte sich mit einigen Ph?nomenen an seiner neuen Schule vertraut machen. Zum Beispiel ist ihm aufgefallen, dass in einigen Klassen mit erh?htem Ausl?nderanteil die Leistungen in den Kernf?chern Mathematik, Deutsch und Englisch im Vergleich zu anderen homogener zusammengesetzten Klassen derselben Klassenstufe deutlich geringer ist. Zur Ursachenforschung m?chte er gerne eine Umfrage machen. Und schon kommen die Statistiker ins Spiel. Ihre Aufgabe ist die Konzeption, Durchführung und Auswertung solcher Umfragen, wobei Durchführung in diesem Fall weniger die Arbeit vor Ort, also unter anderem das Verteilen von Frageb?gen meint, als vielmehr die Methode, mit der sichergestellt wird, dass am Ende der Umfrage auch ein korrekter Datensatz zur Auswertung vorliegt. Gemeinsam mit unserem Schulleiter würden die Statistiker beispielsweise eine Umfrage für die Eltern konzipieren, in der sie Fragen zur Berufst?tigkeit, zu Bildung und Ausbildung, zur Nationalit?t und zu Familienzusammenh?ngen, sprich, zu grundlegenden Informationen zum Leben der Schüler stellen und bei auftretenden Problemen wie Folgendem methodisch eingreifen: Gerade bei Fragen, die das Privatleben und die Pers?nlichkeit betreffen, werden oft aus Gründen wie Scham oder Unsicherheit falsche Angaben gemacht. So wird aus einem Hauptschulabschluss ein Abitur oder aus einem 60-j?hrigen Vater ein 45-j?hriger. Je mehr fehlerhafte Angaben, desto verf?lschter der Datensatz.

Datenlücken schlie?en

Je verf?lschter der Datensatz, desto unzuverl?ssiger das Ergebnis der Umfrage. Statistiker erkennen solche unplausiblen Werte und stellen fest, ob es zuf?llige oder systematische Fehler sind. Auf diesem Wissen aufbauend k?nnen sie die durch die fehlerhaften Angaben entstandenen Datenlücken zu einem kompletten Datensatz erg?nzen, so dass die Umfrage m?glichst vollst?ndig und mit m?glichst korrekten Daten ausgewertet werden kann. Der Umgang mit solchen sogenannten ?Messfehlern“ bildet den ersten Teil der Tagung, zu dem unter anderem Prof. Dr. Roderick J.A. Little und Dr. Nathaniel Schenker, der Pr?sident der Amerikanischen Statistischen Gesellschaft sprechen werden. Roderick J. A. Little  ist  ein Freund und Partner Rubins, der gemeinsam mit ihm DAS Standardwerk zum Umgang mit fehlenden Daten geschrieben hat.

Schlussfolgerungen ziehen

Das zweite Thema der Tagung, ?kausale Schlussfolgerungen“, wozu unter anderem Susanne R?ssler referiert, k?nnte bei unserem Beispiel folgenderma?en aussehen: Neben den Leistungsunterschieden bei bestimmten Klassen interessiert sich der Schulleiter au?erdem für die Effizienz bestimmter Lernmethoden, speziell in Bezug auf Gruppenarbeit und Frontalunterricht. Die Statistiker raten ihm zu einem Experiment, in dem er zwei homogene Gruppen bildet, bei denen bis auf das zu untersuchende Element alle Voraussetzungen und Eigenschaften gleich sind (Klassenstufe, Aufgabenstellung, Lernziel etc.). Bei einer anschlie?enden Klausur, die beide Gruppen parallel schrieben, wurde das Lernziel kontrolliert und die Gruppe ?Gruppenarbeit“ erzielte eindeutig bessere Ergebnisse. Aus diesem Experiment kausale Schlussfolgerungen zu ziehen, also nachweisbar festzulegen, dass das Ergebnis kein Zufall war, ist hier die n?chste Aufgabe der Statistiker. Denn aus einem starken Zusammenhang folgt nicht automatisch, dass es auch eine eindeutige Ursache-Wirkungs-Beziehung gibt. Oder auf unser Beispiel bezogen: Die Tatsache, dass Schüler bei der Gruppenarbeit mehr miteinander kommuniziert haben als die Schüler beim Frontalunterricht, hei?t noch nicht automatisch, dass eine solche Kommunikation Gruppenarbeit effizienter macht.

Daten anonymisieren

Kommen wir von der Gruppenarbeit zurück zur Umfrage über die Leistungen in den Kernf?chern und zu den Angaben, die Pers?nlichkeit und Privatleben betreffen – und damit zu einem weiteren Problemfeld: Ein Kollege ist sehr interessiert an der Umfrage und bittet den Schulleiter, ihm die Rohdaten, also die ausgefüllten Umfrageb?gen für eigene Nachforschungen zur Verfügung zu stellen. Einige Angaben, die in der Umfrage abgefragt wurden, sind allerdings vertraulich und nicht zur Weitergabe bestimmt. Würde der Schulleiter allerdings nur die Daten weitergeben, für die er eine ausdrückliche Erlaubnis hat, w?re der Datensatz unvollst?ndig und sein Kollege h?tte keine M?glichkeit, mit ihm verl?ssliche Auswertungen vorzunehmen. Aber auch hierfür hat die Statistik eine L?sung, wie zum Beispiel Dr. J?rg Drechsler, ehemaliger Doktorand Susanne R?sslers und jetziger Mitarbeiter am Institut für Arbeitsmarkt und Berufsforschung, zu berichten wei?. Er hat 2009 in seiner Doktorarbeit einen teilsynthetischen Datensatz erzeugt, also nicht die Daten selbst, sondern deren Struktur gespiegelt, womit er eine Anonymisierung der Daten erreicht hat und damit eine Weitergabe von vertraulichen Daten erm?glicht. Deutschlandweit ein Novum, denn bis dato kannte man solche Verfahren nur von Donald B. Rubin ausgehend in den USA. Die neuesten Entwicklungen im Bereich der Datenanonymisierung sind das dritte Thema der Statistik Tagung, zu  dem auch J?rg Drechsler sprechen wird.

Daten erg?nzen

Beim vierten Thema geht es um den Umgang mit gro?en Mengen fehlender Daten. Für den Schulleiter wird das zum Beispiel dann relevant, wenn er Synergieeffekte zwischen einzelnen F?chern feststellen, also beispielsweise sehen m?chte, ob es zwischen einem musikalischen und einem mathematischen Verst?ndnis Beziehungen gibt und man über die Vermittlung bestimmter Lerninhalte in Musik ein gr??eres Verst?ndnis bestimmter Lerninhalte in Mathematik erreichen k?nnte. Die L?sung ist auch hier ein Experiment, allerdings gibt es dabei folgendes Problem, das es statistisch zu l?sen gilt: Um diese Fragestellung beantworten zu k?nnen, müsste es jeweils eine Schülergruppe geben, die nur Musik- bzw. nur Matheunterricht bekommt, damit sie nur für sich betrachtet werden kann. Andererseits müssen aber beide Gruppen auch zueinander in Beziehung gesetzt werden, was eigentlich voraussetzen würde, das beide Gruppen auch beide F?cher unterrichtet bekommen. Voraussetzung eins schlie?t aber Voraussetzung zwei aus, so dass bei beiden Gruppen gro?e Mengen an Daten fehlen, n?mlich der Mathematikteil bei den Musikschülern und der Musikteil bei den Mathematikschülern. ?ber  Problemstellungen dieser Art referiert auf der Tagung unter anderem Dr. Florian Meinfelder, wissenschaftlicher Mitarbeiter am Lehrstuhl für Statistik und ?konometrie an der Universit?t Bamberg. Ihm gelang es bereits mehrfach, stabile Algorithmen zu entwickeln, mit denen man solche gro?en Mengen an fehlenden Daten erg?nzen kann.

Datens?tze zusammenführen

Das fünfte Tagungsthema h?ngt eng mit dem vierten zusammen, oder um beim Beispiel zu bleiben: Der Schulleiter stellt fest, dass die üblichen ein oder maximal zwei Schulstunden am Stück zu wenig sind, um die Musik- und Mathematikgruppen aussagekr?ftig zu testen. Damit wird er gezwungen, das Experiment in verschiedenen Bl?cken mit mehreren Musik- und Mathematikgruppen durchzuführen. So entstehen viele Datens?tze, die alle unterschiedliche Quellen haben. Spezialist für die Zusammenführung solcher Datens?tze ist unter anderem Dr. Christian A?mann, operativer Leiter und Koordinator der Methodengruppe im Nationalen Bildungspanel, der dort  entsprechende Verfahren bereits implementiert hat. Er setzt mit seinem Vortrag den inhaltlichen Schlusspunkt der Tagung, bevor Donald B. Rubin die vorgestellten Ergebnisse und Problemstellungen bewerten und diskutieren wird.

Doch ein wenig Lust auf Statistik bekommen? Die Tagungsreferenten stehen gerne für Interviews und Gespr?che rund um die obengenannten Problemstellungen zur Verfügung und geben Auskunft über statistische Fragestellungen in Gesellschaft, Wissenschaft, Wirtschaft oder Politik. Geeignete Ansprechpartner zu Ihren individuellen Themen vermittelt Ihnen  
Prof. Dr. Susanne R?ssler
Lehrstuhl für Statistik und ?konometrie an der Universit?t Bamberg
Tel. 0951/863 2530 bzw. -2531 (Sekretariat)
E-Mail: susanne.raessler@uni-bamberg.de

Hinweis

Diesen 球探足球比分text verfasste für die 球探足球比分stelle der Universit?t Bamberg
Tanja Eisenach
Tel. 0951/863-1023
E-Mail: medien@uni-bamberg.de