EESYS-ADAML-M: Applied Data Analytics and Machine Learning in R
Modulverantwortlicher: Prof. Dr. Thorsten Staake
Inhalte:
 Der Kurs vermittelt theoretische Grundlagen und praktische Fertigkeiten in den Bereichen Data
 Analytics und maschinelles Lernen. Zudem erfolgt eine Einführung in die Statistik-Software GNU R.
 Dabei helfen konkrete Beispiele und reale Datens?tzen aus den Themenfeldern Energie, Umwelt und
 Konsumentenverhalten, um die Kursteilnehmerinnen und Kursteilnehmer auf die Herausforderungen in
 der Praxis und in der angewandten Forschung vorzubereiten.
 Nach einer Zusammenfassung ausgew?hlter Statistik-Grundlagen umfasst der Kurs
 ? eine Einführung in die Statistik-Software GNU R,
 ? den Entwurf von Feldexperimenten und die Erhebung von Verhaltensdaten mit
 Informationssystemen,
 ? Verfahren der linearen und logistischen Regressionen,
 ? Verfahren der Cluster-Analyse,
 ? Techniken aus dem Bereich des Maschinellen Lernens einschlie?lich KNN, Regressionen und
 Support-Vektor-Maschinen und
 ? Aspekte der Ethik und des Datenschutzes bei fortgeschrittenen Datenerhebungs- und
 analyseverfahren.
Lernziele/Kompetenzen:
 Nach erfolgreichem Abschluss des Kurses k?nnen die Teilnehmerinnen und Teilnehmer
 ? neue Praxis- und Forschungsfragen, die sich mit empirischen Methoden ergründen lassen, in
 Experimente übersetzen,
 ? entsprechende Experimente planen und durchführen,
 ? aus den in der Veranstaltung vorgestellten Methoden geeignete ausw?hlen, um erhobene Daten
 korrekt zu analysieren,
 ? ihre Methodenwahl begründen und die Analyseschritte erkl?ren,
 ? Analysen in R korrekt und effizient umsetzen,
 ? die Methoden, sofern erforderlich, für spezifische Probleme theoretisch fundiert anpassen,
 ? die Ergebnisse eigener Analysen und Analysen Dritter interpretieren und deren Vorteile und Grenzen
 benennen und
 ? Aspekte des Datenschutzes und der Ethik, die bei der Anwendung leistungsstarker Erhebungs- und
 Analyseverfahren zu beachten sind, benennen und kritisch reflektieren.
  
Organisatorisches:
- 6 ECTS / 180 h
 - Zulassungsvoraussetzung für die Belegung des Moduls: keine
 - Empfohlene Vorkenntnisse:  Grundlegende Statistik-Kenntnisse (z.B. aus dem Bachelor-Studium).
Eine Wiederholung der Statistik-Grundlagen ist Teil des zur Verfügung gestellten Online-Materials sowie der ersten ?bungen und sollte, wenn erforderlich, durch ein Selbststudium erg?nzt werden.
Grundlegende Kenntnisse einer Programmiersprache. - Angebotsh?ufigkeit: WS, j?hrlich
 - Lehrformen: Vorlesung und ?bung - 4,00 SWS
 - Sprache: Englisch
 - Schriftliche Prüfung (Klausur) / Prüfungsdauer: 90 Minuten