Confluence

Allgemeine Informationen


Der Kurs findet als semesterbegleitende Veranstaltung im Sommersemester statt.

Das Modul wird mit 5 LP kreditiert.

Die Veranstaltung gehört zur Spezialisierung DataScienceMATSE.

Weitere Informationen finden Sie unter https://data.bialonski.de/veds/.

Unterrichtsdauer


4 SWS (V2, P2)

Voraussetzungen


Beherrschung einer Programmiersprache, Lineare Algebra 2, Analysis 2

Inhalte


Data Science beschäftigt sich mit der Extraktion von Erkenntnissen und Wissen aus Daten mithilfe wissenschaftlicher Methoden und Algorithmen. Data Science findet als interdisziplinäres Gebiet zwischen Mathematik und Informatik in vielen Bereichen Anwendung (beispielsweise in der Wirtschaft, im Gesundheitswesen, in den Naturwissenschaften) und spielt eine elementare Rolle bei daten-gestützten Entscheidungen in Organisationen und Unternehmen.

Das Modul vermittelt Grundlagen über die zentralen Schritte von Data Science Projekten, beginnend bei der Datengewinnung und -aufbereitung, explorativen Analyse und Merkmalsgenerierung, bis hin zur prädiktiven Modellierung zur Erstellung von Vorhersagen. Besonderer Wert wird auf die Vermittlung einer hypothesengetriebenen Arbeitsweise und auf das Arbeiten mit realen Datensätzen gelegt. Bei der explorativen Analyse werden univariate sowie multivariate deskriptive Verfahren, Visualisierungstechniken und Methoden zur Dimensionsreduktion, Clusterbildung sowie -validierung behandelt. Konzepte der prädiktiven Modellierung und ihre Evaluation werden anhand schwellwert-basierter Methoden und ausgewählter Machine Learning Ansätze diskutiert. Das Praktikum wird mit facheinschlägigen Mitteln (Python, Pandas, Jupyter) durchgeführt.

Veranstaltungsunterlagen


Folgt

Prüfung


Schriftliche Klausur über mindestens 75 Minuten oder mündliche Prüfung über mindestens 20 Minuten. Das Ergebnis dieser Prüfung bestimmt die Benotung.

Literatur


  1. Peng R. D., Matsui E. (2016). The Art of Data Science.
  2. Skiena S. (2017). The Data Science Design Manual.
  3. Bishop C. M. (2006). Pattern recognition and machine learning.
  4. James G., Witten D., Hastie T., Tibshirani R. (2021). Introduction to statistical learning.
  5. Vanderplas J. (2023). Python Data Science Handbook: Essential tools for working with data.
  6. McKinney W. (2022). Python for Data Analysis: Data Wrangling with Pandas, Numpy, and Jupyter.

Derzeit gibt es keine Anhänge auf dieser Seite.

Datei anfügen


Die Datei wurde erfolgreich hochgeladen.

Die Datei wurde erfolgreich gelöscht.

Die Datei wurde erfolgreich versteckt.

Die Verknüpfung wurde erfolgreich gespeichert.

Die Verknüpfung wurde erfolgreich zurückgesetzt.