HWS23

Large scale dynamics of stochastic systems (Slowik)

This lecture (2 SWS, 5 ECTS) focusses on the dynamical behavior of large stochastic systems.

Stochastik 1

Jeder kennt Zufall aus dem eigenen Leben, zum Beispiel Münzwürfe oder das Bestehen einer Klausur nach “mit Lücke lernen”. In dieser Vorlesung werden wir mittels Maß- und Integrationstheorie mathematische Modelle für die Modellierung von Zufallsexperimenten konstruieren. Weil wir auch noch das Gesetz der Großen Zahlen und den zentralen Grenzwertsatz diskutierten, wird die Erfolgswahrscheinlichkeit des zweiten Beispiels leider ziemlich klein sein.

Reinforcement Learning 2 (Döring/Staudigl/Weißmann)

This lecture (5 ECTS) continues the lecture reinforcement learning from the previous semester. We fill gaps (such as Lai-Robbins lower bounds for bandits) that were left and discuss further topics (such as MCTS, ODE method for stochastic approximation,...).

Reinforcement Learning – Coding (Döring, Ferdinand)

This is a coding course in which algorithms from the reinforcement learning lecture from the previous semester will be coded in python. Algorithms cover bandit algorithms (briefly), Q-learning, other TD algorithms, policy gradient algorithms. The course is jointly with PORSCHE, we will try to improve some of their reinforcement learning projects using PPO.

Markovketten

Eine Robotorvorlesung im Bachelor: Wir bieten Diskussionsrunden und Prüfungen an, die Vorlesungsvideos gibt es auf YouTube. Wie wir diskutieren werden, überlegen wir uns gemeinsam mit den Studierenden in der ersten Woche.

Markov processes (Döring/Slowik)

Eine Robotorvorlesung im Master: Wir bieten Diskussionsrunden und Prüfungen an, die Vorlesungsvideos gibt es auf YouTube. Wie wir diskutieren werden, überlegen wir uns gemeinsam mit den Studierenden in der ersten Woche.

Seminar

Das Seminar bereitet Studierende (Bachelor und Master) auf ihre Abschlussarbeiten vor. Studierende bearbeiten Themen der klassischen Wahrscheinlichkeitstheorie oder des maschienellen Lernens.