This lecture (8 ECTS) will lay the foundations of reinforcement learning. We will start gently with multiarmed bandits, then turn towards the theory of Markov decision processes which leads us to basic solution algorithms such as policy iteration, value iteration or (double) Q-learning. Finally, we will turn to policy gradient methods.
This lecture (6 ECTS) will cover optimization methods that typically appear in machine learning. Most importantly, we will discuss different (stochastic) versions of gradient descent methods and their applications in machine learning.
In der Veranstaltung beschäftigen wir mit den Grundlagen der Wahrscheinlichkeitstheorie. Wir schauen uns Begriffe der schwachen Konvergenz an, knüpfen an die Martingaltheorie der Finanzmathematik an und diskutieren den wichtigsten stochastischen Prozess: Die Brownsche Bewegung. Die Veranstaltung ist die Grundlage für die aufbauenden Vorlesungen SDEs, Advanced Math Finance, Markov Processes, ...
Eine Robotorvorlesung im Bachelor: Wir bieten Diskussionsrunden und Prüfungen an, die Vorlesungsvideos gibt es vom FS21. Wie wir diskutieren werden, überlegen wir uns gemeinsam mit den Studierenden in der ersten Woche.
Eine Robotorvorlesung im Master: Wir bieten Diskussionsrunden und Prüfungen an, die Vorlesungsvideos gibt es vom letzten Jahr. Wie wir diskutieren werden, überlegen wir uns gemeinsam mit den Studierenden in der ersten Woche.
Das Seminar bereitet Studierende (Bachelor-Master) auf ihre Abschlussarbeiten vor. Studierende bearbeiten Themen der klassischen Wahrscheinlichkeitstheorie oder des maschienellen Lernens.
In order to improve performance and enhance the user experience for the visitors to our website, we use cookies and store anonymous usage data. For more information please read our privacy policy.