This lecture (10 ECTS) will lay the foundations of reinforcement learning. We will start gently with multiarmed bandits, then turn towards the theory of Markov decision processes which leads us to basic solution algorithms such as policy iteration, value iteration or (double) Q-learning. Finally, we will turn to policy gradient methods.
In der Veranstaltung beschäftigen wir mit den Grundlagen der Wahrscheinlichkeitstheorie. Wir schauen uns Begriffe der schwachen Konvergenz an, knüpfen an die Martingaltheorie der Finanzmathematik an und diskutieren den wichtigsten stochastischen Prozess: Die Brownsche Bewegung. Die Veranstaltung ist die Grundlage für die aufbauenden Vorlesungen Advanced Math Finance, Stochastic Calculus, Markov Processes, ...
Das Seminar bereitet Studierende (Bachelor-Master) auf ihre Abschlussarbeiten vor. Studierende bearbeiten Themen der Wahrscheinlichkeitstheorie oder des maschienellen Lernens, im Kontext der künstlichen Intelligenz. Das Seminar findet geblockt an 1–2 Terminen mit etwas Abstand zur Klausurenphase statt.
In order to improve performance and enhance the user experience for the visitors to our website, we use cookies and store anonymous usage data. For more information please read our privacy policy.