Jeder kennt Zufall aus dem eigenen Leben, zum Beispiel Münzwürfe oder das Bestehen einer Klausur nach “mit Lücke lernen”. In dieser Vorlesung werden wir mittels Maß- und Integrationstheorie mathematische Modelle für die Modellierung von Zufallsexperimenten konstruieren. Weil wir auch noch das Gesetz der Großen Zahlen und den zentralen Grenzwertsatz diskutierten, wird die Erfolgswahrscheinlichkeit des zweiten Beispiels leider ziemlich klein sein.
This lecture (5 ECTS) continues the lecture reinforcement learning from the previous semester. We fill gaps that were left and discuss further topics (such as PPO, deep Q-learning).
In diesem Seminar (Bachelor & Master) studieren wir verschiedene AI/ML Techniken, die mehr oder weniger viel mit Stochastik zu tun haben. Themen können zu stochastischen Banditen, verschiedenen Bereichen es Reinforcement Learnings, der stochastischen Optimierung, aber auch ganz anderer Art sein. Die Themen werden am ersten Termin (erster Montag des Semesters) besprochen und vergeben, das Seminar findet dann geblockt mit etwas Abstand zur Prüfungsphase statt.
In order to improve performance and enhance the user experience for the visitors to our website, we use cookies and store anonymous usage data. For more information please read our privacy policy.