Seminar: Mathematische Methoden der Künstlichen Intelligenz
Lehrteam
Felix Benning, Prof. Dr. Leif Döring
Inhalt
16.11.2022, ab 8:30 in der Mathe Lounge (B6, B3.01)
- Einführung in Multi-armed bandits, Exploration vs. Exploitation (Birdal Canel Cantekin)
- Softmax Algorithmus für Multi-armed bandits (Elisa Rogers)
- UCB Algorithmus für Multi-armed bandits (Lena Lincke)
- Thompson-Sampling (Nils Bargtel)
- Einführung MDP – policy iteration Verfahren (Arne Huckemann)
- Einführung MDP – policy gradient Verfahren (Leif Döring)
23.11.2022, ab 8:30 in der Mathe Lounge (B6, B3.01)
- Q-learning vs. Double-Q learning (Calvin Speiser)
- Adversarial MDPs (Leo Vela)
- (Almut Röder)
- Trust Region Policy Optimization (Till Freihaut)
- Natural Gradient Descent (Bene Wille)
Hinweise
Einen kurzen Leitfaden zur Vorbereitung und erfolgreichen Durchführung eines Seminarvortrags finden ihr hier.