Seminar: Mathematische Methoden der Künstlichen Intelligenz

  • Lehrteam

    Felix Benning, Prof. Dr. Leif Döring

  • Termin

    Blockseminar Ende November

    Anmeldung bitte per mail an Leif Döring.

    Vorbesprechung (virtuell): Erste Septemberwoche. Termin und zoom-link wird hier noch gepostet. 

  • Inhalt

    • Einführung in Multi-armed bandits, Exploration vs. Exploitation (Birdal Canel Cantekin)
    • Softmax Algorithmus für Multi-armed bandits (Elisa Rogers)
    • UCB Algorithmus für Multi-armed bandits (Lena Lincke)
    • Einführung MDP – policy iteration Verfahren (Arne Huckemann)
    • Einführung MDP – policy gradient Verfahren (Leif Döring)
    • Q-learning vs. Double-Q learning (Calvin Speiser)
    • Adversarial MDPs (Leo Vela)
    • (Almut Röder)
    • Trust Region Policy Optimization (Till Freihaut)
    • Natural Gradient Descent (Bene Wille)
  • Hinweise

    Einen kurzen Leitfaden zur Vorbereitung und erfolgreichen Durchführung eines Seminarvortrags finden ihr hier.