Ab dem Wintersemester 2025/2026 steht das neue Videoportal allen Nutzer:innen zur Verfügung.
Testen Sie es vorab unter dem folgenden Link (UNI Netzwerk oder VPN).
Deep Learning - Reinforcement Learning Part 1
This video explains the concepts of sequential decision making and the multi-armed bandit problem.
For reminders to watch the new video follow on Twitter or LinkedIn.
Video References:
DeepMind Galaxian
Further Reading:
A gentle Introduction to Deep Learning