Deep Reinforcement Learning

Das umfassende Praxis-Handbuch. Moderne Algorithmen für Chatbots, Robotik, diskrete Optimierung und Web-Automatisierung inkl. Multiagenten-Methoden

Maxim Lapan

Diese Publikation zitieren

Maxim Lapan, Deep Reinforcement Learning (2020), mitp-Verlag, Frechen, ISBN: 9783747500378

5123
Accesses
143
Quotes

Beschreibung / Abstract

Beschreibung

Maxim Lapan ist Deep-Learning-Enthusiast und unabhängiger Forscher. Er hat langjährige Berufserfahrung mit Big Data und Machine Learning und beschäftigt sich derzeit insbesondere mit praktischen Anwendungen des Deep Learnings wie NLP und Deep Reinforcement Learning.

Inhaltsverzeichnis

  • Cover
  • Titel
  • Impressum
  • Inhaltsverzeichnis
  • Über den Autor
  • Über die Korrektoren
  • Über den Fachkorrektor der deutschen Ausgabe
  • Einleitung
  • Teil I: Grundlagen des Reinforcement Learnings
  • Kapitel 1: Was ist Reinforcement Learning?
  • Kapitel 2: OpenAI Gym
  • Kapitel 3: Deep Learning mit PyTorch
  • Kapitel 4: Das Kreuzentropie-Verfahren
  • Teil II: Wertebasierte Verfahren
  • Kapitel 5: Tabular Learning und das Bellman†™sche Optimalitätsprinzip
  • Kapitel 6: Deep Q-Networks
  • Kapitel 7: Allgemeine RL-Bibliotheken
  • Kapitel 8: DQN-Erweiterungen
  • Kapitel 9: Beschleunigung von RL-Verfahren
  • Kapitel 10: Aktienhandel per Reinforcement Learning
  • Teil III: Policybasierte Verfahren
  • Kapitel 11: Eine Alternative: Policy Gradients
  • Kapitel 12: Das Actor-Critic-Verfahren
  • Kapitel 13: Asynchronous Advantage Actor Critic
  • Kapitel 14: Chatbot-Training per Reinforcement Learning
  • Kapitel 15: Die TextWorld-Umgebung
  • Kapitel 16: Navigation im Web
  • Teil IV: Fortgeschrittene Verfahren und Techniken
  • Kapitel 17: Stetige Aktionsräume
  • Kapitel 18: RL in der Robotik
  • Kapitel 19: Trust Regions – PPO, TRPO, ACKTR und SAC
  • Kapitel 20: Blackbox-Optimierung beim Reinforcement Learning
  • Kapitel 21: Fortgeschrittene Exploration
  • Kapitel 22: Jenseits modellfreier Verfahren – Imagination
  • Kapitel 23: AlphaGo Zero
  • Kapitel 24: RL und diskrete Optimierung
  • Kapitel 25: RL mit mehreren Agenten
  • Stichwortverzeichnis

Mehr von dieser Serie

    Ähnliche Titel

      Mehr von diesem Autor