Deep Reinforcement Learning

Das umfassende Praxis-Handbuch. Moderne Algorithmen für Chatbots, Robotik, diskrete Optimierung und Web-Automatisierung inkl. Multiagenten-Methoden

Maxim Lapan

Cite this publication as

Maxim Lapan, Deep Reinforcement Learning (2020), mitp-Verlag, Frechen, ISBN: 9783747500378

5094
accesses
143
quotes

Description / Abstract

Description

Maxim Lapan ist Deep-Learning-Enthusiast und unabhängiger Forscher. Er hat langjährige Berufserfahrung mit Big Data und Machine Learning und beschäftigt sich derzeit insbesondere mit praktischen Anwendungen des Deep Learnings wie NLP und Deep Reinforcement Learning.

Table of content

  • Cover
  • Titel
  • Impressum
  • Inhaltsverzeichnis
  • Über den Autor
  • Über die Korrektoren
  • Über den Fachkorrektor der deutschen Ausgabe
  • Einleitung
  • Teil I: Grundlagen des Reinforcement Learnings
  • Kapitel 1: Was ist Reinforcement Learning?
  • Kapitel 2: OpenAI Gym
  • Kapitel 3: Deep Learning mit PyTorch
  • Kapitel 4: Das Kreuzentropie-Verfahren
  • Teil II: Wertebasierte Verfahren
  • Kapitel 5: Tabular Learning und das Bellman†™sche Optimalitätsprinzip
  • Kapitel 6: Deep Q-Networks
  • Kapitel 7: Allgemeine RL-Bibliotheken
  • Kapitel 8: DQN-Erweiterungen
  • Kapitel 9: Beschleunigung von RL-Verfahren
  • Kapitel 10: Aktienhandel per Reinforcement Learning
  • Teil III: Policybasierte Verfahren
  • Kapitel 11: Eine Alternative: Policy Gradients
  • Kapitel 12: Das Actor-Critic-Verfahren
  • Kapitel 13: Asynchronous Advantage Actor Critic
  • Kapitel 14: Chatbot-Training per Reinforcement Learning
  • Kapitel 15: Die TextWorld-Umgebung
  • Kapitel 16: Navigation im Web
  • Teil IV: Fortgeschrittene Verfahren und Techniken
  • Kapitel 17: Stetige Aktionsräume
  • Kapitel 18: RL in der Robotik
  • Kapitel 19: Trust Regions – PPO, TRPO, ACKTR und SAC
  • Kapitel 20: Blackbox-Optimierung beim Reinforcement Learning
  • Kapitel 21: Fortgeschrittene Exploration
  • Kapitel 22: Jenseits modellfreier Verfahren – Imagination
  • Kapitel 23: AlphaGo Zero
  • Kapitel 24: RL und diskrete Optimierung
  • Kapitel 25: RL mit mehreren Agenten
  • Stichwortverzeichnis

More of this series

    Related titles

      More of this author(s)