Name: Verstärkungslernen
Price: 96.15 EUR
Availability: InStock
Author: Dr Satyanarayana S/Dr Thayyaba Khatoon MD/N V Madhu Bindu
ISBN: 9786206403128

Inicio > > Redes y comunicaciones informáticas > Verstärkungslernen

Editorial:: KS OmniScriptum Publishing
Año de edición:: 2023
Materia: Redes y comunicaciones informáticas
ISBN:: 9786206403128

96,15 €

IVA incluido

Disponible

Selecciona una librería:

Donde los libros
Librería 7artes
Librería Elías (Asturias)
Librería Kolima (Madrid)
Librería Proteo (Málaga)

Sobre IBD

Sinopsis

Dieses Buch ist in fünf Einheiten gegliedert und bietet eine ganzheitliche Lernerfahrung. Die Reise beginnt mit einer Einführung in Bandit-Algorithmen, wobei Kernkonzepte wie die Algorithmen Upper Confidence Bound (UCB) und Probably Approximately Correct (PAC) erforscht werden. Die nächste Einheit führt in den vollständigen Rahmen des Reinforcement Learning (RL) ein und geht dabei über Bandit-Algorithmen hinaus, um Interaktionen zwischen Akteur und Umgebung über mehrere Zeitschritte zu berücksichtigen. Markov-Entscheidungsprozesse (MDPs) werden als grundlegender Rahmen für die Modellierung sequenzieller Entscheidungsaufgaben eingeführt. Die vierte Einheit befasst sich mit Methoden der dynamischen Programmierung, temporalen Differenzen (TD) und der Bellman-Optimalitätsgleichung in RL. Diese Konzepte ermöglichen es Agenten, ihre Aktionen effektiv zu planen, zu lernen und zu optimieren. Die letzte Einheit beschäftigt sich mit fortgeschrittenen RL-Techniken wie Eligibility Traces, Funktionsannäherung, Methoden der kleinsten Quadrate, Fitted Q-learning, Deep Q-Network (DQN) und Policy Gradient Algorithmen.

Otros libros del autor

Apprendimento per rinforzo

Dr Satyanarayana S / Dr Thayyaba Khatoon MD / N V Madhu Bindu

Questo libro è strutturato in cinque unità, per offrire un’esperienza di apprendimento olistica. Il viaggio inizia con un’introduzione agli algoritmi bandit, esplorando concetti fondamentali come gli algoritmi Upper Confidence Bound (UCB) e Probably Approximately Correct (PAC). L’unità successiva introduce la struttura completa del Reinforcement Learning (RL), andando oltre gli...

Disponible

96,17 €
Aprendizagem por reforço

Dr Satyanarayana S / Dr Thayyaba Khatoon MD / N V Madhu Bindu

Este livro está estruturado em cinco unidades, oferecendo uma experiência de aprendizagem holística. A viagem começa com uma introdução aos algoritmos bandit, explorando conceitos fundamentais como os algoritmos Upper Confidence Bound (UCB) e Probably Approximately Correct (PAC). A unidade seguinte introduz a estrutura completa da Aprendizagem por Reforço (RL), indo além dos al...

Disponible

96,16 €

Verstärkungslernen

Selecciona una librería:

Artículos relacionados

Otros libros del autor