In recent years, Transformers have experienced rapid progress in Natural Language Processing

We spend most of our time communicating in natural language, that is, in unstructured text, whether written or spoken. For this reason, research work has been going on for many years to ensure that machines understand these unstructured texts and extract relevant information from them. …

Acceso abierto al apartado de Clausura ( y apéndice) del libro Introducción al aprendizaje por refuerzo profundo

Hemos llegado al final del libro y espero que les haya resultado interesante nuestro recorrido por los temas básicos del aprendizaje por refuerzo y que estos conocimientos los empoderen para poder continuar avanzando en este campo tan apasionante. …

Acceso abierto al capítulo 11 del libro Introducción al aprendizaje por refuerzo profundo

En anteriores capítulos hemos implementado diversos algoritmos básicos de aprendizaje por refuerzo y hemos podido comprobar que su programación puede resultar bastante laboriosa. Pero, además, los actuales algoritmos de aprendizaje por refuerzo, más avanzados, aún són más complejos de programar. Por este motivo han aparecido librerías de aprendizaje por refuerzo…

Acceso abierto al capítulo 10 del libro Introducción al aprendizaje por refuerzo profundo

En este capítulo presentaremos una familia de algoritmos, llamados policy-based, que nos permiten aproximar directamente una función de política en lugar de una función de valor. Es decir, en lugar de entrenar una red neuronal para que genere los valores de las acciones o estados, entrenaremos una red neuronal para…

Acceso abierto al capítulo 9 del libro Introducción al aprendizaje por refuerzo profundo

En la primera parte del libro hemos visto que el algoritmo Q-Learning se puede usar para un entorno simple implementando la función Q como una tabla o matriz de valores (la llamada Q-table). Pero esta aproximación resulta inviable cuando hay millones de estados diferentes y cientos de acciones distintas. Para…

Acceso abierto al capítulo 8 del libro Introducción al aprendizaje por refuerzo profundo

En este capítulo presentaremos los conocimientos básicos de la librería PyTorch[1], necesarios para poder programar en Python las redes neuronales requeridas en los siguientes capítulos dedicados al aprendizaje por refuerzo profundo. PyTorch, junto con TensorFlow, es una de las librerías open source que actualmente lideran la programación de aplicaciones de…

Acceso abierto al capítulo 7 del libro Introducción al aprendizaje por refuerzo profundo

Aunque el aprendizaje profundo, o Deep Learning en inglés, es una materia de estudio de gran envergadura, el contenido de este capítulo tiene como objetivo presentar solo un conjunto de conceptos básicos para poder comprender la componente «profunda» del aprendizaje por refuerzo profundo que se presenta en este libro.

Este…

Acceso abierto al capítulo 6 del libro Introducción al aprendizaje por refuerzo profundo

En el anterior capítulo hemos aprendido cómo un agente puede seguir una política para interactuar con el entorno durante muchos episodios y, luego, usar los resultados de esta interacción para estimar la función de valor de los pares estado-acción, es decir, la función Q. …

Acceso abierto al capítulo 5 del libro Introducción al aprendizaje por refuerzo profundo

Otro de los métodos clásicos de aprendizaje por refuerzo es el método Monte Carlo, que permite una solución aproximada al aprendizaje basada en el muestreo estadístico a partir de la experiencia. A diferencia de la programación dinámica, este método se puede aplicar a entornos cuya dinámica no conocemos.

En este…

Jordi TORRES.AI

Professor at UPC Barcelona Tech & Barcelona Supercomputing Center. Research focuses on Supercomputing & Artificial Intelligence https://torres.ai @JordiTorresAI

Get the Medium app

A button that says 'Download on the App Store', and if clicked it will lead you to the iOS App store
A button that says 'Get it on, Google Play', and if clicked it will lead you to the Google Play store