Adaptación de un videojuego para su uso como entorno de entrenamiento de agentes con capacidades de coordinación

thumbnail

Student

Sancho-Tello Bayarri, Xavier

Document type

Bachelor thesis

Date

2023

rights

Open AccessOpen Access

Publisher

Universitat Politècnica de Catalunya



Abstract

En este proyecto se ha realizado una búsqueda en ocho entornos que se consideraron aptos para el entrenamiento de agentes que utilicen algoritmos de aprendizaje por refuerzo en misiones de coordinación y se han analizado las características de cada uno para entender qué funcionalidades podrían adaptarse a los objetivos establecidos. Se han definido criterios y métricas que han ayudado a seleccionar el entorno más adecuado para el proyecto, centrándose en la metodología Gym. Un objetivo marcado ha sido el estudio del entorno con tal de entender el funcionamiento del mismo y cómo utilizarlo en el proyecto.Por último, el objetivo final, ha sido implementar un agente de aprendizaje por refuerzo utilizando el algoritmo DQN capaz de realizar una misión sencilla. Una vez que hemos entrenado nuestro agente utilizando un DQN para completar una misión sencilla y utilizando las recompensas que nos devuelven las funciones ya implementadas por MineDojo, nuestro agente no ha sido capaz de completar la misión. Con esto podemos determinar por un lado que se necesitan muchos recursos a nivel de Hardware con tal de entrenar un agente que complete una tarea usando esta combinación de algoritmo y recompensas y que, debido a la naturaleza de este entorno, las misiones que en este se definen suelen ser de naturaleza dispersa o sparse reward, las cuales no sacan el máximo provecho del DQN.
user

Participating teacher

Files