Clusterización de los datos de confort ambiental disponibles en la plataforma Sirena
Tutor/a - Director/a
Estudiante
Pascual Ferré, Marc
Tipo de documento
Projecte Final de Màster Oficial
Fecha
2023
rights
Acceso restringido por decisión del autor
Editorial
Universitat Politècnica de Catalunya
UPCommons
Resumen
El projecte es basa en un estudi d'anàlisi del confort ambiental de quinze aules de l'ETSEIB. S'ha elaborat i tractat una base de dades corresponent a un any, del 15/02/2022 fins al 15/02/2023, de les variables que influeixen en el confort ambiental. Les dades s'han obtingut a través de les plataformes Sirena i XEMA. La tècnica d'anàlisi emprada és la clusterització, i s'ha desenvolupat utilitzant les llibreries de pandas i de scikit learn, que ofereix Python. A través d'aquestes llibreries, s'ha aplicat l'algoritme de clusterització de k-means, i s'han obtingut diferents agrupacions que mostren diferents comportaments de les variables estudiades en els espais escollits. Seguidament, s'han analitzat les característiques de cada grup per veure si compleixen els límits que estableixen la legislació present. Per desenvolupar l'estudi s'ha seguit la popular metodologia de treball de la mineria de dades, CRISP-DM, que ha servit de guia per afrontar els reptes del projecte i assegurar un bons resultats
El proyecto se basa en un estudio de análisis del confort ambiental de quince aulas de la ETSEIB. Se ha elaborado y tratado una base de datos correspondiente a un año, del 15/02/2022 al 15/02/2023, de las variables que influyen en el confort ambiental. Los datos se han obtenido a través de las plataformas Sirena y XEMA. La técnica de análisis utilizada es la clusterización, y se ha desarrollado utilizando las librerías de pandas y de scikit learn, que ofrece Python. A través de estas librerías, se ha aplicado el algoritmo de clusterización de k-means, obteniendo diferentes agrupaciones que muestran diferentes comportamientos de las variables estudiadas en los espacios escogidos. Seguidamente, se han analizado las características de cada grupo para ver si cumplen los límites que establecen la presente legislación. Para desarrollar el estudio se ha seguido la popular metodología de trabajo de la minería de datos, CRISP-DM, que ha servido de guía para afrontar los retos del proyecto y asegurar buenos resultados
The project is based on a study to analyse the environmental comfort of fifteen classrooms at the ETSEIB. It has been elaborated and treated a database for one year, from 15/02/2022 to 15/02/2023, of the variables that influence environmental comfort. The data were obtained through the Sirena and XEMA platforms. The analysis technique used is clustering, and it has been developed using the pandas and scikit learn libraries provided by Python. Through these libraries, the k-means algorithm of clustering has been applied, obtaining different clusters that show different behaviours from the variables studied in the areas chosen. The characteristics of each group have then been analysed to see if they comply with the limits established by this legislation. The study followed the popular data mining methodology, CRISP-DM, which has served as a guide to overcome the challenges of the project and ensure good results
Localización
