Using deep learning techniques for semantic segmentation of images

thumbnail

Tutor/a - Director/a

Wielgosz, Maciej

Estudiante

Posada Moyano, Roger

Tipo de documento

Trabajo final de grado

Fecha

2021

rights

Acceso abiertoOpen Access

Editorial

Universitat Politècnica de Catalunya



Resumen

The recent growth of machine learning and deep learning applications in the industry these last years has encouraged me to carry out this project, in particular related to the Image Segmentation, whose methods can be applied to so many fields to automate and train different processes with a high rate of success. This thesis focuses on deep learning techniques applied to semantic segmentation of images and has the objective to clearly understand the performance of Neural Networks in different backgrounds,by training them how to learn from different images using a deep learning based approach. The proposed project is built around a VGG-16 convolutional neural network architecture model implemented, in order to detect the different parts and elements in an image by applying different layers, which will be used then to recognize and highlight the object in the final image. Finally, this work performs a comparative evaluation of the first pretrained network against the one which is going to be trained, throughseveral repetitions and tries with different changes in its structure. Experimental results indicate how the number of times an image has been seen while training varies between the different models, also known as epoch loss. These experimental results also demonstrate that segmentation methods can be very useful once trained the models.
El reciente crecimiento de las aplicaciones de machine learning y deep learningen la industria estos últimos años me ha animado a llevar a cabo este proyecto, en particular relacionado con la Segmentación de Imágenes, cuyos métodos se pueden aplicar a numerosos campos para automatizar y entrenar diferentes procesos con un alta tasa de éxito. Esta tesis se centra en las técnicas de aprendizaje profundo aplicadas a la segmentación semántica de imágenes y tiene el objetivo de comprender claramente el desempeño de las redes neuronales en diferentes entornos, capacitándolos en cómo aprender de diferentes imágenes utilizando un enfoque basado en el aprendizaje profundo. El proyecto propuesto se construye en torno a un modelo implementado de arquitectura de red neuronal convolucional VGG-16, con el fin de detectar las diferentes partes y elementos de una imagen mediante la aplicación de diferentes capas, que luego serán utilizadas para reconocer y resaltar el objeto en la imagen final. Finalmente, este trabajo realiza una evaluación comparativa de la primera red pre-entrenada con la que se va a entrenar, mediante varias repeticiones e intentos con diferentes cambios en su estructura Los resultados experimentales indican cómo varía el número de veces que se ha visto una imagen durante el entrenamiento entre los diferentes modelos, también conocido como epoch loss. Estos resultados experimentales también demuestran que los métodos de segmentación pueden ser muy útiles una vez entrenados los modelos
user

Profesorado participante

Archivos