Pronóstico de la demanda internacional del banano orgánico de Perú usando algoritmos de Machine Learning

Abstract
La tesis tiene como objetivo el diseño, entrenamiento, validación y evaluación de diversos modelos predictivos, usando algoritmos de Machine Learning para pronosticar la demanda del banano orgánico de Perú. Para el desarrollo de la investigación, se utiliza los registros oficiales del volumen de exportación (Kg.) de banano orgánico del Perú (Aduanet-Sunat). La investigación cuenta con datos recolectados del total de exportación de banano orgánico peruano recolectadas desde el 2001 al 2020, disponibles en el portal online de Aduanet-Sunat y abarca el diseño, entrenamiento, validación y evaluación de cuatro modelos predictivos, usando algoritmos de redes neuronales recurrentes, tales como: MLP1, RNN2, LSTM3 y GRU4. Se realizaron varios experimentos testeando diferentes arquitecturas de la red neuronal y optimizando sus hiper-parámetros. Posteriormente, se seleccionó el modelo con mejor performance, evaluando la precisión de los valores pronosticados y los valores de la serie temporal original. Como resultado, el modelo entrenado con el algoritmo RNN obtuvo los menores valores de error de predicción (MSE: 0.00147, RMSE: 0.03838, MAE: 0.02885, y MAPE: 2.88516), lo cual demostró ser el modelo predictivo más preciso para realizar el pronóstico de la demanda de banano orgánico de Perú. Se concluye que un total de 60 modelos predictivos, diferentes entre sí, fueron entrenados para pronosticar la exportación de banano orgánico de Perú. El modelado usando Redes Neuronales Recurrentes demostró un mejor proceso de entrenamiento, referente al aprendizaje de la dependencia temporal, la no-linealidad y la estacionalidad de la serie de tiempo, debido a los atributos de las celdas de memoria, las cuales retienen y actualizan información de datos secuenciales. Asimismo, los cuatro modelos entrenados (MLP, RNN, LSTM, y GRU) realizaron el pronóstico de la serie de tiempo con un ligero underfitting (hig bias). Sin embargo, las redes neuronales recurrentes (RNN, LSTM, y GRU) consiguieron mayor precisión en la estimación de la estacionalidad de la serie temporal. Asimismo, la elección del número de neuronas o unidades recurrentes por capa oculta de la red neuronal influyó en el aprendizaje y en la función de perdida (loss). Considerando todos los modelos entrenados, la mejor performance del modelado y el pronóstico de la serie de tiempo fue registrado usando una arquitectura estándar de red neuronal recurrente, con una capa oculta y con sesenta y cuatro unidades recurrentes en la capa oculta.
Description
Keywords
Aprendizaje automático (Inteligencia artificial) -- Aplicación, Banano orgánico -- Exportación -- Investigaciones, Redes neuronales (Computadores) -- Aplicación
Citation
Almeyda, E. (2022). Pronóstico de la demanda internacional del banano orgánico de Perú usando algoritmos de Machine Learning (Tesis doctoral en Ingeniería con mención en: Automatización, Control y Optimización de Procesos). Universidad de Piura. Facultad de Ingeniería. Piura, Perú.