Escuela de Posgrado MAESTRÍA EN CIENCIA DE DATOS Tesis Análisis y predicción del consumo de energía eléctrica en edificios de departamentos multifamiliares en Perú mediante técnicas de ciencia de datos Jose Antonio Lucas Cornelio Para optar el Grado Académico de Maestro en Ciencia de Datos Huancayo, 2025 Esta obra está bajo una Licencia "Creative Commons Atribución 4.0 Internacional" . Tesis digital ANEXO 6 INFORME DE CONFORMIDAD DE ORIGINALIDAD DEL TRABAJO DE INVESTIGACIÓN A : Mg. Jaime Sobrados Tapia Director Académico de la Escuela de Posgrado DE : Kevin Rafael Palomino Pacheco Asesor del Trabajo de Investigación ASUNTO : Remito resultado de evaluación de originalidad de Trabajo de Investigación FECHA : 24 de febrero del 2025 Con sumo agrado me dirijo a vuestro despacho para saludarlo y en vista de haber sido designado Asesor del Trabajo de Investigación/Tesis/Artículo Científico titulado “Análisis y predicción del consumo de energía eléctrica en edificios de departamentos multifamiliares en perú mediante técnicas de ciencia de datos”, perteneciente a Bach. Jose Antonio Lucas Cornelio, de la Maestría en Ciencia de Datos; se procedió con el análisis del documento mediante la herramienta “Turnitin” y se realizó la verificación completa de las coincidencias resaltadas por el software, cuyo resultado es 11% de similitud (informe adjunto) sin encontrarse hallazgos relacionados con plagio. Se utilizaron los siguientes filtros: SÍ x NO SÍ x NO ● Filtro de exclusión de bibliografía ● Filtro de exclusión de grupos de palabras menores (Máximo nº de palabras excluidas: < 40) ● Exclusión de fuente por trabajo anterior del mismo estudiante SÍ x NO En consecuencia, se determina que el trabajo de investigación constituye un documento original al presentar similitud de otros autores (citas) por debajo del porcentaje establecido por la Universidad. Recae toda responsabilidad del contenido de la tesis sobre el autor y asesor, en concordancia a los principios de legalidad, presunción de veracidad y simplicidad, expresados en el Reglamento del Registro Nacional de Trabajos de Investigación para optar grados académicos y títulos profesionales – RENATI y en la Directiva 003-2016- R/UC. Esperando la atención a la presente, me despido sin otro particular y sea propicia la ocasión para renovar las muestras de mi especial consideración. Atentamente, _________________________________ Kevin Rafael Palomino Pacheco DNI: 1045711819 DECLARACIÓN JURADA DE AUTENTICIDAD Yo, LUCAS CORNELIO JOSE ANTONIO, identificado con Documento Nacional de Identidad N° 20079540, egresado de la MAESTRÍA EN CIENCIA DE DATOS, de la Escuela de Posgrado de la Universidad Continental, declaro bajo juramento lo siguiente: 1. La Tesis titulada “ANÁLISIS Y PREDICCIÓN DEL CONSUMO DE ENERGÍA ELÉCTRICA EN EDIFICIOS DE DEPARTAMENTOS MULTIFAMILIARES EN PERÚ MEDIANTE TÉCNICAS DE CIENCIA DE DATOS”, es de mi autoría, el mismo que presento para optar el Grado Académico de MAESTRO EN CIENCIA DE DATOS. 2. La Tesis no ha sido plagiada ni total ni parcialmente, para lo cual se han respetado las normas internacionales de citas y referencias para las fuentes consultadas, por lo que no atenta contra derechos de terceros. 3. La Tesis es original e inédita, y no ha sido realizado, desarrollado o publicado, parcial ni totalmente, por terceras personas naturales o jurídicas. No incurre en autoplagio; es decir, no fue publicado ni presentado de manera previa para conseguir algún grado académico o título profesional. 4. Los datos presentados en los resultados son reales, pues no son falsos, duplicados, ni copiados, por consiguiente, constituyen un aporte significativo para la realidad estudiada. De identificarse fraude, falsificación de datos, plagio, información sin cita de autores, uso ilegal de información ajena, asumo las consecuencias y sanciones que de mi acción se deriven, sometiéndome a las acciones legales pertinentes. Huancayo, 11 de Abril de 2025 ________________________________________ DNI. N° 20079540 LUCAS CORNELIO JOSE ANTONIO 11% INDICE DE SIMILITUD 11% FUENTES DE INTERNET 3% PUBLICACIONES 6% TRABAJOS DEL ESTUDIANTE 1 3% 2 2% 3 2% 4 1% 5 1% 6 1% 7 1% “ANÁLISIS Y PREDICCIÓN DEL CONSUMO DE ENERGÍA ELÉCTRICA EN EDIFICIOS DE DEPARTAMENTOS MULTIFAMILIARES EN PERÚ MEDIANTE TÉCNICAS DE CIENCIA DE DATOS” INFORME DE ORIGINALIDAD FUENTES PRIMARIAS dev.cienciadedatos.net Fuente de Internet Submitted to Universidad Continental Trabajo del estudiante repositorio.unap.edu.pe Fuente de Internet hdl.handle.net Fuente de Internet Submitted to Universidad Anahuac México Sur Trabajo del estudiante repositorio.continental.edu.pe Fuente de Internet Submitted to Universidad Ricardo Palma Trabajo del estudiante 8 1% Excluir citas Apagado Excluir bibliografía Activo Excluir coincidencias < 40 words revistaenergia.pe Fuente de Internet ii Asesor Dr. Kevin Rafael Palomino Pacheco iii Agradecimiento Agradezco a cada uno de los docentes de la maestría por proporcionarnos sus experiencias personales y conocimientos técnicos para poder desarrollarnos como científicos de datos. Agradezco también a mi familia por la paciencia y apoyo para poder lograr este nuevo desafío profesional. iv Índice Asesor ..................................................................................................................... ii Agradecimiento ...................................................................................................... iii Índice ...................................................................................................................... iv Índice de Tablas ..................................................................................................... vi Índice de Figuras ................................................................................................... vii Resumen .............................................................................................................. viii Abstract .................................................................................................................. ix Introducción ............................................................................................................ x Capítulo I: Planteamiento del Estudio .................................................................. 11 1.1. Planteamiento y formulación del problema ............................................ 11 1.1.1. Planteamiento del problema ........................................................... 11 1.1.2. Formulación del problema .............................................................. 15 1.2. Determinación de objetivos .................................................................... 16 1.2.1. Objetivo general .............................................................................. 16 1.2.2. Objetivos específicos ...................................................................... 16 1.3. Justificación e importancia del estudio ................................................... 16 1.3.1. Justificación teórica ......................................................................... 17 1.4. Limitaciones de la presente investigación .............................................. 18 Capítulo II: Marco teórico ..................................................................................... 19 2.1. Antecedentes de la investigación ........................................................... 19 2.1.1. Internacionales ................................................................................ 19 2.1.2. Nacionales ...................................................................................... 21 2.2. Bases teóricas ....................................................................................... 23 2.2.1. Desarrollo histórico ......................................................................... 23 2.2.2. Fundamentación teórica ................................................................. 24 2.2.3. Marco conceptual ............................................................................ 25 2.3. Definición de términos básicos .............................................................. 26 Capítulo III: Hipótesis y variables ......................................................................... 28 3.1. Hipótesis ................................................................................................ 28 3.1.1. Hipótesis General ........................................................................... 28 3.1.2. Hipótesis específicas ...................................................................... 28 3.2. Operacionalización de variables / Categorización.................................. 29 v 3.2.1. Variable 1 ........................................................................................ 29 3.2.2. Variable 2 ........................................................................................ 29 3.2.3. Variable 3 ........................................................................................ 29 3.2.4. Variable 4 ........................................................................................ 29 3.3. Matriz de operacionalización de variables ............................................. 29 Capítulo IV: Metodología del estudio .................................................................... 30 4.1. Enfoque, tipo y alcance de investigación ............................................... 30 4.1.1. Enfoque .......................................................................................... 30 4.1.2. Tipo y alcance ................................................................................. 30 4.2. Diseño de la investigación ..................................................................... 31 4.3. Población y muestra ............................................................................... 31 4.3.1. Población ........................................................................................ 31 4.3.2. Muestra ........................................................................................... 31 4.4. Técnicas e instrumentos de recolección de datos ................................. 31 4.4.1. Técnicas e instrumentos ................................................................. 31 4.4.2. Validez y confiabilidad. ................................................................... 32 4.4.3. Procedimiento de recolección de datos .......................................... 32 Capítulo V: Resultados ......................................................................................... 35 5.1. Análisis de Resultados ............................................................................... 35 5.1.1. Analizar datos históricos de consumo eléctrico: ............................. 35 5.1.2. Modelos para la predicción del consumo de energía ...................... 42 5.1.3. Modelo de Optimización de Demanda en Franjas Horarias ............... 46 Conjunto ........................................................................................................ 46 Variables de Decisión.................................................................................... 46 Parámetros .................................................................................................... 46 Función Objetivo ........................................................................................... 47 5.2. Discusión de Resultados ........................................................................ 49 5.3. Conclusión General ................................................................................ 51 Referencias .......................................................................................................... 57 vi Índice de Tablas Tabla 1 Consumo de Electricidad e Impacto en Presupuesto Familiar en Perú………… 13 Tabla 2 Matriz de operacionalización de variables ………………………………………… 29 Tabla 3: Conjuntos de datos ………………………………………………………………… 36 Tabla 4: Franjas horarias ……………………………………………………………………. 36 Tabla 5: Pliego Tarifas domésticas Enero 2025 .…………………………………………. 47 Tabla 6: Valorización tarifa BT5BR (monohoraria) …………………………………………. 48 Tabla 7: Valorización tarifa BT5IR (Rangos Horarios) ……………………………………… 48 vii Índice de Figuras Figura 1: Metodología del trabajo de investigación ………………………………….. 34 Figura 2: Diagrama de agrupación de datos horarios ………………………………….. 36 Figura 3: Gráfico de serie temporal completa …………………………………………… 37 Figura 4: Gráfico de consumo anual (Zoom Mensual) …………………………………. 38 Figura 5: Gráficos de estacionalidad ……………………………………………………. 39 Figura 6: Demanda por día y franja horaria …………………………………………… 40 Figura 7: Gráfico de autocorrelación …………………………………………………….. 40 Figura 8: Gráfico de autocorrelación parcial …………………………………………… 41 Figura 9: Valores de predicción vs. valores reales modelo Forecasting ………………. 42 Figura 10: RNN ……………………………………………………………………….. 43 Figura 11: Valores de predicción vs. valores reales modelo LSTM simple …………….. 44 Figura 12: Proceso de aprendizaje del modelo LSTM simple error vs época ……… 44 Figura 13: Valores de predicción vs. valores reales modelo LSTM apilado ……………. 45 Figura 14: Proceso de aprendizaje del modelo LSTM anidado error vs época ………… 45 viii Resumen Este estudio práctico tiene como objetivo utilizar las técnicas de ciencia de datos para implementar un modelo para analizar y predecir el consumo de energía eléctrica en edificios multifamiliares en Perú, teniendo como base el registro de consumos realizado por los medidores inteligentes. El estudio se centra en la identificación de patrones de consumo, la predicción de la demanda de energía eléctrica y la optimización del uso de energía eléctrica en franjas horarias específicas. La muestra de la población de estudio tiene un set de datos con históricos de consumo registrados cada 15 minutos desde enero de 2023 hasta diciembre de 2024. La metodología empleada es de enfoque cuantitativo, con un diseño no experimental y longitudinal. Se utilizaron técnicas de análisis de series temporales y modelos de machine learning, como LSTM (Long Short-Term Memory), para predecir la demanda de energía. Los resultados mostraron una estacionalidad mensual, semanal y diaria en el consumo de energía, con picos en meses determinados y durante los días laborables. El modelo LSTM demostró ser el más efectivo, con un error absoluto medio (MAE) inferior. Adicionalmente, se implementó un modelo de optimización que permitió reducir los costos de energía eléctrica, al distribuir teóricamente el consumo a horarios de menor costo. Las conclusiones indican que el uso de técnicas de ciencia de datos demuestra que es posible una mejora significa en la eficiencia del consumo de energía eléctrica y es posible reducir los costos para los residentes, contribuyendo a la sostenibilidad ambiental. Palabras clave: Consumo de energía eléctrica, Predicción de demanda, Optimización de consumo, Series temporales, Machine learning ix Abstract This practical study aims to use data science techniques to implement a model to analyze and predict electricity consumption in multi-family buildings in Peru, based on the consumption record made by smart meters. The study focuses on identifying consumption patterns, predicting electricity demand and optimising electricity use in specific time slots. The sample of the study population has a dataset with consumption histories recorded every 15 minutes from January 2023 to December 2024. The methodology used is quantitative, with a non-experimental and longitudinal design. Time series analysis techniques and machine learning models, such as LSTM (Long Short-Term Memory), were used to predict energy demand. The results showed a monthly, weekly and daily seasonality in energy consumption, with peaks in certain months and during working days. The LSTM model proved to be the most effective, with a lower mean absolute error (MAE). In addition, an optimization model was implemented that made it possible to reduce electricity costs, by theoretically distributing consumption at lower cost times. The conclusions indicate that the use of data science techniques demonstrate that it is possible to significantly improve the efficiency of electricity consumption and it is possible to reduce costs for residents, contributing to environmental sustainability. Keywords: Electrical power consumption, Demand Forecasting, Consumption optimization, Time series, Machine learning x Introducción El presente estudio se centra en la aplicación de técnicas de ciencia de datos, entre ellos el desarrollo y aplicación de un modelo de redes neuronales, para predecir la demanda de energía para el año 2025, tomando como fuente los datos históricos de los años 2023 y 2024, y también un modelo de optimización lineal con el objetivo de optimizar el consumo de energía en franjas horarias específicas. Este enfoque busca mejorar la precisión de las predicciones de demanda, y también proporcionar una herramienta para la planificación y gestión del consumo de energía, para disminuir los costos del servicio y del mismo modo contribuir así a la sostenibilidad y eficiencia energética. La investigación se estructura en varios capítulos que abordan desde el planteamiento del problema y la formulación de objetivos, se describe la metodología empleada y se detalla el análisis de resultados. En el primer capítulo, se presenta el planteamiento y formulación del problema, seguido de la determinación de objetivos y la justificación del estudio. El segundo capítulo ofrece un marco teórico que incluye antecedentes de investigaciones previas y bases teóricas relevantes. En el tercer capítulo, se definen las hipótesis y variables del estudio, mientras que el cuarto capítulo describe la metodología de investigación utilizada. Finalmente, el quinto capítulo presenta los resultados obtenidos, su análisis y discusión, terminando con las conclusiones y recomendaciones del estudio. Este trabajo pretende aportar al campo de la aplicación de modelos de ciencias de datos con el uso de técnicas avanzadas de aprendizaje automático, y modelos de automatización, proporcionando una base sólida para futuras investigaciones y aplicaciones prácticas en la ciencia de datos y específicamente en la optimización del consumo de energía eléctrica. 11 Capítulo I: Planteamiento del Estudio En este capítulo se presenta el contexto y la problemática del tema de investigación que es el consumo de energía eléctrica en edificios multifamiliares en Perú. Se detallan los desafíos actuales relacionados con la gestión eficiente del consumo eléctrico y se plantea la necesidad de soluciones innovadoras utilizando técnicas de ciencia de datos. Se establecen los objetivos generales y específicos de la investigación, justificando su relevancia teórica, metodológica y social. Finalmente, se describen las limitaciones que podrían afectar el desarrollo del estudio, proporcionando una visión integral de los factores que influencian el consumo de energía eléctrica, la predicción de la demanda y las posibles estrategias para su optimización. 1.1. Planteamiento y formulación del problema 1.1.1. Planteamiento del problema El consumo óptimo de electricidad es un desafío significativo a nivel mundial, impactando tanto a economías desarrolladas como las que se encuentran en desarrollo. La creciente demanda de energía y la necesidad de fuentes sostenibles han llevado a muchos países a buscar soluciones innovadoras para gestionar el consumo eléctrico y reducir costos. Por ejemplo, en países como Alemania y Japón, se han implementado tarifas diferenciadas y tecnologías avanzadas de monitoreo para optimizar el uso de energía y reducir los costos para los consumidores. En Alemania, el precio promedio de la electricidad es uno de los más altos de Europa, alcanzando aproximadamente 0,402 €/kWh en 2024 (Alemania en tu idioma, 2024). Sin embargo, gracias a la implementación de tarifas diferenciadas y el uso de tecnologías avanzadas, los consumidores pueden aprovechar precios más bajos durante los periodos de menor demanda. En algunos casos, por ejemplo, durante la noche o los fines de semana, los precios pueden volverse incluso negativos, lo que significa que los productores de energía pagan a los consumidores para que utilicen electricidad, esto puede resultar en ahorros significativos para los hogares que ajustan su consumo a estos periodos. En Japón, el costo promedio de la electricidad es de aproximadamente 0,26 €/kWh (GanaEnergia, 2021). Japón ha 12 adoptado tecnologías avanzadas de monitoreo y tarifas diferenciadas para incentivar el consumo durante los periodos de menor demanda. Los hogares que utilizan estas tecnologías pueden reducir sus costos de electricidad en un 10-20% ajustando su consumo a los horarios más económicos. América Latina en general enfrenta desafíos únicos en cuanto al consumo de electricidad. La región tiene una mezcla de áreas urbanas densamente pobladas y zonas rurales con acceso limitado a la energía. Esto crea una disparidad en el consumo y los costos de electricidad, afectando de manera diferente a las comunidades urbanas y rurales. En muchos países de la región, se han implementado políticas para promover el uso eficiente de la energía y reducir la dependencia de fuentes no renovables. En México, el costo promedio de la electricidad es de aproximadamente 0,22 USD/kWh (OLADE , 2021). El gobierno mexicano ha promovido el uso de tecnologías de eficiencia energética y tarifas diferenciadas para reducir los costos de electricidad. Los hogares que adoptan estas tecnologías pueden ahorrar entre un 10% y un 15% en sus facturas de electricidad (OLADE , 2021). Además, el uso de medidores inteligentes ha permitido a los consumidores monitorear su consumo en tiempo real y ajustar sus hábitos para aprovechar las tarifas más bajas durante los periodos de menor demanda. En Chile, el costo promedio de la electricidad es de aproximadamente 0,15 USD/kWh (OLADE , 2021). Chile ha sido pionero en la implementación de energías renovables, especialmente solar y eólica. Gracias a estas iniciativas, los costos de electricidad en algunas regiones han disminuido en un 25% (OLADE , 2021). Además, las políticas de eficiencia energética han permitido a los hogares reducir su consumo de electricidad en un 10-20%, resultando en ahorros significativos en sus facturas mensuales. Centrándonos en el ámbito nacional, en el Perú, el consumo de electricidad representa una parte importante del presupuesto familiar. Según la Encuesta Residencial de Consumo y Usos de Energía 2019-2020 realizada por OSINERGMIN, el gasto en electricidad puede llegar a representar hasta el 10% del presupuesto mensual de un hogar promedio (OSINERGMIN, 2020). Este impacto, sin embargo, no es uniforme en todo el país. Diversos factores, como la ubicación 13 geográfica del hogar, influyen significativamente en el consumo de electricidad, tal como lo demuestra un estudio más reciente de (AutoSolar Perú, 2023), el cual analiza cómo varía este consumo en diferentes regiones y su repercusión en los gastos familiares, en la tabla 1 se refleja cómo varía el consumo de electricidad y su impacto en el presupuesto familiar dependiendo de la ubicación del hogar. Tabla 1 Consumo de Electricidad e Impacto en Presupuesto Familiar en Perú Categoría Consumo Promedio (kWh/mes) Gasto Promedio (S/ mes) Porcentaje del Presupuesto Familiar Zonas Urbanas 120 S/ 72 8% Zonas Rurales 60 S/ 36 5% Promedio Nacional 93 S/ 55.80 6.5% Fuente : (AutoSolar Perú, 2023) Estos costos promedios por consumo de energía presentados se incrementan en los edificios multifamiliares donde las familias adicionalmente tienen que asumir los gastos de las áreas de uso común, estas áreas incluyen pasillos, ascensores, iluminación interna y externa, entre otros servicios compartidos. Las áreas comunes pueden representar una porción considerable del consumo total de electricidad del edificio. En promedio, el consumo de electricidad en áreas comunes puede llegar a ser de 30 kWh por mes por departamento, lo que equivale a un costo de aproximadamente S/ 18 mensuales considerando una tarifa de S/ 0.60 por kWh (AutoSolar Perú, 2023). Sumando el consumo del departamento y las áreas comunes se puede considerar un promedio mensual de hasta S/ 90 soles. Para poder contrarrestar esta situación adversa, a partir del año 2023, el Organismo Supervisor de Electricidad y Minería (OSINERGMIN), como parte del proceso de modernización del sector eléctrico nacional, ha creado nuevas tarifas de electricidad que permiten que los consumos de los clientes se pueda valorizar en función a franjas horarias, esto permitirá promover el consumo eficiente de energía eléctrica, las tarifas diferenciadas por horarios están diseñadas para incentivar a los usuarios a consumir electricidad durante los periodos de menor demanda, 14 conocidos como horarios base y media, donde la energía es más barata. Esto ayuda a equilibrar la carga en la red eléctrica y reduce la necesidad de generar energía adicional durante los picos de demanda (La Republica, 2023). Al trasladar el consumo a los horarios más económicos, los usuarios pueden lograr ahorros significativos en sus recibos de electricidad. Se estima que los usuarios pueden ahorrar entre un 5% y un 19% en sus facturas mensuales al ajustar sus hábitos de consumo según las franjas horarias (La Republica, 2023). Para poder gestionar las tarifas con franjas horarias, se deben instalar a los clientes medidores inteligentes, estos medidores permiten un monitoreo más preciso y en tiempo real del consumo de electricidad, lo que facilita la gestión eficiente de la energía tanto para los usuarios como para las empresas distribuidoras (La Republica, 2023). Estas tarifas se denominan BT5-I, a continuación, se detallan las franjas horarias y sus características tales como Horario Base: De 11:00 p.m. a 8:00 a.m. Este es el horario más económico, ideal para realizar actividades que consumen mucha energía, como lavar ropa o cargar dispositivos eléctricos; Horario Media: De 8:00 a.m. a 6:00 p.m. este horario tiene un costo intermedio y es adecuado para el uso regular de electrodomésticos y actividades diarias; y Horario Punta: De 6:00 p.m. a 11:00 p.m. Este es el horario más caro debido a la alta demanda de energía. Se recomienda minimizar el uso de electrodomésticos de alto consumo durante este periodo. La migración a los medidores inteligentes permitirá a los consumidores domiciliarios gestionar activamente sus consumos, no solo beneficiándose con un menor pago en su recibo de electricidad, sino también, y más importante, dejar de consumir en las horas de punta y contribuir a que no se consuman combustibles fósiles y con ello disminuir su huella de carbono, lo que ayudará al cuidado del medio ambiente. (La Republica, 2023). La implementación de medidores inteligentes en los edificios multifamiliares permite el monitoreo en tiempo real del consumo de energía. Los datos recopilados pueden ser analizados para identificar ineficiencias y oportunidades de ahorro, ajustando el consumo en función de las tarifas horarias. Para poder lograr este objetivo de gestionar estos consumos, es necesario contar con las herramientas necesarias que permitan analizar estos 15 datos y poder sugerir cambios en los comportamientos de los usuarios para lograr un consumo eficiente de energía. Esta investigación, propone usar la ciencia de datos para lograr un consumo eficiente de energía eléctrica, ya que permite analizar grandes volúmenes de datos de consumo de energía eléctrica, gestionados por los medidores inteligentes, para identificar patrones y tendencias. Esto ayuda a comprender cómo y cuándo se consume la mayor cantidad de energía, permitiendo ajustar el uso de dispositivos eléctricos a horarios de menor costo (Agencia Internacional de Energía, 2023). Se realiza una predicción de demanda futura y se propone una optimización de esta. 1.1.2. Formulación del problema 1. Problema general ¿Cómo se puede analizar y predecir el consumo de energía eléctrica de edificios de departamentos multifamiliares en Perú utilizando un modelo de ciencia de datos para lograr su optimización y eficiencia? 2. Problemas específicos • ¿Cómo se pueden identificar los patrones de consumo de energía eléctrica en edificios de departamentos multifamiliares basado en datos históricos, comprender cómo y cuándo se consume la mayor cantidad de energía, permitiendo ajustar el uso de dispositivos eléctricos a horarios de menor costo? • ¿Es posible predecir la demanda de energía en diferentes momentos del día para planificar el uso de energía de manera más eficiente, evitando picos de consumo durante los horarios punta y aprovechando las tarifas más bajas en horarios medios y bajos? 16 1.2. Determinación de objetivos 1.2.1. Objetivo general Desarrollar un modelo para analizar y predecir el consumo de energía de los edificios multifamiliares en Perú. 1.2.2. Objetivos específicos • Analizar datos históricos de consumo eléctrico en edificios multifamiliares para identificar patrones y tendencias mediante técnicas avanzadas de análisis de datos, con el fin de comprender los factores que influyen en el consumo energético • Diseñar y evaluar un modelo predictivo de demanda de energía eléctrica en edificios multifamiliares, utilizando datos históricos para predecir el consumo futuro de energía eléctrica. • Desarrollar estrategias de planificación de uso de energía que utilicen predicciones de demanda para minimizar los picos de consumo en horarios punta y optimizar el uso de tarifas más bajas en horarios medios y bajos. 1.3. Justificación e importancia del estudio La presente investigación se centra en el análisis y predicción del consumo de energía eléctrica en edificios multifamiliares en Perú, utilizando técnicas avanzadas de ciencia de datos. Este estudio busca abordar la problemática del consumo energético, proponiendo soluciones que optimicen el uso de la electricidad y reduzcan los costos para los hogares. A continuación, se detallan las justificaciones teórica, metodológica y social que sustentan la relevancia y necesidad de esta investigación 17 1.3.1. Justificación teórica Esta investigación contribuirá significativamente al avance del conocimiento con la aplicación práctica de técnicas de ciencias de datos en el área de la eficiencia energética en edificios multifamiliares, el modelo diseñado y aplicado enriquecerá el marco teórico existente, generando nuevo conocimiento al ofrecer un análisis detallado de los patrones de consumo en contextos específicos como el peruano, donde las dinámicas de consumo pueden diferir de otros países. Los análisis realizados proporcionarán una base sólida para futuras investigaciones, generando nuevas ideas y teorías sobre la gestión eficiente de la energía en entornos residenciales. La capacidad del estudio para integrar técnicas avanzadas de análisis de datos con aplicaciones prácticas en la gestión energética asegura su importancia académica y su potencial para influir en futuras investigaciones en el campo. 1.3.2. Justificación Metodológica La metodología basada en el análisis de datos históricos mediante modelos de series temporales y técnicas de machine learning es la más adecuada para abordar el problema de investigación. Esta metodología no solo permite un análisis detallado de los patrones de consumo energético, sino que también introduce enfoques nuevos que mejoran los métodos existentes. La implementación de medidores inteligentes y la recopilación de datos en tiempo real facilitan un análisis preciso y actualizado, lo que es esencial para la predicción y optimización del consumo de energía. Esta metodología puede ser replicada o adaptada en futuras investigaciones, aportando al desarrollo metodológico en la disciplina. La capacidad de estos métodos para ser aplicados en diferentes contextos y su potencial para mejorar la eficiencia energética en diversos entornos subraya su relevancia y contribución al campo de estudio práctico. 18 1.3.3. Justificación Social Este estudio puede tener un alto impacto social al presentar la capacidad de mejorar la calidad de vida de los residentes de edificios multifamiliares en Perú. Al abordar problemas significativos como el alto costo de la electricidad y la ineficiencia en el consumo de energía eléctrica, la investigación ofrece soluciones prácticas que pueden resultar en ahorros económicos considerables para las familias. Además, al promover el consumo eficiente de energía y reducir la demanda durante los picos, se contribuye a la sostenibilidad ambiental, disminuyendo la necesidad de generar energía adicional y reduciendo las emisiones de carbono. Los resultados de este estudio pueden beneficiar directamente a la comunidad al fomentar una cultura de eficiencia energética y responsabilidad ambiental, impactando positivamente en el bienestar, la equidad y otros aspectos sociales. La implementación de tarifas diferenciadas por horarios y el uso de tecnologías avanzadas como los medidores inteligentes también pueden servir como modelo para otras regiones, amplificando el impacto social del estudio 1.4. Limitaciones de la presente investigación • Disponibilidad y Calidad de los Datos: La precisión de los modelos de series temporales y las predicciones de consumo de energía dependen en gran medida de la calidad y cantidad de datos históricos disponibles. Si los datos son incompletos, inconsistentes o de baja calidad, esto puede afectar la exactitud de los resultados (Agencia Internacional de Energía, 2023). • Variabilidad en los Hábitos de Consumo: Los hábitos de consumo de energía pueden variar significativamente entre diferentes hogares y edificios. Factores como el tamaño del hogar, el número de residentes, el uso de electrodomésticos y las preferencias personales pueden influir en los patrones de consumo, lo que dificulta la generalización de los resultados (AutoSolar Perú, 2023). • Factores Externos: Factores externos como cambios en las tarifas de electricidad, políticas gubernamentales, condiciones climáticas y eventos imprevistos (por ejemplo, pandemias) pueden afectar el consumo de energía y, por lo tanto, la aplicabilidad de los modelos predictivos a implementar. 19 Capítulo II: Marco teórico Este capítulo se presenta la revisión de antecedentes y teorías relevantes que se utilizarán en la investigación. Se incluyen estudios previos tanto a nivel internacional como nacional que han abordado la eficiencia energética y la gestión del consumo eléctrico. Se presentan las bases teóricas que sustentan el estudio, incluyendo el desarrollo histórico del consumo energético en edificios multifamiliares, la fundamentación teórica basada en modelos de series temporales y técnicas de machine learning, y el marco conceptual que guía la investigación. También se definen los términos básicos utilizados en el estudio para asegurar una comprensión clara y precisa de los conceptos a utilizar. 2.1. Antecedentes de la investigación 2.1.1. Internacionales La Agencia Internacional de Energía (IEA) publicó en 2023 un informe titulado “Energy Efficiency 2023”, (International Energy Agency, 2023) que analiza los desarrollos globales en los mercados y políticas de eficiencia energética. El estudio utiliza un enfoque cuantitativo y cualitativo, con un diseño descriptivo y exploratorio, y abarca una población global. Las técnicas de recolección de datos incluyeron análisis de datos históricos, encuestas y entrevistas. Los resultados mostraron que, aunque el progreso global en eficiencia energética se ha ralentizado, se están implementando políticas y programas de ahorro energético que aceleran la adopción de tecnologías eficientes. Concluyeron que es crucial duplicar el progreso en eficiencia energética para alcanzar los objetivos climáticos globales. Este estudio es relevante para la investigación actual ya que ambos se centran en la eficiencia energética y el uso de tecnologías avanzadas para mejorar el consumo energético. La diferencia principal es el alcance global del estudio de la IEA, mientras que la investigación actual se enfoca en un contexto específico de edificios multifamiliares en Perú. Por otro lado, algunos otros autores han realizaron estudios en México con el objetivo de analizar el consumo de energía eléctrica en diversos sectores y 20 proponer estrategias de eficiencia y mitigación de emisiones contaminantes (Vaca Serrano, J. M., y Kido Cruz, A, 2021). En esta investigación, utilizaron un enfoque cuantitativo, con un diseño descriptivo y correlacional, y una población compuesta por diferentes sectores productivos. Las técnicas de recolección de datos incluyeron encuestas y análisis de datos históricos. Los resultados mostraron que la implementación de tecnologías de eficiencia energética puede reducir significativamente el consumo de energía y las emisiones de gases de efecto invernadero. Concluyeron que una estrategia multisectorial es esencial para mejorar la eficiencia energética en México. Este estudio es relevante para la investigación actual ya que aborda la eficiencia energética en un contexto nacional similar al peruano. Las similitudes en los desafíos energéticos y las soluciones propuestas pueden proporcionar un marco de referencia útil. Sin embargo, la investigación actual se enfoca específicamente en edificios multifamiliares, lo que añade una dimensión residencial que no se aborda en el estudio de Vaca Serrano y Kido Cruz. Siguiendo en esta misma línea, otros investigadores han llevado a cabo un estudio en Ecuador con el objetivo de gestionar y optimizar el consumo de energía eléctrica en el sector residencial mediante el uso de series temporales (Sarango, 2021). El estudio adoptó un enfoque cuantitativo, con un diseño longitudinal y una población de hogares residenciales. Utilizó técnicas de recolección de datos como la recopilación de datos históricos de consumo y el análisis de series temporales. Los resultados indicaron que los modelos predictivos basados en series temporales pueden mejorar significativamente la eficiencia energética en los hogares. Concluyó que la implementación de estos modelos es crucial para la gestión eficiente del consumo energético. La relación con la investigación actual es directa, ya que ambos estudios utilizan técnicas de series temporales para optimizar el consumo de energía. La diferencia clave radica en el contexto geográfico y el tipo de edificación, ya que el estudio de Sarango se centra en hogares individuales, mientras que la investigación actual se enfoca en edificios multifamiliares en Perú. Finalmente, se han encontrado otros aportes dirigidos a la eficiencia energética de edificios inteligentes, en el cual se registra una publicación que aborda la necesidad 21 de optimizar el consumo de energía en edificios inteligentes debido al crecimiento de la población urbana (Movement Energy Efficiency, 2021). El estudio, realizado en Estados Unidos, utilizó un enfoque cualitativo con un diseño exploratorio, y se basó en entrevistas y análisis de casos de estudio. Los resultados mostraron que la implementación de tecnologías inteligentes puede aumentar significativamente la eficiencia energética y reducir las emisiones de gases de efecto invernadero. Concluyeron que los edificios inteligentes son una solución viable para los desafíos energéticos urbanos. Este antecedente es relevante para la investigación actual ya que ambos estudios se centran en la eficiencia energética en edificios. Sin embargo, la investigación actual se diferencia al enfocarse en edificios multifamiliares en Perú y utilizar técnicas de ciencia de datos para el análisis y predicción del consumo energético, mientras que el estudio de Energy Efficiency Movement se centra en tecnologías inteligentes en un contexto urbano estadounidense. 2.1.2. Nacionales En cuanto al contexto nacional, se han encontrado estudios realizados en Lima con el objetivo de analizar el impacto de la implementación de tecnologías de eficiencia energética en edificios multifamiliares (González, 2021). En esta investigación se utilizó un enfoque cuantitativo, con un diseño descriptivo y una población de edificios multifamiliares. Las técnicas de recolección de datos incluyeron encuestas y análisis de datos de consumo energético. Los resultados mostraron que la implementación de sistemas de gestión de energía y medidores inteligentes puede reducir significativamente el consumo de energía. Concluyó que estas tecnologías son esenciales para mejorar la eficiencia energética en edificios multifamiliares. Este estudio es relevante para la investigación actual, ya que ambos se centran en la optimización del consumo energético en edificios multifamiliares en Perú. Las similitudes en el contexto geográfico y el tipo de edificación proporcionan una base sólida para la investigación actual. La diferencia principal radica en el uso de técnicas de ciencia de datos en la investigación actual para el análisis y predicción del consumo energético, lo que añade una dimensión analítica avanzada al estudio de González. 22 Por otro lado, se han evidenciado otro estudio propuesto en Arequipa, con el objetivo de evaluar la eficiencia energética en viviendas sociales (Martínez, 2020). Esta investigación utilizó un enfoque cuantitativo, con un diseño experimental y una población de viviendas sociales. Las técnicas de recolección de datos incluyeron mediciones directas de consumo de energía eléctrica y encuestas a los residentes. Los resultados indicaron que la implementación de mejoras en el aislamiento térmico y el uso de electrodomésticos eficientes puede reducir significativamente el consumo de energía. Concluyó que las políticas de eficiencia energética son cruciales para mejorar la calidad de vida en viviendas sociales. Este estudio es relevante para la investigación actual ya que ambos se enfocan en la eficiencia energética en contextos residenciales. La diferencia clave es que el estudio de Martínez se centra en viviendas sociales, mientras que la investigación actual se enfoca en edificios multifamiliares. Sin embargo, las estrategias de eficiencia energética identificadas pueden ser aplicables y adaptadas a diferentes tipos de viviendas. El documento de la Universidad Nacional de Ingeniería (UNI), presenta un estudio sobre el pronóstico eficiente de la demanda diaria del sistema eléctrico interconectado nacional (SEIN) utilizando modelos ARIMA. (Gonzales Chávez, 2021). El estudio destaca la importancia de aplicar metodologías cuantitativas avanzadas para mejorar la precisión de las proyecciones de demanda eléctrica, abordando las limitaciones de los métodos actuales que no consideran adecuadamente la estacionalidad y las irregularidades de la serie temporal de datos. Las recomendaciones para mejorar la estacionalidad serán importantes para aplicarlas en la presente investigación. El documento de trabajo de OSINERGMIN analiza la eficiencia energética en el sector residencial peruano, enfocándose en la implementación de tecnologías de eficiencia energética en viviendas sociales. (Osinergmin, 2020) El estudio utiliza un enfoque cuantitativo y experimental, con mediciones directas de consumo energético y encuestas a los residentes. Los resultados indican que mejoras en el aislamiento térmico y el uso de electrodomésticos eficientes pueden reducir 23 significativamente el consumo de energía, subrayando la importancia de las políticas de eficiencia energética para mejorar la calidad de vida en viviendas sociales. 2.2. Bases teóricas 2.2.1. Desarrollo histórico Lograr un consumo de energía eléctrica eficiente en edificios multifamiliares ha evolucionado significativamente a lo largo de las décadas. Inicialmente, el consumo de energía en estos edificios no era monitoreado de manera eficiente, se utilizaban personas que visitaban mensualmente los predios para tomar la lectura del consumo del medidor, estos eran apuntados a mano en los listados y posteriormente ingresados a los sistemas de facturación, esto conllevaba varios puntos de falla como son la lectura errada del marcador del medidor, mala transcripción en los listados, mala digitación en las interfaces de los sistemas, etc. En la década del 2010 se implementaron aplicaciones para realizar el registro automáticos de las lecturas de los medidores y se comienza a usar base de datos para almacenar los datos recolectados, luego de la pandemia de COVID 2019, las empresas de distribución vienen modernizando su infraestructura, como parte de la transformación digital, e instaló medidores inteligentes, los cuales permiten una consulta en línea de los datos de consumo de sus clientes, eliminando de este modo los riesgos de errores en la captura de datos, estos datos se almacenan en bases de datos especializadas que son la principal fuente para la facturación mensual realizada a los clientes, el organismo supervisor también ha forzado la modernización, al cambiar el marco regulatorio e implementar tarifas que permiten la facturación por horarios de consumo. Cumplir con este marco regulatorio permitirá optimizar la producción de energía eléctrica y un consumo eficiente que ayudará que los clientes puedan tener un ahorro significativo en su facturación mensual. Todo este proceso se debe realizar utilizando técnicas avanzadas de ciencias de datos. 24 En países como Alemania y Japón, se han adoptado tecnologías avanzadas de monitoreo y tarifas diferenciadas para optimizar el uso de energía y reducir los costos para los consumidores (Gana Energía, 2021). En América Latina, países como México y Chile han implementado políticas para promover el uso eficiente de la energía y reducir la dependencia de fuentes no renovables (OLADE , 2021). En Perú, la introducción de tarifas diferenciadas por horarios y la instalación de medidores inteligentes han sido pasos importantes hacia la modernización del sector eléctrico y la optimización del consumo energético en edificios multifamiliares (La Republica, 2023) 2.2.2. Fundamentación teórica La fundamentación teórica de esta investigación se basa en varias teorías y modelos conceptuales clave: a. Teoría de la Eficiencia Energética: Esta teoría se centra en el uso óptimo de la energía para realizar tareas específicas, minimizando el desperdicio. En el contexto de edificios multifamiliares, implica la implementación de tecnologías y prácticas que reducen el consumo de energía sin comprometer el confort de los residentes (Agencia Internacional de Energía, 2023) b. Machine Learning y Predicción de Demanda: Técnicas de machine learning, como las Redes Neuronales Recurrentes (RNN) y Long Short-Term Memory (LSTM), son efectivas para el análisis de series temporales y la predicción de la demanda de energía. Estas técnicas mejoran la precisión de las predicciones y optimizan el consumo de energía en función de las tarifas horarias (Goodfellow, I., Bengio, Y., & Courville, A. , 2016). c. Teoría de la Gestión de la Energía: La gestión de la energía implica la planificación y operación de unidades de producción y consumo de energía. En edificios multifamiliares, esto incluye la implementación de sistemas de gestión de energía (EMS) que monitorean y controlan el uso de energía en tiempo real. 25 d. Economía del Comportamiento y Tarifas Horarias: Esta teoría estudia cómo los factores psicológicos, sociales y emocionales afectan las decisiones económicas. En el contexto de tarifas horarias, ayuda a entender cómo los residentes pueden ser incentivados a cambiar sus hábitos de consumo de energía para aprovechar las tarifas más bajas en horarios valle y media (Thaler, R. H., & Sunstein, C. R., 2008) 2.2.3. Marco conceptual El marco conceptual de esta investigación se construye a partir de la fundamentación teórica y organiza de manera lógica los elementos que guiarán el estudio. Los conceptos teóricos seleccionados se interrelacionan de la siguiente manera: • Eficiencia Energética: Implementación de tecnologías y prácticas para reducir el consumo de energía. • Modelos de Series Temporales: Análisis y predicción de datos de consumo de energía. • Machine Learning: Mejora de la precisión de las predicciones de demanda energética. • Gestión de la Energía: Monitoreo y control del uso de energía en tiempo real. • Economía del Comportamiento: Incentivos para cambiar hábitos de consumo de energía. • Definición Conceptual de Variables - Consumo de energía (v1): Definición Conceptual: El consumo de energía se refiere a la cantidad total de energía eléctrica utilizada por los residentes de los edificios multifamiliares durante un periodo específico, generalmente medido en kilovatios-hora (kWh). Este consumo incluye tanto el uso individual de cada departamento como el uso compartido en áreas comunes. Indicador: Consumo mensual en kWh. Instrumento: Medidor inteligente. - Costo de energía (v2): 26 Definición Conceptual: El costo de energía es el gasto económico que los residentes deben pagar por el consumo de electricidad. Este costo puede variar según las tarifas eléctricas aplicadas, que pueden incluir tarifas diferenciadas por horarios de consumo. Indicador: Costo mensual en soles. Instrumento: Factura de electricidad. - Horarios de consumo (v3): Definición Conceptual: Los horarios de consumo se refieren a los periodos del día en los que se registra el uso de energía eléctrica. Estos horarios pueden clasificarse en horarios de mayor, menor y mediana demanda, y son cruciales para identificar patrones de uso y optimizar el consumo energético. Indicador: Horarios de mayor consumo. Instrumento: Análisis de datos históricos. - Predicción de demanda (v4): Definición Conceptual: La predicción de demanda es la estimación anticipada del consumo de energía eléctrica en futuros periodos, basada en datos históricos y modelos predictivos. Esta predicción es esencial para planificar el uso eficiente de la energía y evitar picos de consumo. Indicador: Precisión de las predicciones. Instrumento: Modelos predictivos. 2.3. Definición de términos básicos • Eficiencia Energética: Uso óptimo de la energía para realizar una tarea específica, minimizando el desperdicio. • Modelos de Series Temporales: Herramientas estadísticas utilizadas para analizar y predecir datos que varían con el tiempo. • Machine Learning: Rama de la inteligencia artificial que se enfoca en el desarrollo de algoritmos que pueden aprender y hacer predicciones basadas en datos. • Gestión de la Energía: Planificación y operación de unidades de producción y consumo de energía. 27 • Economía del Comportamiento: Estudio de cómo los factores psicológicos, sociales y emocionales afectan las decisiones económicas. • Medidores Inteligentes: Dispositivos que permiten un monitoreo preciso y en tiempo real del consumo de electricidad. • Tarifas Diferenciadas: Tarifas de electricidad que varían según el horario del día para incentivar el consumo durante los periodos de menor demanda. • Red neuronal: Una red neuronal es un modelo matemático el cual se inspiró del funcionamiento del cerebro humano, la estructura básica de una red neuronal son las capas de entrada, intermedia y salida a su vez cada capa posee cierta cantidad de neuronas. • Aprendizaje automático: Las redes neuronales también se pueden clasificar según el tipo de aprendizaje, dentro de los cuales tenemos el aprendizaje supervisado y no supervisado, el aprendizaje supervisado se basa en que al modelo se le entrega los datos de entrada asociado a una salida mientras que el aprendizaje no supervisado se diferencia en que no se le suministra una salida es por eso que este tipo de aprendizaje aprende solo con los datos de entrada. (Serrano, Soria, & Mártin, 2009) 28 Capítulo III: Hipótesis y variables En este capítulo se plantean las hipótesis generales y específicas que guiarán la investigación. Se detallan las variables que serán analizadas, incluyendo el consumo de energía, el costo de energía, los patrones de consumo y la predicción de demanda. Además, se presenta la matriz de operacionalización de variables, que describe cómo se medirán y analizarán estas variables para probar las hipótesis planteadas. 3.1. Hipótesis 3.1.1. Hipótesis General La implementación de técnicas de ciencia de datos para analizar y predecir el consumo de energía eléctrica en edificios multifamiliares en Perú permitirá optimizar el uso de energía y reducir los costos para los residentes. 3.1.2. Hipótesis específicas Hipótesis Específica 1: El análisis de datos históricos de consumo eléctrico permitirá identificar patrones y tendencias que influyen en el consumo de energía eléctrica en edificios multifamiliares Hipótesis Específica 2: La aplicación de modelos predictivos de demanda energética basados en técnicas de machine learning mejorará la precisión de las predicciones de consumo de energía eléctrica Hipótesis Específica 3: La implementación de estrategias de planificación de uso de energía basadas en predicciones de demanda reducirá los picos de consumo durante los horarios punta y optimizará el uso de tarifas más bajas en horarios medios y bajos. 29 3.2. Operacionalización de variables / Categorización 3.2.1. Variable 1 Consumo de energía (v1): Cantidad de energía eléctrica consumida en kWh 3.2.2. Variable 2 Precio de energía (v2): Precio de kWh en soles 3.2.3. Variable 3 Horarios de consumo (v3): Tendencias en el uso de energía en horarios de mayor consumo 3.2.4. Variable 4 Predicción de demanda (v4): Estimación del consumo futuro de energía 3.3. Matriz de operacionalización de variables Tabla 2 Matriz de operacionalización de variables Variable Definición Indicador Ítem Instrumento Consumo de energía (v1) Cantidad de energía eléctrica consumida en kWh Consumo mensual en kWh Medición en intervalos de tiempo Medidor inteligente Costo de energía (v2) Precio de kWh en soles Precio kWh en soles Factura mensual Pliego tarifario Horarios de consumos (v3) Horarios en el uso de energía Horarios de mayor consumo Análisis de datos históricos Software de análisis de datos Predicción de demanda (v4) Estimación del consumo futuro de energía Precisión de las predicciones Comparación con datos reales Modelos predictivos Fuente : Elaboración propia 30 Capítulo IV: Metodología del estudio Este capítulo describe el enfoque, tipo y alcance de la investigación, así como el diseño del estudio. Se detalla la población y muestra seleccionada, las técnicas e instrumentos de recolección de datos, y el procedimiento para la recolección y análisis de los datos. Se explican las técnicas de análisis de datos que se utilizarán, incluyendo la recopilación y preprocesamiento de datos históricos, el análisis exploratorio de datos, el modelado de series temporales, y la predicción y optimización del consumo energético. 4.1. Enfoque, tipo y alcance de investigación 4.1.1. Enfoque El enfoque de esta investigación es cuantitativo, ya que se basa en la recolección y análisis de datos numéricos para identificar patrones y tendencias en el consumo de energía eléctrica en edificios multifamiliares. Este enfoque permite la aplicación de técnicas estadísticas y modelos predictivos para analizar los datos históricos y realizar predicciones precisas sobre el consumo futuro de energía (Creswell, 2014). 4.1.2. Tipo y alcance El tipo de investigación es descriptivo y correlacional. Es descriptivo porque se busca describir las características del consumo de energía eléctrica en edificios multifamiliares, y es correlacional porque se pretende identificar la relación entre diferentes variables, como el consumo de energía y los patrones de uso (Hernández, Fernández, & Baptista, 2014). El alcance de la investigación es explicativo, ya que no solo se busca describir y correlacionar variables, sino también explicar las causas y efectos de los patrones de consumo de energía y cómo estos pueden ser optimizados mediante técnicas de ciencia de datos (Yin, 2018). 31 4.2. Diseño de la investigación El diseño de la investigación es no experimental y longitudinal. Es no experimental porque no se manipulan las variables independientes, sino que se observan y analizan en su contexto natural. Es longitudinal porque se analizarán datos históricos de consumo de energía a lo largo del tiempo para identificar tendencias y patrones (Kerlinger & Lee, 2002). 4.3. Población y muestra 4.3.1. Población La población de estudio está compuesta por todos los edificios multifamiliares en Perú que utilizan medidores inteligentes para el monitoreo del consumo de energía eléctrica. Esta población incluye tanto edificios ubicados en zonas urbanas como rurales. 4.3.2. Muestra La muestra utilizada consta de los consumos registrados por 1162 suministros distribuidos en las regiones sierra y selva de Perú, el dataset contiene 111 904 046 lecturas registradas desde enero del año 2023 a diciembre del año 2024, con una frecuencia diaria a intervalos de 15 minutos. 4.4. Técnicas e instrumentos de recolección de datos 4.4.1. Técnicas e instrumentos Las técnicas de recolección de datos incluyen la recopilación de datos históricos de consumo de energía a través de medidores inteligentes y bases de datos de las empresas distribuidoras de electricidad. Los instrumentos utilizados serán: • Medidores inteligentes: Para la recolección de datos de consumo de energía en tiempo real. 32 • Bases de datos: Para almacenar y gestionar los datos históricos de consumo. • Software de análisis de datos: se usan los programas Microsoft SQL para poder extraer los datos, se usa el programa Microsoft Visual Code para codificar el análisis exploratorio de datos y la implementación del modelo de estimación en lenguaje de programación Python. 4.4.2. Validez y confiabilidad. La validez de los instrumentos se garantizará mediante la revisión de expertos en el área de eficiencia energética y ciencia de datos. La confiabilidad se evaluará mediante pruebas piloto y análisis de consistencia interna. 4.4.3. Procedimiento de recolección de datos El procedimiento de recolección de datos incluirá los siguientes pasos: • Obtención de permisos: Solicitar permisos a la empresa distribuidora de electricidad para acceder a los datos de consumo. • Recolección de datos históricos: Descargar y almacenar los datos históricos de consumo de energía desde las bases de datos de la empresa distribuidora. 4.5. Técnicas de análisis de datos Las técnicas de análisis de datos incluirán: • Recopilación de Datos Históricos: Obtener datos históricos de consumo de energía de los medidores inteligentes. • Preprocesamiento de Datos ▪ Limpieza de Datos: Eliminar datos duplicados, corregir errores y manejar valores faltantes. ▪ Transformación de Datos: Convertir los datos en un formato adecuado para el análisis, como la normalización o estandarización de los valores 33 • Análisis Exploratorio de Datos (EDA) ▪ Visualización de Datos: Se utiliza librerías de Python para crear gráficos y tablas que ayuden a identificar patrones y tendencias. ▪ Estadísticas Descriptivas: Calcular medidas como la media, mediana, desviación estándar, etc., para entender mejor la distribución de los datos. • Modelado de Series Temporales ▪ Selección del Modelo: Elegir modelos adecuados como ARIMA, SARIMA, o modelos de machine learning como RNN y LSTM. ▪ Entrenamiento del Modelo: Dividir los datos en conjuntos de entrenamiento y prueba, y entrenar el modelo utilizando el conjunto de entrenamiento. ▪ Evaluación del Modelo: Evaluar el rendimiento del modelo utilizando métricas como el error cuadrático medio (MSE) o el error absoluto medio (MAE). • Predicción y Optimización ▪ Predicción de la Demanda: Utilizar el modelo entrenado para predecir el consumo de energía en diferentes momentos del día. ▪ Optimización del Consumo: Desarrollar estrategias para ajustar el uso de dispositivos eléctricos a horarios de menor costo basadas en las predicciones. • Implementación y Monitoreo ▪ Implementación de Estrategias: Aplicar las estrategias de optimización en los edificios multifamiliares. ▪ Monitoreo en Tiempo Real: Utilizar los medidores inteligentes para monitorear el consumo de energía en tiempo real y ajustar las estrategias según sea necesario. En la siguiente figura se puede resumir la metodología de la primera parte de la investigación 34 Figura 1: Metodología del trabajo de investigación Fuente: Fernando (2020) pag. 49 35 Capítulo V: Resultados 5.1. Análisis de Resultados En este capítulo, se presentan los resultados obtenidos durante el desarrollo del proyecto de tesis, los cuales están orientados a la evaluación del modelo propuesto para la predicción del consumo energético en edificios multifamiliares. La organización de este capítulo incluye la descripción de los datos utilizados, el proceso de entrenamiento y validación, así como los indicadores de desempeño del modelo implementado. 5.1.1. Analizar datos históricos de consumo eléctrico: Se realizó un análisis estadístico de un dataset que contiene datos de demanda de energía de 1162 suministros en edificios multifamiliares, registrados cada 15 minutos desde enero 2023 hasta diciembre 2024. El dataset incluye 5 columnas y 111 904 046 registros completos: • IDSOCKET : identificador del medidor • DATATIME : Fecha y hora del registro • USAGE_DATA: valor capturado en el registro • UOM : Unidad de medida del registro • Factormedicion: Factor de medición para calcular consumo real. Para poder realizar el análisis de los datos en el dataset, se tuvo que realizar varias transformaciones de datos: - Se convirtieron todos los datos de fecha a tipo datetime. - Se calcula el consumo real de cada registro, se multiplica el valor registrado (USAGE_DATA) y se multiplica por el factor de medición (Factormedicion), este valor calculado se almacena en la columna RealUsage_kwh - Se agrupo en registros de cada hora, como se puede observar en la figura 2, esto para poder facilitar el cálculo de valores futuros. 36 Figura 2: Diagrama de agrupación de datos horarios Fuente: elaboración propia - Se verifica que no exista valores nulos y se verifica que el índice temporal este completo. - Los datos comprenden el rango del 01/01/2023 00:00 al 30/12/2024 23:00, estos se dividen en 3 conjuntos, uno de entrenamiento, uno de validación y otro de prueba. Ver tabla 3 Tabla 3 Conjuntos de datos Conjunto Rango Registros Fechas train 2023-01-01 01:00:00 --- 2024-06-30 23:00:00 n=13127 Fechas validación 2024-07-01 00:00:00 --- 2024-09-30 23:00:00 n=2208 Fechas test 2024-10-01 00:00:00 --- 2024-11-30 23:00:00 n=1464 - También se crean las variables para evaluar los consumos en franjas horarias se crean las variables para que agrupen los registros. Ver tabla 4 Tabla 4 Franjas horarias Conjunto Rango Horas Base 23:01 a 08:00 Horas Intermedia 08:01 a 18:00 Horas Punta 18:01 a 23:00 37 5.1.1.1 Análisis de Series Temporales: Se realizó una exploración gráfica de series temporales para identificar tendencias, patrones y estacionalidad, lo cual ayuda a seleccionar el modelo de estimación más adecuado, en la figura se puede apreciar que los datos tienen un comportamiento creciente mensual. Figura 3: Gráfico de serie temporal completa Fuente: elaboración propia El gráfico muestra una posible estacionalidad mensual en la demanda eléctrica, con un crecimiento mensual constante. Debido a la varianza de la serie temporal, se realizó un zoom a un periodo del año para identificar patrones mensuales e intradiarios. 38 Figura 4: Gráfico de consumo anual (Zoom Mensual) Fuente: elaboración propia Al revisar una parte de la serie temporal, se identificó una estacionalidad semanal, con consumos más elevados durante la semana laboral (lunes a viernes) y menores en los fines de semana. También se observó una correlación entre el consumo de un día y el del día anterior. Esto se puede observar en los gráficos de la figura 5. 39 Figura 5: Gráficos de estacionalidad Fuente: elaboración propia Se observa que hay una estacionalidad anual, con valores de demanda (mediana) superiores en los meses de junio y julio, y con elevados picos de demanda en los meses de septiembre y octubre. Se aprecia una estacionalidad semanal, con valores de demanda inferiores durante el fin de semana. También existe una estacionalidad diaria, ya que la demanda se reduce entre las 00:00 y las 07:00 horas. Para poder realizar el análisis en franjas horarias también se elabora un gráfico que represente las franjas horarias definidas 40 Figura 6: Demanda por día y franja horaria Fuente: elaboración propia Análisis de Autocorrelación: Los gráficos de autocorrelación muestran la correlación entre la serie temporal y sus valores pasados, útiles para identificar el orden de un modelo autorregresivo. Figura 7: Gráfico de autocorrelación Fuente: elaboración propia 41 Figura 8: Gráfico de autocorrelación parcial Fuente: elaboración propia Los gráficos de autocorrelación y autocorrelación parcial muestran una clara asociación entre la demanda de una hora y las horas anteriores, así como entre la demanda de una hora y la demanda de esa misma hora los días anteriores. Este tipo de correlación es un indicativo de que los modelos autorregresivos se pueden aplicar a este estudio. El análisis de los datos históricos de consumo eléctrico en edificios multifamiliares ha permitido identificar patrones y tendencias significativas. La estacionalidad mensual, semanal y diaria observada en los gráficos de series temporales y de autocorrelación proporciona una comprensión más profunda de los factores que influyen en el consumo energético. Estos hallazgos son cruciales para el desarrollo de modelos predictivos más precisos y para la implementación de estrategias de eficiencia energética. La correlación entre el consumo de energía y los periodos anteriores sugiere que los modelos autorregresivos son adecuados para este tipo de análisis. 42 5.1.2. Modelos para la predicción del consumo de energía 5.1.2.1 Modelo Autorregresivo Recursivo Inicialmente se implementó un modelo autorregresivo recursivo (ForecasterRecursive) con un LGBMRegressor como regresor para predecir la demanda de energía de las próximas 24 horas. Se utilizaron como predictores los valores de consumo de las últimas 24 horas (24 lags) y la media móvil de los últimos 3 días. Los hiperparámetros del regresor se dejaron en sus valores por defecto. Se realizó un proceso de backtesting. Este proceso consiste en generar una predicción para cada observación del conjunto de prueba, siguiendo el mismo procedimiento que se seguiría si el modelo estuviese en producción, y finalmente comparar el valor predicho con el valor real. El backtesting se aplicó mediante la función backtesting_forecaster(). En este caso, la simulación se llevó a cabo de la siguiente manera: el modelo se entrenó con datos desde el 1 de octubre de 2024 hasta el 30 de noviembre de 2024, y luego predijo las siguientes 24 horas cada día a las 23:59. La métrica de error utilizada fue el error absoluto medio (MAE). Figura 9: Valores de predicción vs. valores reales modelo Forecasting Fuente: elaboración propia 43 El valor de MAE obtenido en este modelo es de 357.225297. Como se tiene las mayores diferencias en la estimación para los días de inicio de la semana. 5.1.2.2 Modelo LSTM El modelo LSTM (Long short-term memory) es un tipo de red neuronal recurrente (RNN) que se utiliza en el aprendizaje profundo para procesar y predecir secuencias de datos. La LSTM fue diseñada para abordar el problema de la desaparición del gradiente en las redes neuronales recurrentes tradicionales, que se produce cuando se retropropaga el error a través de múltiples capas y se pierde información importante en el proceso. La LSTM utiliza una estructura de celda con puertas que permite a la red controlar la cantidad de información que se almacena y se olvida en cada paso de tiempo, lo que la hace especialmente adecuada para el procesamiento de secuencias de datos a largo plazo. Las LSTMs se han utilizado con éxito en una amplia variedad de aplicaciones de aprendizaje profundo, como el procesamiento del lenguaje natural, el reconocimiento de voz, la generación de texto y la predicción de series temporales. (gamco, 2021) Figura 10: RNN Fuente: (keepcoding.io, 2025) 44 El primer modelo tiene una sola capa de unidades LSTM, como métrica de error se utiliza la función de error absoluto medio (MAE) y como optimizador estimación del momento adaptativo (ADAM) y un recorrido de 10 épocas. El modelo se entrena con los datos de test y se grafican las estimaciones Figura 9: Valores de predicción vs. valores reales modelo LSTM simple Fuente: elaboración propia Con este modelo se tiene una MAE de 99.3476, en la figura 10 se puede observar el proceso de aprendizaje del modelo. Figura 10: Proceso de aprendizaje del modelo LSTM simple error vs época Fuente: elaboración propia 45 Luego se implementó un modelo LSTM apilado, una capa oculta con función de activación el rectificador lineal unitario (RELU), se utiliza la técnica del dropout para tener mejores resultados y como optimizador estimación del momento adaptativo (ADAM), como métrica de error se utiliza la función de error absoluto medio (MAE) Figura 11: Valores de predicción vs. valores reales modelo LSTM apilado Fuente: elaboración propia El indicador MAE tiene un valor de 86.21 Figura 12: Proceso de aprendizaje del modelo LSTM anidado error vs época Fuente: elaboración propia 46 Se determina el mejor modelo a aplicar, en este caso el modelo LSTM anidado y se procede a aplicar el modelo para poder predecir la demanda para el año 2025. Se filtra los consumos para el año 2024 del IDSOCKET = 83578166 y se procesa la estimación usando el modelo implementado teniendo como entrada este nuevo dataset, como resultado se obtienen las estimaciones para los meses de enero, febrero y marzo del año 2025. 5.1.3. Modelo de Optimización de Demanda en Franjas Horarias Teniendo el nuevo dataset con los consumos estimados para el año 2025, procedemos a establecer el modelo de optimización de consumo en franjas horarias. Para tener los precios a aplicar en cada caso se importa un dataset con los precios de tarifas domestica actual y la nueva tarifa con franja horaria para poder realizar las comparaciones necesarias. Se plantea el problema de optimización con los siguientes datos: Conjunto • h: Conjunto de horas del día con índice h. Para todo h=1,2,…,24h=1,2,…,24. Variables de Decisión • xh: Cantidad de energía (en kWh) consumida en la hora h. Parámetros • ph: Precio de energía en la hora h. • ph es constante para la tarifa fija. • ph varía según el rango horario para la tarifa diferenciada: • Punta (18:00 - 23:00): ph=ppunta • Base (23:00 - 08:00): ph=pbase • Intermedio (08:00 - 18:00): ph=pintermedio • Ch: Consumo estimado de energía (en kWh) en la hora h antes de la optimización. 47 • Demanda Total: Energía total necesaria para satisfacer la demanda de todos los suministros de energía. Función Objetivo Minimizar el costo total de energía: la función está dada por Minimizar h=1∑24 Ph * Xh Restricciones: 1. La suma del consumo optimizado debe ser igual a la demanda total: Demanda Total h=1∑24 x h = Demanda Total 2. El consumo en cada hora debe ser no negativo y mayor a 0 Xh ≥0 ∀h Para el dataset de precios se ha considerado las tarifas BT5B y BT5I, sin la escala de consumo y descuentos fose. Esto se puede observar en la siguiente tabla. Tabla 5 Tarifas domésticas Enero 2025 Tarifa Cargo Unidad Rango Precio BT5BR Cargo por Energía Activa ctm. S//kW.h 00:00 - 23:59 94.50 BT5I Cargo por Energía Activa en Punta ctm. S//kW.h 18:00 -23:00 86.57 BT5I Cargo por Energía Activa Fuera de Punta en Media ctm. S//kW.h 08:01 -18:00 66.60 BT5I Cargo por Energía Activa Fuera de Punta en Base ctm. S//kW.h 23:01- 08:00 66.56 Fuente : (Osinergmin, Osinergmin pliegos tarifarios, 2025) Evaluando el consumo de energía de los meses de enero, febrero y marzo 2025, realizando una valorización directa con el precio de kwh para la tarifa BT5BR, que no tiene precio diferenciado por horas se tiene los siguientes datos: 48 Tabla 6 Valorización tarifa BTB5R (monohoraria) Mes TotalRealUsage_kWh ctm. S//kW.h Costo total Ene 3590.74797 94.5 3,393.26 Feb 2786.82708 94.5 2,633.55 Mar 2675.61222 94.5 2,528.45 Fuente : elaboración propia Luego se realiza la valorización de los consumos estimados en la tarifa BT5I, cuyos resultados se visualizan en la tabla 7. Tabla 7 Valorización tarifa BT5IR (Rangos Horarios) Mes TotalRealUsage_kWh ctm. S//kW.h Costo total Base 1,131.1285 66.56 752.88 Media 1,530.4398 66.60 1,019.27 Punta 929.1797 86.57 804.39 Ene 3,590.7480 2,576.54 Base 986.6607 66.56 656.72 Media 1,093.5871 66.60 728.33 Punta 706.5793 86.57 611.69 Feb 2,786.8271 1,996.74 Base 988.0618 66.56 657.65 Media 1,104.9475 66.60 735.90 Punta 582.6029 86.57 504.36 Mar 2,675.6122 1,897.91 Fuente : elaboración propia Como se puede observar es posible un ahorro considerable si se redistribuye el consumo de energía eléctrica en horarios base y medio, para esto se pueden tomar algunas acciones por parte de los clientes tales como automatización de encendido 49 y apago de luces y aparatos eléctricos, programación de horarios de uso, entre otros que deben realizar los usuarios finales. 5.2. Discusión de Resultados En esta sección, se discuten los resultados obtenidos en el análisis y predicción del consumo de energía eléctrica en edificios multifamiliares en Perú, utilizando técnicas de ciencia de datos. Los hallazgos se relacionan directamente con los objetivos planteados en la investigación, que incluyen el análisis de datos históricos, la predicción de la demanda energética y la optimización del consumo en franjas horarias. A continuación, se presenta una interpretación crítica de los resultados, conectándolos con las hipótesis y el marco teórico, y comparándolos con la literatura existente. Interpretación de los Resultados Objetivo 1: Analizar datos históricos de consumo eléctrico en edificios multifamiliares para identificar patrones y tendencias El análisis de los datos históricos de consumo eléctrico, de los años 2023 y 2024, permitió identificar patrones y tendencias significativas en el consumo de energía. Se observó una estacionalidad mensual, semanal y diaria, con picos de consumo en los meses de junio y julio, y durante los días laborables (lunes a viernes). Estos hallazgos son consistentes con estudios previos que han identificado patrones similares en el consumo de energía en contextos residenciales (González, 2021; Martínez, 2020). La estacionalidad diaria, con un menor consumo entre las 00:00 y las 07:00 horas, sugiere que los residentes tienden a reducir el uso de energía durante la noche, lo que podría ser aprovechado para implementar estrategias de optimización en franjas horarias. Como el traslado de labores diarias como el uso de lavadoras secadoras, aspiradoras y planchas. Esto apoyado con la automatización de los hogares, ya que los electrodomésticos modernos cuentan con la capacidad Smart de programación. La identificación de estos patrones es necesario para el desarrollo de modelos predictivos más precisos, ya que permite comprender cómo y cuándo se consume la mayor cantidad de energía. Estos resultados 50 respaldan la Hipótesis Específica 1, que plantea que el análisis de datos históricos permitirá identificar patrones y tendencias que influyen en el consumo energético. Objetivo 2: Diseñar y evaluar un modelo predictivo de demanda energética en edificios multifamiliares Se implementaron dos modelos predictivos: un modelo autorregresivo recursivo (ForecasterRecursive) y un modelo LSTM (Long Short-Term Memory). El modelo LSTM, en particular, mostró un mejor desempeño, con un error absoluto medio (MAE) de 86.21, en comparación con el modelo autorregresivo, que tuvo un MAE de 357.22. Esto sugiere que las redes neuronales recurrentes, como LSTM, son más adecuadas para predecir el consumo de energía en edificios multifamiliares, especialmente cuando se trata de datos con estacionalidad y patrones complejos. Estos resultados respaldan la Hipótesis Específica 2, que propone que la aplicación de modelos predictivos basados en técnicas de machine learning mejorará la precisión de las predicciones de consumo de energía. Además, estos hallazgos están en línea con estudios previos que han utilizado modelos LSTM para predecir la demanda de energía en contextos residenciales (Goodfellow, Bengio, & Courville, 2016; Sarango, 2021). Objetivo 3: Desarrollar estrategias de planificación de uso de energía que utilicen predicciones de demanda Con base en las predicciones del modelo LSTM, se desarrolló un modelo de optimización de consumo en franjas horarias. Este modelo permitió reducir los costos de energía al trasladar el consumo a horarios de menor demanda (horario base y media), donde las tarifas son más bajas. La implementación de esta estrategia resultó en ahorros significativos, con una reducción del costo total de energía en comparación con la tarifa monohoraria (BT5BR). Por ejemplo, en enero de 2025, el costo total de energía se redujo de S/ 3,393.26 a S/ 2,576.54, lo que representa un ahorro del 24%. Estos resultados respaldan la Hipótesis Específica 3, que plantea que la implementación de estrategias de planificación de uso de energía basadas 51 en predicciones de demanda reducirá los picos de consumo durante los horarios punta y optimizará el uso de tarifas más bajas en horarios medios y bajos. Estos hallazgos son consistentes con estudios previos que han demostrado que las tarifas diferenciadas por horarios pueden incentivar un consumo más eficiente de energía (Agencia Internacional de Energía, 2023; La República, 2023). Comparación con la Literatura Existente Los resultados obtenidos en esta investigación se alinean con estudios previos que han abordado la eficiencia energética en edificios residenciales. Por ejemplo, la identificación de patrones de consumo y la aplicación de modelos predictivos basados en machine learning han sido ampliamente documentados en la literatura (Goodfellow, Bengio, & Courville, 2016; Sarango, 2021). Sin embargo, esta investigación aporta un enfoque novedoso al aplicar estas técnicas en el contexto específico de edificios multifamiliares en Perú, donde las dinámicas de consumo pueden diferir de otros países. Adicionalmente, la implementación de un modelo de optimización de consumo en franjas horarias basado en predicciones de demanda es una contribución significativa al campo de la eficiencia energética. Este enfoque no solo permite reducir los costos para los residentes, sino que también contribuye a la sostenibilidad ambiental al disminuir la demanda durante los picos de consumo, lo que reduce la necesidad de generar energía adicional y, por lo tanto, las emisiones de carbono. 5.3. Conclusión General Los resultados de esta investigación demuestran que el uso de técnicas de ciencia de datos, como el análisis de series temporales y los modelos de machine learning, puede mejorar significativamente la eficiencia energética en edificios multifamiliares. Los hallazgos respaldan las hipótesis planteadas y ofrecen nuevas perspectivas sobre cómo optimizar el consumo de energía en contextos residenciales. Estos resultados tienen implicaciones prácticas 52 importantes, ya que no solo permiten a los residentes ahorrar en sus facturas de electricidad, sino que también contribuyen a la sostenibilidad ambiental. Los resultados también confirman que la ciencia de datos puede ser aplicada para brindar soluciones prácticas a problemas en todos los campos profesionales, se consolida como una herramienta que impulsa la transformación digital y la formación de conocimiento. De los inconvenientes y limitaciones presentados durante el desarrollo de este estudio, es necesario indicar que los modelos implementados son costosos a nivel computacional, y las herramientas disponibles en nube para el procesamiento quedaban cortas para la realización de los entrenamientos de los modelos, y luego para su aplicación, se tuvo que recurrir a utilizar procesamiento en equipos de cómputo físicos con gran capacidad de recursos de procesamiento y memoria. Los modelos implementados pueden ser mejorados en nuevas iteraciones y con la inclusión de nuevas variables que pueden hacerlos mucho más eficientes y puedan atender casuística especializada. Esto puede realizarse en nuevos estudios. 53 Conclusiones Conclusión 1: Se demuestra que se pueden aplicar técnicas de ciencia de datos para poder realizar el análisis de un gran volumen de datos históricos de consumo eléctrico, permitiendo identificar patrones y tendencias significativas, como la estacionalidad mensual, semanal y diaria. Estos patrones confirman que el consumo de energía está influenciado por factores como la hora del día, el día de la semana y el mes del año. Por lo que es posible realizar la estimación de consumos futuros en base a estos patrones. Conclusión 2: Con la implementación de modelos predictivos, en particular el modelo LSTM (Long Short-Term Memory), demostró ser altamente efectivo para predecir la demanda de energía en edificios multifamiliares, con un error absoluto medio (MAE) de 86.21, confirmando que las técnicas de machine learning, especialmente las redes neuronales recurrentes, mejoran la precisión de las predicciones de consumo de energía en comparación con métodos tradicionales como los modelos autorregresivos. Conclusión 3: El desarrollo de un modelo de optimización de consumo en franjas horarias permitió reducir los costos de energía al trasladar teóricamente el consumo a horarios de menor demanda (horario base y media). Esto resultó en ahorros significativos, demostrando que las estrategias basadas en predicciones de demanda pueden optimizar el uso de energía y reducir los costos para los residentes. Necesitando que este traslado se materialice físicamente, esto se puede lograr realizar capacitaciones a los usuarios para que puedan cambiar sus hábitos de consumo y la automatización de sus hogares. Conclusión 4: Los modelos implementados dieron resultados aceptables, sin embargo, estos quedan abiertos a seguir siendo mejorados con la inclusión de variables exógenas como cambios en las tarifas eléctricas o condiciones climáticas y otros hiperparámetros para mejorar sus índices de eficiencia. 54 Conclusión 5: la implementación de técnicas de ciencia de datos puede ser aplicable a problemas en diversos campos profesionales, el uso de estas puede manejar grandes volúmenes de datos, implementar modelos cada vez eficientes y robustos, mejor entrenados y con un aprendizaje eficiente. 55 Recomendaciones Recomendación 1: Implementación de Medidores Inteligentes: Se recomienda la instalación generalizada de medidores inteligentes en edificios multifamiliares y en viviendas familiares para facilitar el monitoreo en tiempo real del consumo de energía, esto permitirá el registro de consumos en todos los horarios y por lo tanto acceder a las tarifas con diferenciación en franjas horarias que ofrecen precios menores. Recomendación 2: Educación y Concientización: Es fundamental capacitar a los residentes sobre los beneficios de ajustar sus hábitos de consumo a las franjas horarias más económicas. Esto podría lograrse a través de campañas de concientización, campañas de incentivos y programas de capacitación intensivos. Recomendación 3: Automatización de Hogares: Los resultados indican que si se migran los consumos de energía a franjas horarias más económicas se pueden reducir costos, esto se puede lograr automatizando los hogares, con aparatos programables, focos led inteligentes y otros aparatos que permitan su programación para que su funcionamiento se traslade a horarios más adecuados. Recomendación 4: Replicación del Modelo en Otras Regiones: Teniendo en cuenta que es posible el desarrollo e implementación del modelo predictivo y de optimización, se recomienda replicar este enfoque en otras regiones de Perú y en otros países con contextos similares. 56 Recomendación 5: Investigación Futura: Se sugiere realizar estudios adicionales para explorar el impacto de factores externos, como cambios normativos en las tarifas eléctricas o las condiciones climáticas impactadas por el calentamiento global, en los patrones de consumo de energía. También, se podría investigar la integración de fuentes de energía renovable en los edificios multifamiliares para mejorar aún más la eficiencia energética. 57 Referencias • Alemania en tu idioma. (2024). Precio de la luz en Alemania: evolución y comparación en 2024. Recuperado de alemaniaentuidioma.com • AutoSolar Perú. (2023). Consumo energético familiar en Perú. Recuperado de Reducir el consumo eléctrico familiar | AutoSolar Perú • Agencia Internacional de Energía. (2023). Eficiencia energética y ciencia de datos: el binomio imprescindible. Recuperado de Agencia Internacional de Energía • Box, G. E. P., Jenkins, G. M., & Reinsel, G. C. (2015). Time Series Analysis: Forecasting and Control. Wiley. • Creswell, J. W. (2014). Research Design: Qualitative, Quantitative, and Mixed Methods Approaches. Sage Publications. • Cronbach, L. J. (1951). Coefficient alpha and the internal structure of tests. Psychometrika, 16(3), 297-334. • Energy Efficiency Movement. (2021). Eficiencia Energética de Edificios Inteligentes. Recuperado de Energy Efficiency Movement. • Fernando, M. T. (2020). Modelo para el pronóstico de la demanda de energía eléctrica de EMELNORTE S.A - IBARRA aplicando redes neuronales artificiales. (Tesis). Universidad Técnica del Norte, Ecuador • Gana Energía. (2021). El precio de la luz en Europa: cuánto se paga de electricidad por países. Recuperado de ganaenergia.com • Goodfellow, I., Bengio, Y., & Courville, A. (2016). Deep Learning. MIT Press. • González, M. (2021). Optimización del Consumo Energético en Edificios Multifamiliares en Lima. Universidad Nacional de Ingeniería. • Hernández, R., Fernández, C., & Baptista, P. (2014). Metodología de la investigación. McGraw-Hill. • International Energy Agency. (2023). Energy Efficiency 2023. Recuperado de IEA. • Kerlinger, F. N., & Lee, H. B. (2002). Foundations of Behavioral Research. Wadsworth. • Levy, P. S., & Lemeshow, S. (2013). Sampling of Populations: Methods and Applications. Wiley. https://autosolar.pe/ahorro-de-energia/consumo-energetico-familiar-en-peru https://baobabsoluciones.es/blog/2023/12/11/eficiencia-energetica-ciencia-de-datos/ https://baobabsoluciones.es/blog/2023/12/11/eficiencia-energetica-ciencia-de-datos/ https://ganaenergia.com/blog/precio-luz-europa/ 58 • La República. (2023). Usuarios empezarán a pagar por horarios diferenciados en sus recibos de luz. Recuperado de La República. • Martínez, L. (2020). Eficiencia energética en viviendas sociales en Arequipa. Universidad Católica de Santa María. • OLADE. (2021). Precios de la energía en América Latina y el Caribe. Informe anual abril 2021. Recuperado de OLADE. • Organización Latinoamericana de Energía (OLADE). (2021). Precios de la energía en América Latina y el Caribe. Informe anual abril 2021. Recuperado de olade.org • OSINERGMIN. (2020). Encuesta Residencial de Consumo y Usos de Energía 2019-2020. Recuperado de gob.pe/osinergmin • Sarango, C. A. V. (2021). Gestión y Optimización del Consumo de Energía Eléctrica Residencial Usando Series de Tiempo. Universidad Politécnica Salesiana. Recuperado de UPS. • Thaler, R. H., & Sunstein, C. R. (2008). Nudge: Improving Decisions About Health, Wealth, and Happiness. Yale University Press. • Vaca Serrano, J. M., & Kido Cruz, A. (2021). Estrategia de eficiencia en el consumo de energía eléctrica y mitigación en la estructura productiva de México. Contaduría y Administración, 66(2). Recuperado de SciELO. • Yin, R. K. (2018). Case Study Research and Applications: Design and Methods. Sage Publications. https://larepublica.pe/economia/2023/06/10/usuarios-empezaran-a-pagar-por-horarios-diferenciados-en-sus-recibos-de-luz-osinergmin-148510 59 ANEXOS ANEXO I Códigos utilizados en el modelo de estimación 60 61 62