El concepto de aprendizaje automático surge en la década de los 50. En el artículo “Computing Machinery and Intelligence” publicado por Alan Turing se introduce la discusión sobre la capacidad de las máquinas para aprender; no obstante, no se hará popular hasta la década de los 90.
La tecnología de gemelos digitales utiliza algoritmos de machine learning para procesar grandes cantidades de datos e identificar patrones de datos. Gracias a herramientas basadas en el método de elementos finitos (MEF) y en la mecánica de fluidos computacional (CFD), es posible replicar de forma precisa diferentes procesos en equipos y componentes de las plantas industriales, permitiendo tanto la evaluación del proceso en sí desde un punto de vista operacional, como la evaluación del comportamiento térmico- estructural de los equipos.
Si nos centramos en el caso concreto de un gemelo digital, el primer paso del proceso de aprendizaje automático supervisado consiste en la recopilación de datos reales de operación procedentes de planta que contengan fenómenos relevantes desde el punto de vista operacional del componente (eventos de operación normal, paradas, puestas en marcha, upset, etc) para asegurar que el gemelo virtual ofrece una representación virtual fidedigna y que, por tanto, las predicciones sobre el modelo real sean lo suficientemente precisas.
En este proceso es fundamental contar con herramientas como el uso de Big Data para proporcionar potencia, capacidad de almacenaje y análisis de datos para poder manejar el gran volumen de datos que puede llegar a generarse, teniendo en cuenta la inmensa cantidad de señales que poder ser necesario procesar en cada TAG de un equipo y que en ocasiones puede requerir una precisión minutal de las señales procedentes de planta.
Una vez seleccionados los datos de partida es necesario preprocesarlos eliminando posibles ruidos, así como señales anómalas.
Esta selección de datos recopilados se utiliza en simulaciones numéricas en las que se irá alimentando el modelo de cálculo gemelo. En este proceso es fundamental el correcto ajuste del modelo de cálculo para minimizar la diferencia entre las predicciones y las respuestas reales del equipo.
Por otro lado, es importante validar y ajustar el modelo de cálculo utilizando una serie de datos reales adicionales no incluidos en el paquete inicial de datos de aprendizaje hasta que el modelo quede completamente validado. Este ciclo de validación y ajuste es un proceso iterativo y continuo, ya que el modelo puede necesitar actualizarse con nuevos datos para adaptarse a cambios que puedan implementarse en el equipo desde el punto de vista operacional.
Gracias a los recursos de súper computación disponibles hoy en día, ha sido posible reducir los tiempos de cálculo de las simulaciones necesarias para el aprendizaje del modelo, lo cual permite una integración y desarrollo real.
La combinación del gemelo digital y el machine learning proporciona una potente herramienta. La posibilidad de monitorizar de forma continuada los activos más críticos mediante la implementación de un gemelo digital que permite la implantación de un mantenimiento predictivo basado en anticipación y detección de posibles fallos del equipo, la cuantificación de la vida remanente, así como el daño por ciclos de operación, la identificación de patrones de comportamiento no eficientes y, por tanto, la optimización operacional del equipo en cuestión.
En CADE somos plenamente conscientes de que la implantación del gemelo digital en plantas y refinerías es una de las claves para la transformación de los procesos industriales actuales y es uno de los pasos que habrá que ejecutar en el proceso de transición energética como punto de mejora de la eficiencia energética.
En el contexto del gemelo digital, saber sacar partido a los datos operacionales disponibles es sinónimo de reducción de costes y de optimización. Nuestra presencia en plantas industriales a lo largo de los años junto con una amplia experiencia en procesos industriales nos ha permitido adquirir un know-how clave en el manejo e interpretación de los datos operacionales necesarios para la alimentación de los algoritmos del machine learning.
Todo esto sumado a nuestro reconocido expertise en el área de la simulación avanzada y los recursos de supercomputación propios, nos sitúa como referentes a la hora de desarrollar e implantar gemelos digitales.
En CADE no solo somos capaces de generar los modelos de cálculo precisos y eficientes necesarios para reproducir las réplicas virtuales e implementar el aprendizaje automático, sino que también, gracias a nuestra dilatada experiencia en cálculos por elementos finitos y análisis fluidodinámicos, tenemos la capacidad de calibrar y ajustar dichos modelos, asegurando por tanto el desarrollo de gemelos digitales fiables.