Por Jorge Vergara, investigador postdoctoral MAS y del Depto. de Ing. Eléctrica UChile. 

Para el año 2022 se espera la puesta en marcha del Large Synoptic Survey Telescope (LSST), el mayor telescopio gran angular del mundo, que estará ubicado en el cerro Pachón, IV región, Chile. La puesta en marcha del LSST dará  inicio a una nueva era en astrofísica, ya que el procesamiento de imágenes y datos en tiempo real llevará al límite de sus capacidades a los actuales sistemas de procesamiento de datos. El LSST propone estudiar el cielo visible repetidamente 1000 veces durante un periodo de 10 años, creando 100 petabytes en archivos de imágenes y 20 petabytes de bases de datos para propósitos de investigación. El análisis automático de este gran volumen de datos impone desafíos en muchas áreas, entre ellos los algoritmos de machine learning, los cuales deben ser resueltos antes de la puesta en operación del LSST.

Actualmente, uno de los módulos desarrollados para el LSST, el Moving Object Pipeline System (MOPS), tiene como objetivo detectar e identificar trayectorias de asteroides. El sistema MOPS analiza las trayectorias para cada uno de los posibles candidatos a asteroides. Sin embargo, el ruido inherente en las imágenes genera una gran cantidad de falsos positivos y hace que la cantidad de candidatos sea muy alta. Esto implica un incremento del costo computacional de MOPS y dificulta el análisis en tiempo real.

En el MAS, en conjunto con el equipo del LSST de la Universidad de Washington, investigamos nuevas estrategias para optimizar el proceso MOPS en tiempo real.  Dentro de las estrategias para reducir la cantidad de datos en el proceso, trabajamos con el análisis no supervisado de imágenes y curvas de luz. En nuestro estudio  propusimos una metodología que permite reducir la cantidad de datos mediante una apropiada agrupación de estos y, al mismo tiempo,  identificar la dinámica que genera el evento bajo estudio. Por otro lado, dentro de las estrategias para crear y seleccionar las características más relevantes que discriminan entre asteroides y no-asteroides, trabajamos en la detección e identificación de grupos sinérgicos de características utilizando teoría de la información. En nuestras actuales investigaciones de estas estrategias, hemos encontrado que la identificación de grupos de características sinérgicas mejora el desempeño y clasificación entre asteroides y no-asteroides, y a la vez nos permite comprender cuáles de ellas son las que dominan en cada clase.

Visualización de las 20 características más relevantes (de un total de 200 características) obtenidas de imagenes de asteroides/no-asteroides de tamaño de 20×20 pixeles. La imagen fue generada utilizando la técnica de proyección llamada T-Distributed Stocastic Neighbor Embedding (T-SNE)