Spain Brazil Russia France Germany China Korea Japan

Artificial Intelligence driven Marketing Communications

 
Mar 30, 2018 11:00 AM ET

La computadora busca datos del telescopio para evidencia de planetas distantes


La computadora busca datos del telescopio para evidencia de planetas distantes

iCrowd Newswire - Mar 30, 2018
debris disk around sun-like star, illustration

Los discos de escombros alrededor de las estrellas son buenos indicadores de exoplanetas.

Crédito: Jet Propulsion Laboratory

Como parte de un esfuerzo para identificar planetas distantes y hospitalarios para la vida, la NASA ha establecido un proyecto de colaboración colectiva en el que los voluntarios buscan imágenes telescópicas para detectar la presencia de discos de escombros alrededor de las estrellas, que son buenos indicadores de exoplanetas.

Utilizando los resultados de ese proyecto, los investigadores del MIT ahora han entrenado un sistema de aprendizaje automático para buscar discos de escombros. La escala de la búsqueda exige automatización: hay casi 750 millones de posibles fuentes de luz en los datos acumulados a través de la misión de exploración amplia de campo infrarrojo de la NASA (WISE) sola.

En las pruebas, el sistema de aprendizaje automático estuvo de acuerdo con las identificaciones humanas de los discos de desechos el 97 por ciento de las veces. Los investigadores también entrenaron su sistema para clasificar los discos de desechos de acuerdo con su probabilidad de contener exoplanetas detectables. El trabajo se describe en “Descubrimiento asistido por computadora de candidatos a discos de desechos: un estudio de caso que utiliza el catálogo Wide-Field Infrared Survey Explorer (WISE)”, publicado en la revista Astronomy and Computing . Los investigadores del MIT informan que su sistema identificó 367 objetos celestes previamente no examinados como candidatos particularmente prometedores para estudios posteriores.

El trabajo representa un enfoque inusual para el aprendizaje automático, que ha sido defendido por uno de los coautores del trabajo, Victor Pankratius , un investigador científico principal en Haystack Observatory del MIT. Típicamente, un sistema de aprendizaje automático analizará una gran cantidad de datos de entrenamiento, buscando correlaciones consistentes entre las características de los datos y algunas etiquetas aplicadas por un analista humano, en este caso, estrellas rodeadas por discos de desechos.

Pero Pankratius sostiene que, en las ciencias, los sistemas de aprendizaje automático serían más útiles si incorporaran explícitamente un poco de conocimiento científico, para ayudar a guiar sus búsquedas de correlaciones o identificar desviaciones de la norma que podrían ser de interés científico.

“La visión principal es ir más allá de lo que AI se está enfocando hoy”, dice Pankratius. “Hoy, estamos recopilando datos, y estamos tratando de encontrar funciones en los datos. Terminas con miles de millones de funciones. Entonces, ¿qué estás haciendo con ellos? Lo que quieres saber como científico no es eso la computadora te dice que ciertos píxeles son ciertas características. Quieres saber ‘Oh, esto es algo físicamente relevante, y aquí están los parámetros físicos de la cosa’ “.

Concepción del aula

El nuevo documento surgió de un seminario de MIT que Pankratius co-enseñó con Sara Seager , la Clase de 1941 Profesora de Ciencias de la Tierra, la Atmósfera y Planetarias, que es conocida por su investigación de exoplanetas. El seminario, Astroinformática para Exoplanetas , introdujo a los estudiantes a las técnicas de ciencia de datos que podrían ser útiles para interpretar la avalancha de datos generados por los nuevos instrumentos astronómicos. Después de dominar las técnicas, se les pidió a los estudiantes que las aplicaran a preguntas astronómicas sobresalientes.

Para su proyecto final, Tam Nguyen , estudiante de posgrado en aeronáutica y astronáutica, eligió el problema de entrenar un sistema de aprendizaje automático para identificar discos de desechos, y el nuevo documento es una consecuencia de ese trabajo. Nguyen es la primera autora del artículo, y se le une Seager, Pankratius y Laura Eckman , una licenciatura en ingeniería eléctrica y ciencias de la computación.

Del proyecto de crowdsourcing de la NASA, los investigadores tenían las coordenadas celestes de las fuentes de luz que los voluntarios humanos habían identificado como discos de desechos. Los discos son reconocibles como elipses de luz con elipses ligeramente más brillantes en sus centros. Los investigadores también utilizaron los datos astronómicos en bruto generados por la misión WISE.

Para preparar los datos para el sistema de aprendizaje automático, Nguyen lo dividió en pequeños trozos, luego utilizó técnicas de procesamiento de señal estándar para filtrar los artefactos causados ​​por los instrumentos de imagen o por la luz ambiental. Luego, ella identificó esos trozos con lOcho fuentes en sus centros, y utilizaron algoritmos de segmentación de imágenes existentes para eliminar cualquier fuente adicional de luz. Este tipo de procedimientos son típicos en cualquier proyecto de aprendizaje de máquina de visión por computadora.

Intuiciones codificadas

Pero Nguyen usó los principios básicos de la física para podar más los datos. Por un lado, observó la variación en la intensidad de la luz emitida por las fuentes de luz a través de cuatro bandas de frecuencia diferentes. Ella también usó métricas estándar para evaluar la posición, simetría y escala de las fuentes de luz, estableciendo umbrales para su inclusión en su conjunto de datos.

Además de los discos de desechos etiquetados del proyecto de crowdsourcing de la NASA, los investigadores también tenían una breve lista de estrellas que los astrónomos habían identificado como probablemente anfitriones de exoplanetas. A partir de esa información, su sistema también dedujo las características de los discos de desechos que se correlacionaron con la presencia de exoplanetas, para seleccionar los 367 candidatos para un estudio posterior.

“Teniendo en cuenta los desafíos de escalabilidad con big data, aprovechar el crowdsourcing y la ciencia ciudadana para desarrollar conjuntos de datos de capacitación para clasificadores de aprendizaje automático para observaciones astronómicas y objetos asociados es una forma innovadora de abordar desafíos no solo en astronomía sino también en varias áreas científicas diferentes “, dice Dan Crichton , quien dirige el Centro de Ciencia y Tecnología de Datos en el Laboratorio de Propulsión a Chorro de NAASA. “El uso del conducto de descubrimiento asistido por computadora que se describe para automatizar el proceso de extracción, clasificación y validación va a ser útil para sistematizar cómo se pueden reunir estas capacidades. El documento hace un buen trabajo al discutir la efectividad de este enfoque como aplicado a los candidatos de discos de escombros. Las lecciones aprendidas serán importantes para generalizar las técnicas a otras aplicaciones de astronomía y disciplinas diferentes “.

“El equipo científico de Disk Detective ha estado trabajando en su propio proyecto de aprendizaje automático, y ahora que este documento está listo , vamos a tener que unirnos y comparar notas”, dice Marc Kuchner , astrofísico senior en el Goddard Space de la NASA. Flight Center y líder del proyecto de detección de disco crowdsourcing conocido como Disk Detective. “Estoy muy contento de que Nguyen esté investigando esto porque realmente creo que este tipo de cooperación máquina-humano será crucial para analizar los grandes conjuntos de datos del futuro”.

See Campaign: http://cacm.acm.org/careers/226511-computer-searches-telescope-data-for-evidence-of-distant-planets/fulltext
Contact Information:
MIT News

Tags:
, Artificial Intelligence Newswire, Wire, United States, Spanish

image




iCrowdNewswire

Tags:    News