Nuevo modelo recupera información 3D de imágenes y vídeos borrosos

Un modelo CNN con machine learning podría permitir obtener información 3D de formatos en 2D como imágenes o rayos X

Investigadores del MIT desarrollaron un modelo con la capacidad de recuperar información 3D de imágenes y videos borrosos con aplicaciones a la medicina

Investigadores del Instituto Tecnológico de Massachusetts (MIT) desarrollaron un modelo con la capacidad de recuperar información de imágenes y videos mal tomadas o borrosas con lo que podría llegar a obtenerse información 3D de formatos 2D.

Un grupo de investigadores presentará su modelo desarrollado en la International Conference of Computer Vision 2019 que tiene por fechas del 27 de octubre al 2 de noviembre en Seúl, Corea.

La obtención de imágenes o videos, en términos más técnicos información visual, confronta diferentes dimensiones del tiempo y el espacio en una o dos, el resultado es llamado proyección, lo que provoca borrones de objetos moviéndose a gran velocidad.

"En todos estos casos, la información visual tiene una dimensión, en tiempo o espacio, que se pierde por completo", dijo Guha Balakrishnan, investigador postdoctoral en el Laboratorio de Ciencias Computacionales e Inteligencia Artificial (CSAIL) del MIT y uno de los autores de la investigación, "si podemos recuperar esa dimensión perdida, puede tener muchas aplicaciones importantes", agregó.

Como resultado de la investigación surgió un modelo de "deproyección visual" donde una red neuronal aprende los patrones que encajan las proyecciones con dimensiones bajas a las originales con dimensiones altas. Con cada nueva proyección, los aprendizajes obtenidos en el proceso anterior son utilizados para el siguiente proceso.

El modelo, basado en una red neuronal convolucional (CNN),en sus primeras fases tenía que prestar especial atención a los pixeles en las imágenes, pues la cámara toma el valor promedio de los píxeles al capturar el movimiento y con las alturas y anchos de una imagen fija ocasiona la creación de imágenes desenfocadas.

Al ofrecer miles de datos de proyecciones con ciertos datos de dimensiones altas y gracias a machine learning, el modelo CNN aprendió a reconocer las proyecciones con las posibles fuentes de dimensiones altes o "señales", lo que hace posible la recreación de las imágenes borrosas a como eran en original.

Lo más destacado del trabajo, aparte del gran avance que implicó la creación del modelo CNN, son las aplicaciones a futuro. Si retomar información 3D de imágenes en 2D es posible con el modelo propuesto, los investigadores encargados tienen en mente usar esta tecnología para la medicina.

Actualmente la tecnología de imágenes 2D en medicina, como los rayos X, están perdiendo terreno contra imágenes anatómicas en 3D como la tomografía computarizada (CT) en países desarrollados. Sin embargo, se tratan de escaneos muy caros que la mayoría de la población no puede pagar.

De resultar exitoso el modelo CNN del MIT, zonas y población que no tienen acceso a CTu otros métodos parecidos podrían obtener información anatómica en 3D a partir de las imágenes 2D ya disponibles como los rayos X.