UNA TESIS DE LA ULL CREA UNA HERRAMIENTA CON IA PARA APOYAR EL DIAGNÓSTICO DE TEA CON SEGUIMIENTO OCULAR

Universidad-de-La-Laguna-logotipo-1

El Trastorno del Espectro Autista (TEA) engloba un conjunto de afecciones relacionadas con el desarrollo neurológico, que se manifiestan en dificultades en la interacción social y la comunicación, así como en patrones atípicos de comportamiento. Entre estos últimos se incluyen problemas para hacer frente a los cambios o respuestas inusuales a estímulos sensoriales. Según la Organización Mundial de la Salud (OMS), aproximadamente uno de cada 100 niños vive con TEA. 

Las características propias de este trastorno pueden identificarse desde la primera infancia. Sin embargo, en muchos casos, el diagnóstico no se realiza hasta etapas más avanzadas del desarrollo. Actualmente, la detección del TEA se basa principalmente en la observación conductual y en entrevistas estructuradas, como la Escala de Observación para el Diagnóstico del Autismo (ADOS). Estas herramientas, aunque ampliamente utilizadas, dependen en gran medida del criterio subjetivo del profesional.

En este sentido, una tesis doctoral defendida recientemente en la Universidad de La Laguna por Roberto Chávez Trujillo, graduado en Ingeniería Electrónica y doctor en Ingeniería de Sistemas y Automática, ha dado lugar al desarrollo de una herramienta de apoyo al diagnóstico basada en el análisis de datos de seguimiento ocular (eye tracking) y en el entrenamiento de un algoritmo de inteligencia artificial (IA) capaz de determinar si los patrones visuales de una persona corresponden a un grupo de diagnóstico de autismo. La propuesta busca ofrecer un instrumento más objetivo que complemente los métodos tradicionales en la identificación de TEA.

Con un diagnóstico precoz, las personas con TEA pueden acceder a estrategias de intervención psicopedagógicas y conductuales que mejoran significativamente su calidad de vida. “El análisis de datos a través del seguimiento ocular es una herramienta muy interesante, ya que está demostrado que los patrones visuales de las personas con TEA presentan alteraciones desde aproximadamente los seis meses de edad y pueden registrarse mediante esta técnica”, señala Chávez Trujillo. 

El investigador comenzó a interesarse por áreas como la ciencia de datos, el machine learning y la IA durante el Máster en Ingeniería Industrial. “Fue mi tutora del Trabajo de Fin de Máster, Rosa Aguilar Chinea, catedrática del Departamento de Ingeniería Informática y de Sistemas, quien me comentó la idea de realizar una tesis en torno a la aplicación de técnicas de IA como apoyo al diagnóstico”. Así realizó la transición del ámbito de la electrónica al campo de la informática, desarrollando una tesis dirigida por la catedrática.

Aprendizaje automático

El proceso de trabajo de la tesis fue arduo. En su etapa inicial, se realizó un procesamiento de datos bastante complejo, ya que el eye-tracking devuelve una cantidad enorme de valores. “Recogíamos muestras cada tres milisegundos aproximadamente, y cada muestra contaba con más de 100 variables”, afirma. “Todo eso requiere un procesamiento y análisis de datos que no es posible hacer mediante las técnicas de estadística clásica”, sostiene. En todo este proceso, la ciencia de datos toma un papel relevante, ya que extrae patrones a partir de grandes volúmenes de información.

Luego de eso, la siguiente etapa consistió en emplear algoritmos de aprendizaje automático. “No tanto de deep learning, porque la cantidad de sujetos con la que contábamos al principio no era lo suficientemente grande como para desarrollar un modelo basado en redes neuronales”, explica. Por eso, se optó por modelos más clásicos. En concreto, se utilizó el modelo XGBoost, una técnica que combina modelos más simples y, al juntarlos, ofrece un rendimiento mejor que si se usaran por separado.

“Gracias a este modelo logramos una buena exactitud en la clasificación muestral”, afirma. “Al realizar esta clasificación de forma individual, agregando cada una de las muestras, conseguimos clasificar correctamente al 100% de los sujetos en el conjunto de test. Hay que tener en cuenta que, cuando vas a utilizar un algoritmo de aprendizaje automático, hay que dividir el conjunto de datos en tres partes: una para entrenamiento, otra para validación y otra para testeo”, afirma. Primero se entrena el modelo, luego se ajusta y prueba su rendimiento y finalmente se evalúa con el conjunto de test. “Esta última evaluación permite tener una visión imparcial y no sesgada de cómo se comportaría el modelo con datos reales”, señala. 

Por último, se desarrolló una página web de estilo plug and play que simplifica el proceso de diagnóstico. “Se extrae el fichero de datos del eye-tracker, y sin que el usuario tenga que realizar ningún tipo de procesamiento, simplemente lo carga en la página web”, explica. “Esta se encarga automáticamente de ejecutar todos los pasos para ofrecer un diagnóstico para cada uno de los individuos incluidos en el fichero”. De este modo, la página web permite que personas sin conocimientos técnicos, sin experiencia en programación o sin formación en ingeniería puedan obtener un diagnóstico de forma sencilla.

Conclusiones

La literatura científica ya señalaba la existencia de patrones de exploración visual distintivos o atípicos en las personas con TEA frente a las personas neurotípicas. En la tesis se han aprovechado estos patrones diferenciales para registrar su comportamiento mientras visualizaban una serie de imágenes seleccionadas para poner de manifiesto estas diferencias. Así, a partir de estos patrones, se desarrolló el algoritmo de aprendizaje automático. Paralelamente, en cuanto al aspecto más técnico, se desarrolló una librería de código en Python, de carácter open source. “Está disponible para desarrolladores o investigadores que trabajen en el ámbito del eye-tracking”, expone.

En la segunda parte del estudio, se amplió la muestra de datos. “Los resultados fueron algo más heterogéneos”, señala. “Eran más de 100 sujetos y surgieron otra serie de retos para los que se propusieron diversas soluciones”, indica. “Al reentrenar los algoritmos con estos nuevos sujetos, el rendimiento del modelo descendió considerablemente”, cuenta. Así, para solucionar este problema, Chávez Trujillo desarrolló varias técnicas analíticas para tratar de encontrar estos sujetos atípicos dentro del conjunto TEA. Una de las técnicas consistió en analizar sus patrones de parpadeo, así como el tamaño de la pupila, entre otros aspectos. “Otra técnica supuso analizar la secuencia de exploración, es decir, los puntos por los que iba pasando la mirada”, cuenta. 

Este análisis se realizó por pares de individuos. TEA con TEA, controles con controles y controles con TEA. “Al final, se pudo extraer una puntuación de similitud entre sus patrones de exploración visual, y en base a eso, se pudo detectar que los patrones concretos de algunos individuos eran muy distintos a los del resto de su grupo”, explica. 

Chávez Trujillo señala que los datos fueron aportados por el profesor José Luis González Mora, catedrático y responsable del grupo de investigación del Laboratorio de Neuroquímica y Neuroimagen de la Universidad de La Laguna. En un primer momento, estos datos fueron trabajados por Chávez Trujillo y su directora, Aguilar Chinea, si bien, más adelante, el autor de la tesis se incorporó a dicho grupo, lo que le permitió acceder a una segunda muestra, más amplia. Todos los datos fueron obtenidos gracias al equipamiento disponible en el grupo de investigación.