La ciencia de datos y el machine learning contra el COVID-19
19 junio 2020Hace unos días tuve la ocasión de dar un webinar gracias a la asociación Women in Big Data. Primero de todo me gustaría agradecer el papel que tiene la asociación en la ayuda para dotar de más diversidad al sector de la ciencia de datos y el big data.
El objetivo de la charla fue el de hacer un análisis desde una perspectiva más objetiva basada en datos y contar diversas iniciativas sobre cómo ayudar en esta pandemia. Yo mismo, previamente al confinamiento realicé un dashboard de seguimiento del COVID. Creo que el sector de la ciencia de datos, ahora más que nunca puede ayudar a la sociedad.
En este post quiero hacer una recopilación de casos de uso en los que las aplicaciones de ciencia de datos y el aprendizaje automático están ayudando o pueden ayudar con todos los efectos derivados de un virus que tanto nos está impactando en nuestras vidas.
Aplicaciones púramente médicas:
Visualización de datos
Una de las formas más evidentes y sencillas, pero no por ello menos importantes se trata de la concienciación de la sociedad. Llevando a cabo análisis de datos, dashboards, etc es posible informar sobre la situación de la pandemia. Son unas herramientas útiles para las personas ya que siempre es bueno saber la situación real de cara a tomar nuestras propias decisiones (o intentarlo al menos). Yo antes del confinamiento hice uno de los primeros dashboards de seguimiento sobre el COVID en España. Podéis verlo en el siguiente link. Ahora hay dashboards bastante mejores, estando algunos muy bien elaborados.
Algunos de los dashboard más útiles de la actualidad son:
- Dashboard oficial del Ministerio de Ciencia e Innovación
- Dashboard de la Universidad Johns Hopkins
- Dashboard del proyecto Nextstrain
Predicción de la evolución de la pandemia
En la ciencia de datos denominamos forecasting a la predicción de tendencias futuras. Para realizar estas predicciones se están utilizando modelos muy diversos. Existen modelos que intentan predecir la evolución de la curva utilizando algoritmos de aprendizaje automático como las redes neuronales o series temporales bayesianas. Sin embargo, los que más exito están teniendo son los modelos epidemiológicos. Uno de estos modelos es el que se denomina modelo SIR.
En el modelo SIR se supone que existen tres tipos de personas en toda la población:
- Los que son susceptibles de tener la infección (no tienen inmunidad)
- Los que están infectados
- Los que se han recuperado y, por tanto, son inmunes
Existen una serie de transiciones entre los tres estados. Se necesita conocer tres parámetros como base:
- La probabilidad de encontrarse con un infectado en un día
- La probabilidad de que una persona infecte a otra
Para la exposición en la asociación Women in Big Data realicé un análisis de escenarios utilizando un modelo denominado como SIR-D. El modelo es muy similar al modelo SIR, con la única diferencia de que existe otro estado, que es el de los fallecidos. El modelo SIR es correcto en enfermedades con una mortalidad casi cero, no así en el COVID. El análisis de escenarios fue el siguiente:
- En un escenario suponía una desescalada en la que todas las personas podrían salir a la calle
- En el otro escenario suponía una desescalada en la que se iba abriendo parcialmente, en función de la edad. Primero se abriría a las personas más jóvenes (menor tasa de mortalidad) y luego a las más mayores.
Básicamente lo que hice fue coger la pirámide poblacional de España, aplicar las correspondientes tasas de mortalidad por franjas de edad y simular con el modelo SIR-D. Lo que obtuve fue muy interesante, ya que, al desconfinar por edades la mortalidad pasaba a reducirse casi en seis veces. En ambos casos el objetivo era buscar la inmunidad de grupo, pero en uno de los casos el coste de las medidas era mucho menor.
En esta figura podéis ver el resultado de desconfinar a todas las personas de golpe. Se suponían varias hipótesis de partida como que la tasa de contagio era similar a antes del confinamiento.
En la siguiente figura veis los resultados del desconfinamiento por edades. Los jóvenes «lucharían» por la inmunidad de grupo, protegiendo de esta forma a las personas más mayores.
Estos son sólo uno de los ejemplos con los que se puede intentar preveer la evolución de la pandemia.
Tratamiento y diagnóstico de la enfermedad
El último bloque sería el del tratamiento de la enfermedad y su diagnostico.
En cuanto al tratamiento de la enfermedad, existen campos como el denominado Drug Repurposing, cuyo objetivo es encontrar compuestos químicos comercialmente disponibles que tengan potencial para tratar nuevas infecciones. Este campo ha tenido visibilidad en la pandemia del covid y ha habido numerosas iniciativas destinadas a saber qué medicamentos de los actuales pueden comportarse mejor. Gracias a los datos de las enfermedades y las composiciones químicas de los medicamentos se han obtenido correlaciones y algoritmos que pretendar relacionar la respuesta de cada virus a cada medicamento.
Por otro lado, se encuentra la parte de diagnóstico. En el diagnóstico están teniendo especial importancia los algoritmos de Computer Vision basados en redes neuronales convolucionales. Con estos algoritmos es posible detectar la presencia de neumonía bilateral en los pulmones. Un ejemplo de esta clase de sistema os lo muestro en la siguiente imagen.
Aplicaciones para mejorar la gestión:
Además de aplicaciones destinadas al tratamiento de la enfermedad, al análisis y al forecasting existen distintas aplicaciones cuyo objetivo es el de mejorar la gestión de recursos ante picos de demanda. En este caso, ha existido una inmensa demanda hacia los hospitales, pudiendo llegar a saturarse.
Para ello han surgido aplicaciones como las siguientes:
- Gestión de las camas de UCI: estos algoritmos pretenden preveer la demanda de camas de UCI originadas por enfermos graves y cuadrarla con la oferta de camas que tienen los hospitales. Los modelos de predicción de la evolución de la pandemía, así como los modelos de gestión de stocks han sido muy útiles en este cometido.
- Prevención de contagios: por medio de unos modelos estadísticos de grafos, es posible obtener la probabilidad de que una persona esté contagiada por Covid. Esto se realiza en función a todos sus contactos más cercanos y sirve para anticiparnos al virus.
Estos son sólo uno de los ejemplos, pero hay muchas más iniciativas que se están llevando a cabo actualmente. Espero que os haya parecido curiosa alguna de las aplicaciones. A mi hubo alguna que la encontré muy interesante y me parecen muy buenas ideas.
En el siguiente enlace os dejo la presentación del webinar, para los que no lo visteis:
Presentación análisis COVID-19
¿Conoces alguna aplicación más que se haya usado o esté usándose? ¿Has realizado algún proyecto o análisis sobre el tema? Déjanos un comentario 🙂
Si te ha sido de utilidad este post, te agradecería que me apoyases en Patreon (donando una cantidad aunque sea poca ya sea una vez, o apoyándome mensualmente). Tener una web, dominio, hosting, no es gratis y me apoyas a seguir ayudando con la difusión de educación libre. Apóyame en Patreon! Mil gracias!!
¿Te ha parecido útil este artículo?