Por Jeffrey Renaud, Universidad de Western Ontario
Lunes 04 de mayo de 2020
Utilizando el aprendizaje automático, un equipo de científicos informáticos y biólogos occidentales ha identificado una firma genómica subyacente para 29 secuencias de ADN COVID-19 diferentes.
Esta nueva herramienta de descubrimiento de datos permitirá a los investigadores clasificar rápida y fácilmente un virus mortal como COVID-19 en solo minutos, un proceso y un ritmo de gran importancia para la planificación estratégica y la movilización de necesidades médicas durante una pandemia.
El estudio también apoya la hipótesis científica de que COVID-19 (SARS-CoV-2) tiene su origen en murciélagos como Sarbecovirus, un subgrupo de Betacoronavirus.
Los hallazgos, Aprendizaje automático con firmas genómicas intrínsecas para la clasificación rápida de nuevos patógenos: estudio de caso COVID-19, se publicaron hoy en PLOS ONE.
El sistema de clasificación "ultrarrápido, escalable y altamente preciso" utiliza un nuevo software especializado basado en gráficos y un enfoque de árbol de decisiones para ilustrar la clasificación y llegar a la mejor opción entre todos los resultados posibles. Todo el método utiliza un nuevo software especializado basado en gráficos para ilustrar la mejor opción entre todos los resultados posibles probados.
La profesora de biología Kathleen Hill co-dirigió el estudio con colaboradores occidentales en Ciencias de la Computación y Ciencias Estadísticas y Actuariales, junto con otros en el Departamento de Computación de la Universidad de Waterloo.
El método de aprendizaje automático logra una clasificación 100 por ciento precisa de las secuencias COVID-19 y, lo que es más importante, descubre las relaciones más relevantes entre más de 5,000 genomas virales nuevamente en minutos.
"Todo lo que necesitábamos era la secuencia de ADN de COVID-19 para descubrir su propio patrón de secuencia intrínseca. Utilizamos ese patrón característico y un enfoque lógico para hacer coincidir ese patrón lo más cerca posible de otros virus y logramos un buen nivel de clasificación en minutos, no días, no horas sino minutos ", dijo Hill.
Esta herramienta de clasificación ya se ha utilizado para analizar más de 5,000 secuencias genómicas virales únicas, incluidas las 29 secuencias COVID-19 disponibles el 27 de enero.
Hill cree que la herramienta, que puede clasificar cualquier secuencia de virus COVID-19 descubierta recientemente o de otra manera, será un componente esencial en el conjunto de herramientas para desarrolladores de vacunas y medicamentos, trabajadores de atención médica de primera línea, investigadores y científicos durante esta pandemia global y más allá.
TEMAS RELACIONADOS: