Una Inteligencia Artificial descubre más de 70,000 nuevos virus de ARN desconocidos
A través de un programa llamado LucaProt, que utiliza inteligencia artificial, los investigadores analizaron 10,487 muestras de metatranscriptomas, acumulando 51 terabytes de datos. Esto les permitió identificar más de 513,000 fragmentos de virus de ARN, incluyendo 70,458 especies y 180 supergrupos.
Todos hemos escuchado alguna vez de los virus, esos microorganismos responsables de causar daño en el organismo huésped. Algunos ejemplos bien conocidos de virus que pueden causar enfermedades en seres humanos incluyen el VIH (que causa el SIDA), el SARS-CoV-2 (responsable del covid-19), el virus del sarampión y el virus de la viruela. Existen virus que pueden ser de ADN o de ARN Se diferencian principalmente en el tipo de material genético que utilizan para replicarse y llevar a cabo sus funciones. Entre los primeros, se encuentran por ejemplo el virus del herpes, el virus de la varicela-zóster y el virus de la hepatitis B. En el grupo ARN, está el virus de la gripe, el VIH y el virus del Ébola.
Los virus de ARN tienden a cambiar más rápido que los virus de ADN porque no pueden corregir errores en su material genético durante la replicación, lo que les permite acumular mutaciones rápidamente. Si bien infectan a una gran variedad de especies hospedadoras, su papel solo ha ganado reconocimiento recientemente. “A pesar de tal progreso en el descubrimiento de la diversidad de virus de ARN a través del muestreo ecológico y la secuenciación, es probable que aún queden por descubrir grupos más divergentes de virus de ARN”, escribe un grupo de investigadores en un artículo en la revista CELL.
Es decir, a medida que mejoramos nuestras técnicas de identificación y análisis, podemos encontrar más tipos de virus de ARN que aún no hemos observado. Las herramientas actuales que usamos para identificar virus que tienen ARN a veces no funcionan bien cuando los virus son muy diferentes de los que ya conocemos. Los investigadores desarrollaron entonces un nuevo programa llamado LucaProt que utiliza inteligencia artificial (IA) para encontrar virus desconocidos hasta ahora por la ciencia.
Los investigadores estudiaron un total de 10,487 muestras de metatranscriptomas, que son conjuntos de información genética. En total, estas muestras contenían 51 terabytes de datos, lo que equivale a una gran cantidad de información. Para ponerlo en perspectiva, 51 terabytes son suficientes para almacenar miles de películas en alta definición Luego, usaron a LucaProt para identificar secuencias de una proteína clave llamada RdRP que se encuentra en los virus. Este algoritmo aprendió de ejemplos de proteínas de virus conocidos y proteínas que no eran de virus, lo que le permitió tener un bajo porcentaje de errores (solo un 0,014% de falsos positivos y 1,72% de falsos negativos). También aplicaron un enfoque llamado ClstrSearch, que organizó las proteínas según su similitud y utilizó otras herramientas para encontrar relaciones virales.
Al combinar los hallazgos de ambos métodos, descubrieron 513,134 fragmentos de virus de ARN, que representan 161,979 posibles especies virales y 180 supergrupos que se asemejan a grupos ya conocidos, según una clasificación oficial. Además, identificaron un total de 70,458 especies virales únicas que no se habían descrito antes. Entre estas, hay 60 grupos de virus que habían recibido poca atención.
A pesar de que el estudio documentó una gran expansión en la diversidad de virus de ARN, todavía hay importantes vacíos en la comprensión sobre cómo evolucionan y cómo interactúan estos virus con su entorno. Por ejemplo, para la mayoría de los virus recién descubiertos, no se conocen sus huéspedes, es decir, los organismos que infectan. No sabemos si podrían afectar o no a los humanos.
👩⚕️📄¿Quieres conocer las últimas noticias sobre salud? Te invitamos a verlas en El Espectador.⚕️🩺
Todos hemos escuchado alguna vez de los virus, esos microorganismos responsables de causar daño en el organismo huésped. Algunos ejemplos bien conocidos de virus que pueden causar enfermedades en seres humanos incluyen el VIH (que causa el SIDA), el SARS-CoV-2 (responsable del covid-19), el virus del sarampión y el virus de la viruela. Existen virus que pueden ser de ADN o de ARN Se diferencian principalmente en el tipo de material genético que utilizan para replicarse y llevar a cabo sus funciones. Entre los primeros, se encuentran por ejemplo el virus del herpes, el virus de la varicela-zóster y el virus de la hepatitis B. En el grupo ARN, está el virus de la gripe, el VIH y el virus del Ébola.
Los virus de ARN tienden a cambiar más rápido que los virus de ADN porque no pueden corregir errores en su material genético durante la replicación, lo que les permite acumular mutaciones rápidamente. Si bien infectan a una gran variedad de especies hospedadoras, su papel solo ha ganado reconocimiento recientemente. “A pesar de tal progreso en el descubrimiento de la diversidad de virus de ARN a través del muestreo ecológico y la secuenciación, es probable que aún queden por descubrir grupos más divergentes de virus de ARN”, escribe un grupo de investigadores en un artículo en la revista CELL.
Es decir, a medida que mejoramos nuestras técnicas de identificación y análisis, podemos encontrar más tipos de virus de ARN que aún no hemos observado. Las herramientas actuales que usamos para identificar virus que tienen ARN a veces no funcionan bien cuando los virus son muy diferentes de los que ya conocemos. Los investigadores desarrollaron entonces un nuevo programa llamado LucaProt que utiliza inteligencia artificial (IA) para encontrar virus desconocidos hasta ahora por la ciencia.
Los investigadores estudiaron un total de 10,487 muestras de metatranscriptomas, que son conjuntos de información genética. En total, estas muestras contenían 51 terabytes de datos, lo que equivale a una gran cantidad de información. Para ponerlo en perspectiva, 51 terabytes son suficientes para almacenar miles de películas en alta definición Luego, usaron a LucaProt para identificar secuencias de una proteína clave llamada RdRP que se encuentra en los virus. Este algoritmo aprendió de ejemplos de proteínas de virus conocidos y proteínas que no eran de virus, lo que le permitió tener un bajo porcentaje de errores (solo un 0,014% de falsos positivos y 1,72% de falsos negativos). También aplicaron un enfoque llamado ClstrSearch, que organizó las proteínas según su similitud y utilizó otras herramientas para encontrar relaciones virales.
Al combinar los hallazgos de ambos métodos, descubrieron 513,134 fragmentos de virus de ARN, que representan 161,979 posibles especies virales y 180 supergrupos que se asemejan a grupos ya conocidos, según una clasificación oficial. Además, identificaron un total de 70,458 especies virales únicas que no se habían descrito antes. Entre estas, hay 60 grupos de virus que habían recibido poca atención.
A pesar de que el estudio documentó una gran expansión en la diversidad de virus de ARN, todavía hay importantes vacíos en la comprensión sobre cómo evolucionan y cómo interactúan estos virus con su entorno. Por ejemplo, para la mayoría de los virus recién descubiertos, no se conocen sus huéspedes, es decir, los organismos que infectan. No sabemos si podrían afectar o no a los humanos.
👩⚕️📄¿Quieres conocer las últimas noticias sobre salud? Te invitamos a verlas en El Espectador.⚕️🩺