Un equipo de investigación español ha logrado un avance sin precedentes en el campo de la biología molecular: predecir la función de cualquier proteína desconocida mediante inteligencia artificial (IA).
El estudio, liderado por Rosa Fernández, del Instituto de Biología Evolutiva (IBE-CSIC-UPF), y Ana Rojas, del Centro Andaluz de Biología del Desarrollo (CABD-CSIC-UPO), presenta una herramienta abierta y gratuita llamada FANTASIA, capaz de descifrar millones de secuencias genéticas en tiempo récord.
FANTASIA —acrónimo de Functional ANnoTAtion based on embedding space SImilArity— utiliza modelos de lenguaje basados en IA para analizar la secuencia del ADN como si fuera un texto escrito, interpretando fragmentos genéticos como palabras de un idioma desconocido. Al hacerlo, puede deducir la función de proteínas sin necesidad de compararlas con otras ya conocidas, algo que hasta ahora limitaba el estudio de la biodiversidad molecular.
Gracias a esta herramienta, el equipo ha descubierto la función de 24 millones de genes que codifican proteínas en cerca de 1.000 genomas animales. Según Fernández, “comprender la función de estos genes abre una nueva ventana al conocimiento de la biología animal. Nos permitirá entender cómo surgen las innovaciones evolutivas y qué papel desempeñan las proteínas desconocidas en la diversidad y adaptación de las especies”.
Hasta hoy, gran parte del llamado “proteoma oscuro” —las proteínas cuya función se desconoce— permanecía inaccesible a los métodos tradicionales de análisis genético. Por ejemplo, en humanos se conoce la función del 80-90% de las proteínas, pero en otros mamíferos e invertebrados esa cifra es mucho menor, dejando millones de interrogantes abiertos. FANTASIA promete cambiar este panorama al realizar predicciones con una precisión cercana al 100%, incluso sin entrenamiento previo específico, y sin necesidad de superordenadores.
“Esta herramienta arroja luz en la oscuridad”, explica Rojas. “Es impensable estudiar individualmente todos los genes de cada organismo, pero con FANTASIA podemos dirigir los esfuerzos hacia los más prometedores. Esto puede tener un impacto enorme en biomedicina, biotecnología o conservación de la biodiversidad.”
Entre los descubrimientos iniciales, el equipo ya ha identificado funciones de proteínas en tardígrados, ctenóforos y micrognatozoos, tres grupos invertebrados cuyos genomas todavía guardaban grandes incógnitas. Pero FANTASIA ya ha demostrado funcionar también en virus, hongos, plantas y otros organismos.
Su impacto se amplía además por su accesibilidad. Gemma Martínez Redondo, primera autora del estudio, destaca que “FANTASIA es un software abierto y fácil de usar para usuarios sin experiencia en programación, e incluye modelos ya entrenados”. Este enfoque democratiza el acceso a la biología molecular avanzada y pone al alcance de centros sin grandes recursos una herramienta de investigación puntera.
El proyecto, además, cuenta con el respaldo del Earth BioGenome Project (EBP), la mayor iniciativa global de secuenciación de genomas, que ya recomienda su uso a sus colaboradores.
Con este avance, la ciencia española se coloca en la vanguardia del análisis computacional de proteínas, abriendo caminos para el desarrollo de fármacos, el entendimiento de la evolución y la explotación de recursos biológicos. Como concluye Fernández: “El potencial para descubrir nuevos genes que revolucionen la biotecnología, la medicina o la conservación de la biodiversidad no tiene límite”.
Ver estudio aquí.
fecha:
