AseBio

Reportaje | La herramienta que revoluciona la ‘biotech’ para predecir la estructura de las proteínas

AlphaFold 2, la nueva plataforma de Inteligencia Artificial se presenta como un avance jamás visto hasta ahora y nuestros socios ya han empezado a trabajar con ella. Hablamos con alguno de ellos

Zymvol AF2
Por Agathe Cortes y Raquel Álvarez

Este verano una noticia sacada en Nature dio la vuelta al mundo. Una nueva herramienta computacional con una base de datos pública había salido a la luz y ofrecía por primera vez la estructura de 365.000 proteínas de 21 organismos modelos, desde bacterias, plantas, la levadura de cerveza, el ratón hasta el proteoma del Homo sapiens; todos ellos elegidos en base a criterios de la biotecnología al ser lo más habituales en la investigación. La comunidad científica entendió que eso marcaría un antes y un después en el estudio de las proteínas. Alpha Fold2, herramienta creada por DeepMind, una compañía británica de Inteligencia Artificial que fue comprada por Google, parecía poder resolver un problema planteado desde hace 50 años en la biología. Este avance abría una nueva era en la obtención de estructuras de proteínas que podría representar a corto plazo grandes mejoras para el bienestar de las personas y la salud del planeta por su impacto en el descubrimiento de medicamentos, en la defensa de las plantas y en la degradación de plásticos, entre otras muchas aplicaciones que se puedan imaginar. 

Empresas como Zymvol, ProtoQSAR y centros de investigación como el Centro de Biotecnología y Genómica de Plantas (CBGP (UPM-INIA)) ya están atentos a su desarrollo y nos cuentan cuál ha sido su acogida y cómo podría afectar la biotecnología.

Para muchos procesos biotecnológicos, la clave es entender lo que pasa a nivel molecular y para ello, la estructura de las proteínas se convierte en un pilar imprescindible, tanto si se pretende analizar el impacto de un patógeno sobre las plantas como si se trata de descubrir nuevos fármacos y tratamientos. Frente a esta necesidad, todos los especialistas consultados están de acuerdo en que AlphaFold2 es un avance potente en este campo, pues es capaz de predecir computacionalmente estructuras de proteínas con un nivel de fiabilidad comparable al trabajo experimental y ya ha proporcionado modelos estructurales de proteínas para las que jamás se habían predicho. “La inmensa variedad de proteínas que interesaba al sector biotecnológico no tenía estructura disponible y era una limitación muy grande para todos nosotros y para dar la necesaria fiabilidad a nuestro trabajo de predicción. AlphaFold2 ha cambiado este escenario”, opina Luis Fernández Pacios, profesor de la Universidad Politécnica de Madrid e investigador del CBGP. 

CBGP AF2

Esta herramienta va a facilitar, agilizar y abrir nuevas vías en la investigación biotecnológica. “La mayor ventaja que ofrece es sobre todo la calidad en la estructura tridimensional de la proteína. Va a reducir el riesgo de posibles errores”, nos explica Ferran Sancho, investigador senior de Zymvol, empresa especializada en el descubrimiento e ingeniería de enzimas por ordenador. Gracias a este nuevo avance de la inteligencia artificial, Zymvol podrá crear más y mejores modelos, lo que le permitirá trabajar con clientes en nuevas áreas y en aplicaciones hasta ahora no consideradas por limitaciones técnicas. “Creo que es la noticia de mayor impacto que he oído desde que me dedico a la ciencia”, asevera. “Va a tener un gran impacto en algunos años y desbloquear muchos proyectos y líneas de investigación, pero todavía estamos en fase de prueba”, añade. 

Limitaciones y retos

Pese a que hay unanimidad para decir que se trata de una herramienta “revolucionaria” del siglo XXI, existen algunas limitaciones sobre las cuales hace falta enfocarse. En primer lugar, es necesario ampliar la colección de proteomas con estructuras asociadas. Esto es solo un principio, “una carta de presentación”, en palabras de Pacios, pero ahora el trabajo va a ser el de ir aportando cada vez más información y que, a través del aprendizaje, se vayan cubriendo los huecos. 

Desde ProtoQSAR, reconocen el potencial de la herramienta para cubrir esas zonas oscuras de las cuales no se tiene información, pero también detectan algunas barreras importantes. Las proteínas son estructuras dinámicas que no tienen una conformación específica para toda la vida y que interactúan, a veces en desorden, con muchos otros complejos que le pueden afectar. “Por ejemplo, si partes nada más de una secuencia, pierdes toda la información sobre el ambiente en el que se mueve la proteína. AlphaFold2 te predice una sola estructura, es como si se quedara un poco corto…”, advierte Stephen Jones Barigye, director científico de la compañía por videollamada desde Canadá. Otro punto importante para el experto es que esta herramienta tampoco permite estudiar las mutaciones. “Aún así, no quita todos los puntos positivos. Nos permite hacer una combinación de técnicas que nos lleva a tener resultados mucho más fiables. Ahora tenemos algo fuerte para comenzar y eso es muy válido”, reconoce. 

protoQSAR AF2

Otra de las barreras destacadas a lo largo de las entrevistas es que el método de AlphaFold2 no funciona en todas las proteínas que podamos imaginar. Explica Fernández Pacios que, si la secuencia de la proteína que se está utilizando para el proceso biotecnológico no tiene suficiente relación con otras proteínas conocidas, bajan mucho las prestaciones de la herramienta. Según los creadores del método, la fiabilidad de la estructura predicha baja apreciablemente si la secuencia de la proteína estudiada no tiene al menos 30 secuencias con las cuales identificarse. “Hay mucho campo de mejora para rellenar esos huecos para las proteínas más raras porque en casi cualquier organismo pueden existir centenares”, asume. 

¿Y ahora qué?

¿Pero entonces de qué depende de que esta herramienta mejore? ¿Un día podremos tener una plataforma completa y cubrir todas esas lagunas? Los expertos aseguran que es uno de los retos que hay y que en cuestión de años veremos mucho cambio y mejora. Rafael Gozalbes, director general de ProtoQSAR, recuerda que cuando se empezaron a desarrollar los modelos computacionales parecía como si “con el ordenador se iban a descubrir nuevos fármacos y no necesitaríamos más a los laboratorios”. Pero no, el especialista insiste en que la computación es una herramienta adicional y que siempre necesitaremos de otras para completar el cóctel. “Nos permite hacer las cosas mejor y más rápido, eso sí”. 

El director de desarrollo de negocio de la misma compañía, Simón Perera, insiste en que, para llegar a completarla y mejorarla sin depender de terceros, es necesario promocionar la innovación nacional y europea. “Necesitamos también ponernos al día de manera interna para no perder este salto cualitativo que estamos dando”, apuntala. 

En cualquier caso, todos los expertos consultados confían en que esta nueva herramienta que recorre la industria ‘biotech’ desde hace pocos meses viene a desbloquear todo un mundo hasta ahora inaccesible, tanto en la degradación de moléculas, de los plásticos, en protección de la flora, como en medicina, tratamientos contra el cáncer y descubrimiento de nuevos fármacos. 

           —   ¿Estamos preparados en España para esta revolución? 

           —  “Tenemos personal muy bueno, pero no el suficiente. La industria tiene que ser consciente de que esta herramienta y la IA han venido para quedarse en todas nuestras actividades científicas y que vamos a necesitar personas expertas en esta materia”, concluye Pacios.