La revolución de la bioinformática: descifrar el código de la vida para hacer realidad la medicina personalizada
300 especialistas presentan en las XV Jornadas de Bioinformática avances en la nueva ‘biología del big data’, que trae ya terapias más ajustadas a cada paciente.
 
En biología, descubrir ya no es lo que era. La investigación húmeda, de microscopio y pipeta, ya casi no existe sin la de silicio: programas informáticos que extraen la información oculta en un mar de datos. Esta disciplina en auge, la bioinformática, es la que ayuda a entender qué hace cada variante genética, cada proteína: ¿aumenta esa mutación el riesgo de cáncer? ¿interfiere en la eficacia del tratamiento?
La bioinformática trae la medicina personalizada. Y en su avance también se acerca hacia el objetivo –más fundamental aún– de descifrar el código de los sistemas vivos, y hacer realidad el sueño de convertir la biología en una ciencia capaz de predecir el desarrollo de un organismo a partir de las instrucciones genéticas inscritas en su ADN.
“Estamos en un momento fascinante”
Para Raúl Rabadán, seleccionado como próximo director científico del Centro Nacional de Investigaciones Oncológicas (CNIO), “la biología siempre ha sido una ciencia descriptiva; pero estamos en un momento fascinante, empezamos a estudiar el lenguaje [de la biología] y encontramos algo que empieza a funcionar. Estamos en medio de una revolución, tenemos que avanzar tanto como podamos y ver qué podemos encontrar”.
Rabadán, físico de formación, director del Programa de Genómica Matemática y catedrático en los Departamentos de Biológica de Sistemas e Informática Biomédica en la Universidad de Columbia (Nueva York, EE. UU.), intervino en las recientes Jornadas de Bioinformática, coorganizadas por el CNIO, el Instituto Nacional de Bioinformática (INB/ELIXIR-ES), el Centro Nacional de Biotecnología (CNB-CSIC) y BioData.pt (ELIXIR-PT).
Celebradas cada dos años, en esta XV edición las Jornadas de Bioinformática han reunido en Madrid a más de 300 especialistas de España, Portugal y otros países del área mediterránea. El suyo es un perfil cada vez más abundante en los centros de investigación: llegan de las matemáticas, física e ingenierías fascinados por problemas biológicos que sólo ellos y ellas pueden resolver, porque implican buscar patrones ocultos en masas de datos.
“Ya no hay resultados sin análisis bioinformático”
“Ahora, en biología ya no hay apenas resultados que no hayan pasado por un análisis bioinformático”, dice Fátima Al-Shahrour, jefa de la Unidad de Bioinformática del CNIO y coorganizadora de las Jornadas.
La genómica y la proteómica, que en los últimos años han aprendido a analizar con rapidez el ADN y los miles de proteínas en los organismos vivos, generan cantidades ingentes de datos. La bioinformática encontrará en ellos información útil.
“Partes, por ejemplo, de los datos de secuenciación de un genoma, y quieres detectar alteraciones moleculares asociadas a una determinada enfermedad”, explica Al-Shahrour; “desarrollas un método informático que te permite convertir esos datos en un resultado”. En bioinformática se usan la algoritmia, la informática y la estadística para identificar patrones en los datos y se crean programas específicos para bucear en terabytes de datos.
Bioinformática para decidir el mejor tratamiento
Al-Shahrour estudia en su grupo, en concreto, el problema de cómo las diferencias en las células de un mismo tumor inciden en la eficacia del tratamiento. La investigadora de su equipo en el CNIO María González expuso sus resultados al respecto en las jornadas.
“Ahora se da un tratamiento según el tipo de tumor, y se tiene en cuenta alguna mutación”, explica Al-Shahrour. “Pero sabemos que no todas las células tienen esa mutación, porque los tumores, cada tumor, son muy heterogéneos; y puede que las células que no tengan la mutación no respondan al tratamiento. Este es el primer estudio que tiene en cuenta cómo de heterogéneos son los tumores a nivel de célula única en sus diferentes capas: genética, transcriptómica y de su microambiente, y cómo eso afectaría a la propuesta terapéutica”.
Otros investigadores del CNIO expusieron su trabajo. Tomás Di Domenico investiga la aparición de resistencias a terapia en mieloma múltiple; sus resultados muestran el potencial de la secuenciación avanzada para diseñar terapias más personalizadas en este tumor. José Córdoba estudia las firmas mutacionales, patrones de mutaciones que reflejan procesos tumorales, y que a menudo se pueden asociar a factores específicos como el tabaco. Pablo Villoslada busca nuevos marcadores diagnósticos en el microbioma de pacientes con cáncer de páncreas.
La gramática del lenguaje biológico
Rabadán presentó un modelo que utiliza inteligencia artificial para resolver un problema clásico en biología: predecir de qué tipo es una célula a partir de su ADN. Aunque el genoma sea el mismo en todas las células de un organismo, no todas las células son iguales –las de piel son distintas de las de músculo, de las sanguíneas, de las neuronas…–; la razón es que en cada tipo de célula se expresan –están activos– genes diferentes. A día de hoy, teniendo únicamente el ADN de una célula no es posible saber con certeza de qué tipo de célula se trata.
El modelo de Rabadán, publicado este año en Nature, se considera un avance significativo. Su grupo creó un modelo de aprendizaje automático y lo entrenó con datos de expresión génica de millones de células, obtenidas de tejidos humanos normales. Identificó después las reglas subyacentes, la gramática del lenguaje genético, y aplicó estas reglas inferidas a nuevas situaciones.
La ‘materia oscura’ del genoma
“Aprendemos la gramática en muchos estados celulares diferentes y después pasamos a una condición concreta, que puede ser un tipo de célula enferma o normal, y tratamos de predecir patrones a partir de esta información”, explica Rabadán.
Su grupo está usando este modelo para estudiar la llamada “materia oscura” del genoma, que es realmente la mayor parte del mismo. Las mutaciones que codifican proteínas representan solo el 1% de todas las encontradas en pacientes con cáncer; el 99 % restante son mutaciones en regiones que no ordenan la producción de proteínas.
“La gran mayoría de las mutaciones que se encuentran en los pacientes con cáncer se encuentran en las llamadas regiones oscuras del genoma. Estas mutaciones no afectan a la función de una proteína y en su mayoría siguen sin estar exploradas”, afirma Rabadán. “La idea es utilizar estos modelos para iluminar esa parte del genoma”.
Equilibrio de género
Las XV Jornadas de Bioinformática han incluido innovaciones en aplicaciones traslacionales en la salud humana, las ciencias ambientales y la biología de sistemas. Se han presentado estudios españoles y portugueses, pero también de grupos Francia, Alemania, India, Marruecos, Chile, Suecia, Turquía, Túnez y el Reino Unido.
Los organizadores destacan el equilibrio de género entre los participantes, un aspecto importante en un área de la ciencia –informática– aun predominantemente masculina. “La diversidad de orígenes y géneros es esencial para la creatividad, y creemos que esto tiene un impacto real en la ciencia de la bioinformática”, destaca Al-Shahrour, que recuerda ser casi la única mujer cuando empezó su carrera.
Sobre el Centro Nacional de Investigaciones Oncológicas (CNIO)
El Centro Nacional de Investigaciones Oncológicas (CNIO) es un centro público de investigación dependiente del Ministerio de Ciencia, Innovación y Universidades. Es el mayor centro de investigación en cáncer en España y uno de los más importantes en Europa. Integra a medio millar de científicos y científicas, más el personal de apoyo, que trabajan para mejorar la prevención, el diagnóstico y el tratamiento del cáncer.
