Líderes en ‘big data’ y biomedicina

La investigación en biomedicina no sería posible sin el uso masivo de datos. Es la única vía para hallar las claves de la lucha contra el cáncer, explicar cómo miles de neuronas estructuran nuestro cerebro o desarrollar ensayos virtuales de medicamentos. El big data garantiza que la medicina avance a pasos de gigante.

© Òscar Julve

Cataluña participa de modo relevante en algunos de los proyectos más ambiciosos sobre big data y biomedicina, como por ejemplo el genoma del cáncer (en concreto, en torno a la leucemia), el proyecto Human Brain y ENCODE, el consorcio para desvelar la utilidad de las partes más oscuras y desconocidas de nuestro genoma. También hay en marcha muchos otros proyectos para testar moléculas candidatas a convertirse en fármacos gracias a simulaciones que requieren el uso masivo de datos. Detectar candidatos entre muchos compuestos y simular sus efectos en un entorno virtual acorta el camino y ofrece más garantías de acierto antes de comenzar los ensayos clínicos.

En Cataluña trabajan unos ochocientos científicos en el ámbito de la bioinformática, algunos de ellos expertos reconocidos a escala internacional. También encontramos instalaciones punteras en almacenaje, análisis y producción de datos, como el Centro de Supercomputación de Barcelona (BSC), con el Marenostrum recientemente actualizado y preparado para almacenar y analizar datos de gran volumen, o el Centro Nacional de Análisis Genómico (CNAG), que dispone de avanzada maquinaria de secuenciación.

Minería de datos genéticos

El big data no es nuevo para la biomedicina. “Las primeras bases de datos masivos se crearon en los años cincuenta, cuando se empezó a almacenar la secuencia de proteínas”, explica Roderic Guigó, coordinador del programa de bioinformática del Centro de Regulación Genómica (CRG), reconocido como uno de los principales expertos mundiales en bioinformática ya desde la obtención del primer genoma humano en el año 2000 (fue uno de los pocos europeos que participaron en este proyecto). Pero no fue hasta la aparición de los primeros ordenadores, en los años ochenta, cuando se pudieron explotar las primeras bases de datos electrónicas. “En 1983, haciendo minería de datos, se encontró el primer oncogén”, recuerda Guigó. Los tres mil millones de bases de un solo genoma humano ocupan tres gigas. “No parece demasiado, pero sí que lo es cuando hay muchos”, afirma.

Hoy en día la investigación en biomedicina sería impensable sin el big data, que plantea dos grandes retos, según Guigó: la potencia necesaria para realizar cálculos complejos y la capacidad de almacenaje. Cataluña tiene un papel fundamental a escala europea en los dos aspectos. No es casualidad que el Instituto Europeo de Bioinformática (EBI) haya depositado toda su confianza en Barcelona para establecer la sede del Archivo Europeo del Genoma-Fenoma (EGA), encabezado por el CRG. Este recoge datos genéticos de cien mil pacientes que han participado en más de setecientos estudios científicos sobre cáncer, diabetes, enfermedades autoinmunes y cardiovasculares, entre muchas otras patologías.

En el mundo tan solo hay otra base de datos genéticos con un volumen similar, liderada por el Instituto Nacional de Salud (NIH) de los Estados Unidos. El archivo catalán cuenta con datos de trabajos realizados con enfermos y personas sanas que participan en ensayos en unos doscientos centros de todo el mundo. El EGA custodia genomas (datos genéticos) y fenomas (datos de fenotipos, es decir, desde el color del pelo o los ojos hasta las enfermedades que sufren las personas que participan en los ensayos).

A estos datos tienen acceso investigadores de todo el mundo que trabajen en instituciones sin ánimo de lucro. Solo durante los primeros cuatro meses de 2014 los datos almacenados en el EGA se transfirieron más de doscientas mil veces a casi cinco mil grupos de investigación de todos los continentes. Entre las muchas joyas que guarda la sede de Barcelona del EGA se encuentran los datos de uno de los proyectos más ambiciosos jamás ejecutados para estudiar siete enfermedades complejas, a cargo del Wellcome Trust, con datos de más de cinco mil personas. Los científicos disfrutan de acceso gratuito.

En el EGA también se encuentran los datos genéticos de los millares de genomas que se han secuenciado en el Consorcio Internacional del Genoma del Cáncer, un ambicioso proyecto de ámbito mundial que tiene como objetivo obtener un mapa genético completo de cada tipo de cáncer. En el consorcio, que se puso en marcha en 2008, se estudian más de cuarenta tipos de esta enfermedad, que se dividen en diferentes proyectos, uno de los cuales es el nuestro. Para cada proyecto se estudia a un mínimo de quinientos pacientes.

Desde Barcelona participan el Centro Nacional de Análisis Genómico, el Centro de Supercomputación e investigadores del Hospital Clínic. Elías Campo, responsable del equipo de investigación de oncomorfología funcional humana y experimental del instituto de investigación IDIBAPS del Clínic, codirige una de las secciones de este macroproyecto, el Consorcio para el Estudio del Genoma de la Leucemia Linfática Crónica (CLL). El equipo ha completado el genoma de ciento cincuenta individuos y el exoma de cuatrocientos. El exoma son las regiones del genoma donde se encuentran las partes codificantes de los genes, que formarán el ARN mensajero y que, al ser traducido por la maquinaria celular, dará lugar a las proteínas. Es la parte funcional más importante del genoma porque es la que finalmente determina cómo es un organismo.

© Albert Armengol
Roderic Guigó, coordinador del programa de bioinformática del Centro de Regulación Genómica (CRG), uno de los principales expertos mundiales en bioinformática.

Todo el cerebro dentro de un superordenador

Cada año se publican unos sesenta mil artículos científicos de gran calidad sobre el cerebro. Ahora bien, cada artículo explica solo una parte de la historia. Y por ello, pese a tales esfuerzos, el cerebro continúa siendo una caja negra muy impenetrable. El sueño de los científicos es integrar todos estos datos y construir un gran cerebro virtual donde se pueda recrear cada neurona, cada impulso eléctrico, cada neurotransmisor, cada circuito cerebral. Así se podría entender toda la maquinaria que se pone en marcha cuando, por ejemplo, se genera un pensamiento y se toma una decisión. También se podría conocer con todo detalle qué falla en las más de quinientas enfermedades relacionadas con el cerebro, muchas de las cuales hoy no tienen solución y afectan a un tercio de la población europea.

Trabajar para conseguir hacer realidad este sueño es lo que ya hacen los más de ochenta centros de investigación de todo el mundo (europeos la mayoría) que participan en el proyecto Human Brain (HBP). Lidera el ambicioso trabajo el Swiss Federal Institute of Technology (EPFL) y en él participan dos centros de investigación catalanes, el Centro de Supercomputación de Barcelona (BSC) y el Instituto de Investigación Biomédica (IRB Barcelona).

El BSC y el IRB investigan para modelizar la complejidad molecular que se establece entre dos neuronas. “Una neurona es como un interruptor –explica Modesto Orozco, al frente del proyecto en el IRB Barcelona, que facilitará los datos matemáticos al BSC para que pueda realizar las modelizaciones–. Nuestro objetivo es simular interacciones entre neuronas a escala atómica. Esto permitirá modelizar el estudio de fármacos que modifiquen las propiedades de transmisión de la sinapsis”.

Se trata de transformar en modelos matemáticos los potenciales eléctricos y la generación de moléculas entre neurona y neurona. Entre otros aspectos se estudiarán los canales iónicos, una compleja maquinaria de proteínas que se abren y cierran para permitir u obstaculizar la circulación de iones entre neuronas. “Queremos visualizar y modelizar cómo funciona la sinapsis, cómo se puede bloquear o potenciar su efecto”, puntualiza Orozco. Estos canales pueden alterarse por causas externas, como el consumo de drogas, los efectos secundarios de algunos fármacos o alguna enfermedad.

A partir de los modelos que se puedan crear, se obtendrán datos que explicarán, por ejemplo, por qué hay personas con depresión que responden a los fármacos y otras que no, o por qué a algunas les producen importantes efectos secundarios mientras que a otras no tanto. También se podrán entender mejor otras enfermedades, como la esquizofrenia o el alzhéimer. “Podremos reconstruir la arquitectura de la memoria –afirma Orozco–. Y, en definitiva, conocer a escala molecular qué nos hace humanos”.

Mònica L. Ferrado

Periodista científica. Responsable de ciencia del diario Ara

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos necesarios están marcados *