Adrian Lee ha dedicado su carrera a estudiar el cáncer de mama, lo que significa que él está enfrentando muchas enfermedades diferentes a la vez. “No hay dos casos de cáncer de mama iguales”, dice Lee, un farmacólogo y biólogo químico de la Universidad de Pittsburgh en Pensilvania. “El cáncer es mucho más complejo de lo que sabemos.”
Lee está usando la tecnología genómica para describir completamente el cáncer de mama y aplicar ese conocimiento para guiar decisiones de tratamiento para pacientes individuales. “Ahora podemos analizar múltiples variables de un solo espécimen, tales como cambios en el ADN, cambios en el ARN y cambios en la metilación”, afirma. “Los escanogramas a lo largo del genoma permiten una mejor biología de sistemas y nos permiten conocer lo que está mal en un tumor particular.”
La secuenciación de tumores es más rápida, más barata y más sencilla que nunca. Con muchos investigadores recolectando datos de secuencia y cargándolos a bases de datos públicas como la del Atlas del Genoma del Cáncer (TCGA), las oportunidades de describir los tantos tipos diferentes de cáncer que surgen en el tejido mamario están encima de nosotros. “El reto solía ser generar los datos”, dice Nicholas Navin, un genetista del MD Anderson Cancer Center de la Universidad de Texas en Houston. “Esos tejidos han sido resueltos. Ahora el reto es el procesamiento de datos y el análisis de datos – interpretar las mutaciones y comunicarlas a los oncólogos.”
En la Universidad de Pittsburgh, los investigadores trabajan para asociar las firmas moleculares de gente con cáncer de mama, a un receptor de datos clínicos, incluyendo información demográfica asociada con riesgos como la edad, la etnicidad y el peso corporal. Están realizando minería de registros de salud electrónicos para hallar correlatos clínicos, interacciones de tratamiento y resultados. “Tenemos un enorme pajar y estamos intentando encontrar la aguja”, dice Lee. “Pero también estamos intentando incriminar la aguja, al asociarla con muchas cosas.” Recolectar todos los datos de los registros electrónicos de los pacientes ayuda bastante, afirma Lee. Se necesita infraestructura – Pittsburgh ya ha acumulado 5 petabytes, o 5 millones de gigabytes, los cuales son suficientes datos para sobrecargar cerca de 40,000 dispositivos nuevos iPhone 6.
Hacer la conexión entre los montones de datos provenientes de los laboratorios de secuenciación y cada mujer luchando contra el cáncer de mama, toma una gran cantidad de potencia de cómputo. Los datos masivos necesitan investigadores que se sientan cómodos con el ruido estadístico y a los que tienen mucha experiencia en el proceso iterativo, a quienes se pide crear programas flexibles de ordenador.
De los datos al conocimiento
Los investigadores de datos masivos toman un grupo grande de datos y buscan patrones. La idea es identificar mutaciones que puedan ser atacadas con medicación. Es la esencia de la medicina personalizada: examinar el tumor de un paciente para buscar un grupo de bio marcadores, para elegir el mejor tratamiento para combatir el cáncer. Los investigadores de datos masivos creen que analizar los datos de los miles de tumores que se han presentado antes, revelará patrones que pueden mejorar la examinación y los diagnósticos, e informar el tratamiento.
Lee y sus colegas han ilustrado cómo la ciencia de datos masivos llevó a un replanteamiento del cáncer de mama1. Usaron dos bases de datos públicas – TCGA y METABRIC (Molecular Taxonomy of Breast Cancer International Consortium), el cual contiene datos sobre el grupo completo de genes, transcripciones del ARN y proteínas de miles de tumores de cáncer de mama – para analizar sintácticamente diferencias potenciales en las firmas moleculares de los tumores mamarios en mujeres más jóvenes, comparadas con mujeres mayores. Las mujeres a quienes se diagnostica antes de los 40 años tienden a sufrir una enfermedad más violenta: están más propensas a padecer cáncer de etapas tardías, pronósticos más pesimistas y peores opciones de sobrevivir que las mujeres mayores.
El equipo analizó datos de tumores de mujeres menores de 45 años, quienes probablemente estaban en la menopausia, y de mujeres mayores de 55 años, quienes probablemente ya habían pasado por la menopausia. “Hemos observado todo lo que podríamos observar”, dice Lee, incluyendo mutaciones en el genoma, mutaciones en el RNA, expresión génica de los tumores, variaciones en el número de copias de ciertos genes y los niveles de metilación del ADN. Encontraron que los tumores en mujeres pre menopáusicas siguen un libreto diferente, especialmente en términos de expresión génica.
Mientras los investigadores encuentran mutaciones cada vez más raras, la cuestión de trascendencia se hace cada vez más amedrentadora, dice Lee. Él acaba de terminar de mirar una hoja de cálculo de 2,000 mutaciones. “Una de ellas es la mutación ER”, indica, refiriéndose a una mutación en el receptor de estrógeno – una mutación común en tumores mamarios. “Pero cómo paso por las otras? Ese es el problema fundamental.”
“Sabemos cómo trabajan los circuitos de genes en células normales. ahora nos preguntamos, qué se dañó en una célula tumoral.”
Una forma de hacerlo es analizar las rutas celulares afectadas por las mutaciones. Eso significa usar algoritmos desarrollados para integrar toda la información molecular recolectada y categorizarla en las rutas de crecimiento común o ciclo celular. Los investigadores pueden usar esta información categorizada para describir tumores, en términos de rutas afectadas, en lugar de simplemente moléculas afectadas. En ese esfuerzo, el experto en bioinformática Josh Stuart, de la Universidad de California Santa Cruz, desarrolló un método computacional que integra una variedad de juegos de datos genómicos con rutas de comunicación celular conocidas. “Sabemos cómo trabajan los circuitos de genes en células normales. Ahora nos preguntamos, qué se dañó en esta célula tumoral?”, dice Stuart. “Es sorprendentemente eficaz.”
El grupo de Lee usó el análisis computacional PARADIGM en su estudio1. El enfoque probó ser particularmente revelador para el cáncer de mama positivo por receptores de estrógeno en mujeres pre menopáusicas. El método demostró que aunque las moléculas individuales que mostraron anormalidades variaron, a menudo se presentaron en un juego particular de rutas que señalan integrinas – proteínas involucradas en la formación de vasos sanguíneos asociados con tumores.
La evidente importancia de las integrinas en los tumores de mujeres pre menopáusicas con cáncer de mama positivo por receptores de estrógeno, sugiere que estas moléculas podrían ser un blanco terapéutico. “Existen inhibidores de integrina”, dice Lee, y algunos de ellos han sido probados en ensayos clínicos.
Del conocimiento a la aplicación
Conforme los investigadores de datos masivos se adentran en grandes bases de datos de tumores buscando patrones de mutaciones, añaden nuevas categorías al cáncer de mama. En 2012, dos consorcios publicaron investigaciones sobre sus métodos impulsados por datos respecto a la genómica del cáncer de mama. La red TCGA, compuesta por docenas de instituciones de investigación en los Estados Unidos y Europa, reveló cuatro grupos principales de tumores mamarios basados en anormalidades genéticas y epigenéticas2. Hallaron que solamente tres genes (TP53, PIK3CA y GATA3) mutaron en más del 10% de las muestras, demostrando que las mutaciones extrañas son ahora parte importante de la categorización del cáncer de mama. El grupo METABRIC, un consorcio del Reino Unido y de instituciones canadienses, integró datos genéticos – cambios en el número de copias y en la expresión génica – con consecuencias clínicas a largo plazo en 10 familias de tipos de tumores. Combinado con datos clínicos, ambas categorías nuevas tienen el potencial para permitir a los oncólogos hacer mejores decisiones de pronósticos y tratamientos.
“Todavía estamos refinando nuestro método,” dice Oscar Rueda, un experto en bioestadística en el área de Investigación del Cáncer, del Cambridge Research Institute del Reino Unido, el cual forma parte del esfuerzo de METABRIC. Ahora están secuenciando completamente las 2,000 muestras usadas en la investigación. Rueda afirma que la esperanza es identificar mutaciones conductoras, las cuales tienen un papel en el comienzo del cáncer. “Hay un centenar de mecanismos diferentes por los cuales las células se hacen malas,” afirma.
Los métodos de datos masivos podrían eventualmente revelar rutas celulares que habrían sido pasadas por alto previamente. Avi Ma’ayan de la Icahn School of Medicine en Mount Sinai está trabajando en una base de datos de rutas, para crear recursos para futuros blancos potenciales. Su esfuerzo está auspiciado por el National Institutes of Health Library of Integrated Network-based Cellular Signatures (LINCS), el cual usa datos generados en instituciones tales como el Broad Institute del Massachusetts Institute of Technology. Los laboratorios de alto rendimiento en el Broad Institute prueban un receptor de fármacos – tanto experimentales, como aquellos con aprobación regulatoria – en diez diferentes líneas celulares para estudiar cómo interactúan los fármacos con la actividad celular.
“Se consigue una firma de lo que les sucede a las células,” dice Ma’ayan. “Y las firmas pueden ser puestas en duda para nuevos usos de fármacos.” Si los investigadores clínicos quieren apagar una ruta particular en el cáncer, podrían usar la base de datos de Ma’ayan para buscar fármacos que tengan esa acción.
Traducción clínica
El siguiente paso es aplicar el nuevo conocimiento adquirido de las mutaciones accionables, al cuidado de los pacientes. Los hospitales de investigación recolectan datos sobre los pacientes para su propio tratamiento y para agregarlos a la base de conocimiento. En el MD Anderson Cancer Center, por ejemplo, en gente con un nuevo diagnóstico de cáncer se examinan una selección de genes cancerígenos. “No es el genoma completo, sino un grupo de 200 genes con mutaciones accionables,” dice Navin. Conforme crece el conocimiento de investigación, también lo hace el grupo de genes. El año pasado, los 200 genes originales se expandieron a 300, afirma.
La especialidad de Navin es la secuenciación de células individuales, lo que permite a su laboratorio estudiar células tumorales que circulan en la sangre. Se podrían recolectar solamente 10 o 20 células de una muestra. “Los anteriores métodos analíticos no podían procesar un número tan pequeño de células,” dice. El enfoque de células individuales abre la posibilidad de que los pacientes puedan ser monitoreados durante el curso de su tratamiento con una prueba no invasiva, tal como una muestra de sangre. Los oncólogos podrían revisar entonces si las células tumorales están respondiendo a la terapia o si están poniendo resistencia.les tumores responden a cuñales cuas pre definidos. Las mujeres an ser monitoreados durante el curso de su tratamiento con un is
Los datos masivos se intersectan con lo clínico en forma del I-SPY 2, un ensayo clínico de fármacos experimentales para cáncer de mama. “Estamos recolectando datos sobre los pacientes en tiempo real,” dice Laura van’t Veer, una oncóloga molecular de la Universidad de California San Francisco.
Los pacientes se dan de alta en el diagnóstico y, basados en su firma tumoral, son colocados en uno de ocho tipos pre definidos. A las mujeres se da entonces tratamiento estándar y se les da un fármaco experimental dirigido, mientras que van’t Veer y sus colegas monitorean qué tumores responden a qué terapias dirigidas. El objetivo es evaluar los bio marcadores que mejoren la respuesta a terapias dirigidas. “Con la quimioterapia estándar, vemos de un 30 a 35% de remisión completa,” dice van’t Veer. “Entre nuestros 8 subtipos, a veces obtenemos hasta un 50 a 60% de remisión.”
Aún quedan muchos desafíos. Un simple tumor puede contener una increíble diversidad de mutaciones, las cuales cambian a lo largo del tiempo. Aun así Ma’ayan se mantiene optimista. “Mientras más dinero y esfuerzo podamos poner en este problema, más instantáneas podemos conseguir. Con una mayor resolución, podemos ampliar nuestro entendimiento del proceso completo,” dice. “No es infinito, aunque pueda parecerlo así.”
Fuente de artículo : Jill U. Adams . Nature
https://www.nature.com/nature/journal/v527/n7578_supp/full/527S108a.html