Hoy se presenta en las páginas de ‘Science’ «capítulos que nunca antes se habían leído» del libro genético de la vida, se trata de «regiones del ADN importantes pero difíciles de secuenciar»
La secuenciación del genoma humano
Hace 21 años se publicó la secuenciación del genoma humano en dos versiones: una alcanzada por el consorcio público Proyecto Genoma Humano (PGH) y otra, por la compañía privada Celera Genomics. De esta forma, de cara al público, acababa en empate una carrera por ser el primero en descifrar nuestro manual de instrucciones, cada una de las letras que conforman el ADN de una persona. O eso parecía.
Pero quedaba más por conocer, porque las secuenciaciones que se presentaron entonces, si bien han supuesto un logro esencial en la investigación biomédica, eran incompletas, pues una parte no desdeñable del ADN se mantenía desconocida.
De esto eran conscientes científicos como Evan Eichler. El investigador del Instituto Médico Howard Hughes (HHMI) de la Universidad de Washington (Seattle), participó en el Proyecto Genoma Humano. La secuenciación que culminaron a principios del siglo XXI se consideró «completa» a falta de fragmentos que tenían secuencias muy repetidas y que se descartaron como «basura», por no tener relevancia biológica. Pero precisamente era en esos «vacíos» donde se encontraban las regiones en las que Eichler estaba interesado. Por ello, se comprometió a terminar algún día el trabajo: tenía que leer todo el genoma, sin saltarse ningún párrafo.
La curiosidad de Eicher personaliza la de otros muchos científicos, que se preguntaron por ese ADN desdeñado. Hace unos años, planearon acometer esa brecha en la secuenciación. Tirando de Zoom y teletrabajo durante la pandemia, cerca de cien investigadores, muchos de ellos en el inicio de sus carreras, se sumaron al consorcio Telomere-to-Telomere (T2T), dirigido por Adam Phillippy, del Instituto Nacional de Investigación del Genoma Humano (Nhgri), y Karen Miga, de la Universidad de California en Santa Cruz (UCSC).
Hoy presentan en las páginas de Science «capítulos que nunca antes se habían leído» del libro genético de la vida. De telómero a telómero, o de punta a punta de los cromosomas, han ensamblado esta nueva versión, que presentaron hace unos meses, sin revisión de pares, en bioRxiv.org. Ahora, la revista científica por excelencia publica en el número de esta semana seis estudios con las conclusiones de su investigación.
La versión de referencia del genoma que se utiliza hoy en laboratorios de todo el mundo (GRCh38, que parte de la secuenciación inicial del PGH) tiene millones de bases (nucleótidos, las letras que se suceden en el ADN) representadas por la letra «N», lo que significa que se desconoce qué base se encuentra en esa posición explica en Science la genetista Deanna M. Church, que no está implicada en el proyecto.
También hay regiones de importancia biológica como los centrómeros, la parte central de los cromosomas, con fragmentos secuenciados muy repetidos que no se han terminado de ensamblar correctamente. Todas esas partes aún desconocidas suponen alrededor del 8% del genoma. El consorcio T2T las ha descifrado, añadiendo así 200 millones de nucleótidos (algo similar al tamaño de un cromosoma completo) en su nueva versión, llamada T2T-CHM13.
El hecho de que en estas regiones del ADN no se hubieran encontrado antes muchos genes codificadores de proteínas contribuyó a que cayeran en el ostracismo. Pero esta tendencia desde hace años se está revirtiendo a medida que se demuestra su relevancia, por ejemplo, en la expresión génica y en ciertas enfermedades. Como destaca una de las autoras, Megan Dennis, del Instituto MIND en la Universidad de California, en Davis, «estas son regiones importantes pero difíciles de secuenciar».
¿Qué hay en la zona gris no secuenciada hasta ahora?
En las regiones de ese 8% se han encontrado genes y también niveles inesperadamente altos de variación genética en los centrómeros. Para el codirector Phillippy estamos ante «un nuevo cofre del tesoro de variantes que podemos estudiar para ver si tienen un significado funcional«. El genetista considera que «en el futuro, cuando se secuencie el genoma de alguien, podremos identificar todas las variantes en su ADN y usar esa información para guiar mejor la atención médica«. En ello coincide la codirectora Karen Miga, que se muestra expectante ante «la próxima década de descubrimientos sobre estas regiones que se acaban de revelar«.
La importancia del hallazgo también se destaca desde la Asociación Española de Genética Humana (AEGH). «Por primera vez, gracias a nuevas tecnologías se puede llegar a esta resolución tan alta de la secuencia completa del ADN», comenta a este medio el portavoz de la AEGH Jair Tenorio. El genetista del Instituto de Genética Médica y Molecular (Ingemm) del Hospital Universitario La Paz (Madrid) explica que la secuenciación ha sido posible gracias a la «tecnología de nueva generación que permite completar los fragmentos de ADN hasta ahora no conocidos por limitaciones técnicas«. También matiza que la secuenciación descifra todos los cromosomas, salvo el Y, porque no estaba presente en la línea celular que han utilizado. No obstante, concluye que es «hasta la fecha es el genoma con más detalle y resolución publicado».
El nuevo genoma de referencia procede de una línea celular derivada de un tipo de tumor (mola hidatiforme) que aparece cuando el óvulo pierde su propio genoma en el útero y es fecundado por el espermatozoide. Los científicos escogieron este tipo de célula por simplificar la tarea, pues cuenta con dos copias idénticas de cada cromosoma, a diferencia de la mayoría de las células humanas, que tienen dos copias ligeramente diferentes, del padre y de la madre.
Lectura larga, el método clave “descifrar” la zona gris
La línea celular con un solo genoma, «hizo posible el ensamblaje«, afirma otro de los autores, Erich Jarvis, neurogenetista de la Universidad Rockefeller. Eso, y los avances tecnológicos. Para la secuenciación se han usado dos métodos de «lectura larga» (long-read): Oxford Nanopore, que puede leer hasta un millón de letras de ADN de una tacada, aunque con una precisión modesta, y PacBio HiFi, que lee unas 20.000 letras casi a la perfección.
Como recuerda Jair Tenorio, frente a estas técnicas de long-read, que permiten secuenciar fragmentos muy largos, los métodos convencionales leen fragmentos cortos de unas 1.000 letras. «Al poder secuenciar fragmentos muy grandes se resuelve la secuencia de manera fidedigna, especialmente en las regiones centroméricas o teloméricas, donde se concentran muchas repeticiones».
Aplicaciones de la nueva secuenciación genómica
Con la resolución de las zonas grises, se han identificado secuencias que podrían estar relacionadas con síntesis de proteína, «por lo que podríamos estar, por ejemplo, ante genes que potencialmente secuencien proteínas hasta ahora desconocidas». También será útil para los estudios sobre la evolución y los ancestros, y para identificar cambios en esas regiones repetitivas que puedan asociarse a enfermedades. Hace unos años, Jair Tenorio, junto a otros investigadores, identificó un nuevo síndrome -por cierto, que ha recibido el nombre del genetista- y del que recientemente se han encontrado nuevos casos. El investigador especula que el nuevo genoma de referencia pueda servir para resolver la incógnita en otros cuadros clínicos cuya causa no se conoce y que estén ligados a las regiones resueltas.
De hecho, la versión del ADN humano de T2T ya se está utilizando para volver a analizar los genomas recopilados por el Proyecto 1000 Genomas, un proyecto internacional para crear un catálogo de la variación genética humana.
Todo apunta a que seguiremos hablando del consorcio T2T en un futuro, pues sus miembros afirman que ya están trabajando para secuenciar un genoma con diferentes cromosomas heredados de padre y madres. También han iniciado una colaboración para obtener un pangenoma, con secuencias de ADN completas de cientos de personas de todo el mundo, para obtener una representación más afinada de la diversidad humana. Parece que con el genoma humano, como ocurre con los buenos libros, siempre se descubre algo nuevo al volver a leerlo.
Link: https://www.elmundo.es/ciencia-y-salud/salud/2022/03/31/6245c443fc6c83e16b8b45a1.html
Autora: SONIA MORENO
Fecha: Actualizado Jueves, 31 marzo 2022 – 20:00
Fuente: Diario El Mundo – España