La humanidad tiene un problema de almacenamiento de información: Se ha creado más información en los últimos dos años que en toda la historia. Y ese torrente de información pronto podría sobrepasar la capacidad de almacenaje de los discos duros. Ahora, los investigadores informan que han ideado una nueva forma de cifrar información digital en el ADN para crear el sistema de almacenamiento de información a mayor escala, de mayor densidad jamás inventado. Capaz de almacenar 215 petabytes (215 millones de gigabytes) en tan sólo 1 gramo de ADN, el sistema podría, en principio, almacenar cada dato jamás registrado por los seres humanos, en un recipiente de un tamaño y un peso aproximado al de un par de camionetas de carga. Sin embargo, la tecnología dependería de su coste para poder despegar.
El ADN tiene muchas ventajas para almacenar información digital. Es ultra compacto y puede durar cientos de años si se guarda en un lugar fresco y seco. Y puesto que las sociedades humanas saben leer y escribir el ADN, también podrán decodificarlo. “El ADN no se degrada con el tiempo como las cintas y los CDs, y no se hará obsoleto,” afirma Yaniv Erlich, científico informático de la Universidad de Columbia. Y a diferencia de otros métodos de alta densidad, tales como la manipulación de átomos individuales en una superficie, las nuevas tecnologías pueden escribir y leer grandes cantidades de ADN al mismo tiempo, permitiéndole ser amplificado.
Los científicos han almacenado información digital en el ADN desde el 2012. Eso ocurrió cuando los genetistas de Harvard George Church, Sri Kosuri, y sus colegas, cifraron un libro de 52,000 palabras en miles de fragmentos de ADN utilizando filamentos del alfabeto de cuatro letras del ADN, A, G, T y C, para cifrar los ceros y los unos del archivo digitalizado. Sin embargo, su esquema particular de cifrado resultó relativamente ineficiente, pues sólo tenía la capacidad de almacenar 1.28 petabytes por gramo de ADN. Otros métodos han resultado mejores. No obstante, ninguno ha sido capaz de almacenar más de la mitad de lo que los investigadores creen que el ADN puede realmente almacenar, que son cerca de 1.8 bits de datos por nucleótido de ADN. El número no es de 2 bits debido a errores de escritura y lectura del ADN raros pero inevitables).
Erlich pensó que podría acercarse a ese límite. Por lo tanto, él y Dina Zielinski, una científica adjunta del New York Genome Center, analizaron los algoritmos que fueron usados para cifrar y decodificar los datos. Comenzaron con seis archivos, incluyendo un sistema operativo informático completo, un virus de computadora, una película francesa de 1895 llamada Arrival of a Train at La Ciotat, un estudio de 1948 realizado por el teórico de la información Claude Shannon. Primero, convirtieron los archivos en cadenas binarias de unos y ceros, las comprimieron en un solo archivo maestro y luego dividieron los datos en cadenas cortas de código binario. Idearon un algoritmo llamado fuente de ADN, el cual aleatoriamente agrupaba las cadenas en los llamados droplets, a los cuales añadieron etiquetas adicionales para ayudar posteriormente a ensamblarlos nuevamente en el orden adecuado. En total, los investigadores generaron una lista digital de 72,000 filamentos de ADN, cada uno de 200 bases de longitud.
Los enviaron como archivos de texto a Twist Bioscience, una empresa de reciente creación localizada en San Francisco, California, que posteriormente sintetizó los filamentos de ADN. Dos semanas después, Erlich y Zielinski recibieron por correo una ampolla con un fragmento de ADN que contenía sus archivos cifrados. Para decodificarlos, utilizaron tecnología moderna. Las secuencias fueron introducidas en una ordenador, que traducía de vuelta el código genético en lenguaje binario y utilizaba las etiquetas para volver a ensamblar los seis archivos originales. El método funcionó tan bien que los nuevos archivos no contenían errores, han informado hoy en la publicación Science. También lograron hacer un número prácticamente ilimitado de copias sin errores de sus archivos a través de reacción en cadena de la polimerasa, una técnica estándar de copiado de ADN. Adicionalmente, afirma Erlich, fueron capaces de cifrar 1.6 bits de datos por nucleótido, 60% más que cualquier grupo que lo haya intentado antes y 85% del límite teórico.
“Me encanta el trabajo,” dice Kosuri, quien es ahora bioquímico de la Universidad de California, Los Ángeles. “Creo que es, en esencia, el estudio definitivo que muestra que se pueden almacenar datos en el ADN a gran escala.”
Sin embargo, Kosuri y Erlich advierten que el nuevo método no está listo todavía para un uso a gran escala. Cuesta $7000 sintetizar los 2 MB de datos de los archivos, y otros $2000 realizar la lectura. Es muy probable que el coste disminuya con el tiempo, sin embargo, aún queda mucho camino por recorrer, afirma Erlich. Y en comparación con otras formas de almacenamiento de datos, la lectura y escritura en el ADN es relativamente lenta. De esta manera, no se espera que el nuevo método sea veloz en caso de necesitar los datos al instante, aunque podría ser más adecuado para aplicaciones de archivado. Pero finalmente, ¿quién sabe? Tal vez los enormes centros de datos de Facebook y Amazon un día sean reemplazados por un par de camionetas de carga de ADN.
http://www.sciencemag.org/news/2017/03/dna-could-store-all-worlds-data-one-room
Fecha: 2 de marzo de 2017
Por Robert Service
Nota: Instituto Nutrigenómica no se hace responsable de las opiniones expresadas en el presente artículo.