El mundo se enfrenta a una crisis de almacenamiento de datos. A medida que la información prolifera en todo, desde videos de YouTube hasta imágenes astronómicas y correos electrónicos, la necesidad de almacenar esos datos está creciendo exponencialmente. Si las tendencias continúan, los centros de datos habrán agotado el silicio de grado microchip del mundo antes de 2040.

Pero hay otro medio de almacenamiento compuesto por abundantes átomos de carbono, hidrógeno, oxígeno, nitrógeno y fósforo. Se llama ADN. Y no necesitarías mucho. Los datos del mundo entero podrían almacenarse en solo un kilogramo de material. Eso dice Andy Extance en un interesante artículo en Nature, «Cómo el ADN podría almacenar todos los datos del mundo».

Para Nick Goldman, la idea de codificar datos en el ADN comenzó como una broma.

Era miércoles 16 de febrero de 2011, y Goldman estaba en un hotel en Hamburgo, Alemania, hablando con algunos de sus compañeros bioinformáticos sobre cómo podían permitirse almacenar la gran cantidad de secuencias del genoma y otros datos que el mundo les estaba arrojando. Recuerda que los científicos se sintieron tan frustrados por los gastos y las limitaciones de la tecnología informática convencional que empezaron a bromear sobre las alternativas de ciencia ficción. «Pensamos, ‘¿Qué nos impide usar ADN para almacenar información?'»

Entonces la risa cesó. «Fue un momento de bombilla», dice Goldman, líder de grupo en el Instituto Europeo de Bioinformática (EBI) en Hinxton, Reino Unido. [Énfasis añadido.]

Desde ese día, varias empresas han comenzado a convertir este «chiste» en un asunto serio. Semiconductor Research Corporation (SRC) lo respalda. IBM se está sumando. Y el Departamento de Defensa ha organizado talleres con las principales corporaciones, lo que seguramente conducirá a la financiación. El Reino Unido ya está financiando investigaciones sobre enfoques de próxima generación para el almacenamiento de ADN.

Cuando observa el gráfico de Extance, es fácil ver por qué el ADN es «uno de los candidatos más fuertes hasta ahora» para reemplazar el silicio como medio de almacenamiento del futuro. La velocidad de lectura y escritura es aproximadamente 30 veces más rápida que la del disco duro de su computadora. La retención de datos esperada es 10 veces mayor. El uso de energía es ridículamente bajo, casi mil millones de veces menos que la memoria flash. Y la densidad de datos es asombrosa de 1019 bits por centímetro cúbico, mil veces más que la memoria flash y un millón de veces más que un disco duro. A esa densidad, los datos del mundo entero podrían caber en un kilogramo de ADN.

Al igual que con cualquier nueva tecnología, los pequeños pasos son lentos. Los técnicos enfrentan los desafíos de diseñar cadenas de ADN para codificar datos, buscarlos y leerlos de manera confiable. ¿Cómo se traducen los bits binarios del silicio en A, C, T y G de ácidos nucleicos? ¿Se pueden fabricar hebras de ADN a un precio suficientemente económico? ¿Cómo pueden los diseñadores depurar la información de entrada?

Los seres vivos, sin embargo, ya han resuelto estos problemas. Después de todo, «un genoma humano completo encaja en una célula que es invisible a simple vista», dice Extance. En cuanto a la velocidad, numerosas máquinas moleculares acceden simultáneamente a todo el núcleo que saben exactamente por dónde empezar y dejar de leer. La maquinaria genómica en la célula corrige los errores a un error tipográfico por cada cien mil millones de bases, como señala el Dr. Lee Spetner en su libro Not by Chance! Eso es equivalente, dice, a la producción de por vida de unos 100 mecanógrafos profesionales.

La vida muestra que, en principio, es posible superar estos desafíos. Eso les da esperanza a los ingenieros a la vanguardia del almacenamiento de ADN. Varios experimentadores ya han logrado codificar información en el ADN. Para 2013, el Instituto Europeo de Bioinformática (EBI) había codificado los sonetos de Shakespeare y el discurso «Tengo un sueño» de Martin Luther King. IBM y Microsoft encabezaron ese esfuerzo de 739 kilobase poco después con 200 megabases de almacenamiento. Ya en 2010, el laboratorio de Craig Venter codificó texto dentro del genoma de su bacteria sintética. Todo lo vivo demuestra que el ADN ya es el medio de almacenamiento más flexible y útil del mundo. Solo necesitamos aprender a aprovechar la tecnología.

El laboratorio de EBI de Goldman y otros laboratorios están pensando en formas de garantizar la precisión. Un método convierte bits en «trits» (combinaciones de 0, 1 y 2) en un esquema de corrección de errores. Los ingenieros seguramente pensarán en soluciones sólidas, tal como lo hicieron los pioneros de las computadoras digitales con bits de paridad y otros mecanismos para garantizar una transmisión precisa a través de comunicaciones inalámbricas y por cable.

¿Cuánto tiempo podría durar el almacenamiento de ADN? Esa es otra ventaja potencial, mejor que la tecnología existente por órdenes de magnitud:

… Estos resultados convencieron a Goldman de que el ADN tenía el potencial de ser un depósito de datos económico a largo plazo que requeriría poca energía para almacenar. Como medida de cuán largo plazo, señala el anuncio de 2013 de un genoma de caballo descodificado a partir de un hueso atrapado en permafrost durante 700.000 años. “En los centros de datos, nadie confía en un disco duro después de tres años”, dice. “Nadie se fía de una cinta después de diez años como máximo. Cuando desee una copia segura para más que eso, una vez que podamos obtener esas escritas en el ADN, puede colocarla en una cueva y olvidarse de ella hasta que quiera leerla«.

Con estas ventajas de densidad, estabilidad y durabilidad, el ADN está creando un campo de investigación floreciente. Las preocupaciones sobre el acceso aleatorio ya se están superando. Con técnicas como PCR y CRISPR / Cas9, podemos esperar que se resuelvan los desafíos restantes. Mire lo que nuestros vecinos de la Universidad de Washington lograron recientemente:

Como demostración, los investigadores de Microsoft-University of Washington almacenaron 151 kB de imágenes, algunas codificadas con el método EBI y otras con su nuevo enfoque, en un solo grupo de cadenas. Extrajeron tres, un gato, la ópera de Sydney y un mono de dibujos animados, utilizando el método similar al de EBI, obteniendo un error de lectura que tuvieron que corregir manualmente. También leyeron la imagen de la Ópera de Sydney utilizando su nuevo método, sin errores.

Las fuerzas del mercado impulsan la innovación. La promesa del almacenamiento de ADN es tan atractiva que la financiación y el capital seguramente seguirán. Vendrán máquinas de síntesis de ADN. Se inventarán máquinas de acceso aleatorio con algoritmos de búsqueda eficientes. Los éxitos y los nuevos productos harán bajar los precios. Al igual que con la Ley de Moore para el silicio, la carrera por mejores productos de almacenamiento de ADN se acelerará una vez que pase del laboratorio al mercado. Extance concluye:

Goldman confía en que esto es solo una muestra de lo que vendrá. «Nuestra estimación es que necesitamos mejoras de 100.000 veces para que la tecnología funcione, y creemos que es muy creíble», dice. “Si bien el rendimiento anterior no es garantía, hay nuevas tecnologías de lectura que se incorporan cada año o dos. Seis órdenes de magnitud no son un gran problema en genómica. Espera un poco «.

Entonces, aquí tenemos las mejores mentes en tecnología de la información que intentan con urgencia ponerse al día con las tecnologías de almacenamiento que se han utilizado desde que comenzó la vida. Llegan solo unos pocos miles de millones de años a la fiesta. Las implicaciones son tan profundas como intuitivas.

Hablando de intuición, Douglas Axe en su reciente libro Innegable: cómo la biología confirma nuestra intuición de que la vida está diseñada define una cualidad que él llama coherencia funcional: “la disposición jerárquica de las partes necesarias para que cualquier cosa produzca una función de alto nivel, cada parte contribuyendo en una forma coordinada para el todo «. El escribe:

Ninguna función de alto nivel se logra sin que alguien piense en un arreglo especial de cosas y circunstancias para ese mismo propósito y luego ponga esos pensamientos en acción. El sello distintivo de todos estos arreglos especiales es la coherencia funcional de alto nivel, que ahora sabemos que proviene solo de la comprensión, nunca por coincidencia.

Los científicos buscan igualar el mismo nivel de coherencia funcional que se puede observar cada segundo en las células de nuestros propios cuerpos y de los microbios más simples. Difícilmente es necesario establecer la conclusión que se puede extraer de esto.

Crédito de la foto: PublicDomainPictures, vía Pixabay.

Artículo publicado originalmente en inglés por Evolution News