Hace cuatro años, discutimos noticias sobre la posibilidad de utilizar ADN para almacenamiento informático. Sería ideal, dijeron los ingenieros de TI: el ADN es abundante, barato, estable y capaz de una enorme densidad de información. Todos los datos informáticos del mundo podrían almacenarse en un kilogramo de ADN. En ese momento, había desafíos para su aplicación práctica, especialmente al pasar de un medio de silicio a un medio biológico y viceversa.

En 2017, los ingenieros sintieron que los desafíos eran manejables, pero el almacenamiento de ADN aún no ha alcanzado una aplicación generalizada. Parte de esto podría deberse a la inercia; es difícil desplazar tecnologías de trabajo que parecen ser suficientes para la mayoría de las necesidades. Otro desafío sería construir una infraestructura «húmeda» para el almacenamiento de ADN a largo plazo.

Ahora, finalmente, la Universidad de Columbia ha informado de algunos avances. Nature escribe sobre «Discos duros diminutos que están vivos y se multiplican». Específicamente, «una bacteria común puede diseñarse para transportar mensajes codificados en su genoma».

Los datos se pueden almacenar a una alta densidad en moléculas de ADN, pero la mayoría de los métodos de almacenamiento actuales se basan en el ADN sintetizado en el laboratorio. Como alternativa, Harris Wang y sus colegas de la Universidad de Columbia en la ciudad de Nueva York diseñaron la bacteria Escherichia coli que, cuando se les aplica electricidad, realizan cambios distintivos en sus genomas. Los patrones genómicos de «electricidad encendida» y «electricidad apagada» sirven como el equivalente de los 1 y 0 utilizados en las computadoras digitales. [Énfasis añadido.]

El equipo de Columbia utilizó su nueva técnica para escribir «hola mundo» en los genomas bacterianos. El uso de bacterias vivas tiene varias ventajas. Por un lado, las secuencias genéticas diseñadas son heredables; las células hijas continúan transportando la información codificada. Otra ventaja es que la información no se degrada con la suciedad y otros contaminantes. La suciedad es como el hogar de los gérmenes. Y dado que la información tiene un código de barras genético, los datos se pueden reconstruir incluso si la E. coli se mezcla con otras especies de bacterias.

Este último hecho abre ideas para aplicaciones en esteganografía u ocultación de datos: ocultar mensajes a la vista. Me viene a la mente la trama de una novela de espías: el agente 008 raspa la suciedad de los zapatos y lee las instrucciones del cuartel general. ¡Nadie esperaría información compleja y especificada en la suciedad!

Criaturas de CRISPR

Paralelamente a los avances en el almacenamiento de ADN se ha producido la revolución de la edición de genes provocada por el descubrimiento del propio editor de genes de la naturaleza, el sistema de división de genes CRISPR-Cas9. Las bacterias usan el sistema para apuntar al ADN extraño y eliminarlo de sus genomas. Alrededor de 2012, los científicos se dieron cuenta de que podían usar CRISPR para apuntar y escindir genes específicos en casi cualquier organismo. La revolución de los transgénicos despegó.

El equipo de Columbia construyó un sistema CRISPR modificado que responde a las diferencias en las condiciones de reacción rédox. Su artículo en Nature Chemical Biology1 describe cómo esto les permitió escribir directamente en el genoma de E. coli, sin tener que secuenciar el mensaje de destino en el laboratorio. El resultado es un método «directo de digital a biológico» para escribir información de computadora en el ADN. La técnica es robusta y heredable, dicen:

El ADN ha sido el medio de almacenamiento de información predominante para la biología y es muy prometedor como medio de datos de alta densidad de próxima generación en la era digital. Actualmente, la gran mayoría de los enfoques de almacenamiento de datos basados ​​en ADN se basan en la síntesis de ADN in vitro. Como tal, existen métodos limitados para codificar datos digitales en los cromosomas de células vivas en un solo paso. A continuación, describimos un nuevo marco electrogenético para el almacenamiento directo de datos digitales en células vivas. Usando un sistema de adaptación CRISPR sensible a la reacción rédox diseñado, codificamos datos binarios en unidades de 3 bits en matrices CRISPR de células bacterianas mediante estimulación eléctrica. Demostramos la codificación de datos multiplexados en poblaciones de células con códigos de barras para producir un almacenamiento de información significativo y una capacidad de hasta 72 bits, que se puede mantener durante muchas generaciones en entornos abiertos naturales. Este trabajo establece un marco de almacenamiento de datos directo de digital a biológico y avanza nuestra capacidad para el intercambio de información entre entidades basadas en silicio y carbono.

Un diagrama en el documento muestra ambas operaciones de lectura / escritura en el sistema. Existe una correspondencia uno a uno entre los bits de la computadora digital y los codones artificiales del ADN.

Seguridad de datos

La capacidad de las bacterias para propagarse con el mensaje alivia las preocupaciones sobre la pérdida de datos por accidentes. Dado que las bacterias se replican de forma natural, vienen con un sistema de respaldo incorporado. Los científicos pueden simplemente llevar viales de las células hijas a otro lugar en caso de incendio o desastre. La antigua forma de hacer copias de seguridad fuera del sitio era copiar tediosamente los datos en cintas magnéticas durante la noche y luego transportarlos en camiones para asegurar las bóvedas por la mañana. Piense en lo más fácil que podría ser el almacenamiento de ADN fuera del sitio. Si un kilogramo de ADN pudiera contener los datos del mundo, un ciclista probablemente podría transportar los datos de su empresa en un contenedor del tamaño de una cabeza de alfiler. Mejor aún, la información «basada en silicio» podría transferirse a través de Internet a otro sistema «basado en carbono» en todo el país. Y a diferencia de la cinta magnética, el medio no tendría que devolverse para su reciclaje. Simplemente vuelva a codificar otro lote de bacterias E. coli, que son ubicuas. Solo el sistema de lectura / escritura debería estar disponible en los sitios de respaldo.

Implicaciones para el DI

Esta historia recuerda principios importantes sobre el diseño inteligente. Una es que la información es independiente del medio que la transmite. Considere algunos casos simples de mensajería a través de animales. Suponga que un granjero entrena a su caballo para que mueva la cabeza de una manera en respuesta a una pregunta y de otra en respuesta a otra pregunta. Envía al caballo al trote a la casa del vecino, y el vecino, conociendo el código, obtiene la respuesta. El caballo, esperando una zanahoria, sería ajeno a cualquier significado en los sonidos o los movimientos de cabeza. Un loro podría decir un mensaje corto en lenguaje humano, pero tampoco tendría idea de lo que significan los sonidos. Una paloma migratoria podría llevar un correo en su pico. Hasta donde sabemos, en ejemplos como estos (y perdón por aquellos que piensan que Lassie entendió las palabras que Timmy le estaba diciendo al perro que ladrara a su madre), solo la inteligencia humana es capaz de discernir y comprender la información semántica codificada en palabras y símbolos. . Ciertamente, las bacterias no. El punto es que cualquier animal podría posiblemente desempeñar el papel de E. coli en el sistema de almacenamiento CRISPR, pero las bacterias, al ser microscópicas, son más convenientes para transportar grandes cantidades de datos.

Siguiendo este pensamiento, incluso el ADN bacteriano es ajeno al significado de su código. Las secuencias naturales (por ejemplo, genes) y las secuencias artificiales introducidas por los ingenieros no significan nada para los nucleótidos, así como las secuencias de bits no significan nada para los circuitos integrados que las transmiten. Solo las mentes de los diseñadores y los usuarios saben lo que «quieren decir». La semántica es ortogonal a la secuencia.

La presencia de un sistema de traducción también es indicativo de un diseño inteligente. La ilustración anterior de un caballo moviendo la cabeza muestra por qué; el caballo escucharía un sonido completamente diferente si el dueño hablara la misma pregunta en mongol o francés. Podría ser entrenado para hacer el mismo movimiento de cabeza, transmitiendo el mismo mensaje, a cualquier inteligencia humana que conozca el código, incluso si el propietario habla inglés y el vecino habla chino. De hecho, podría haber una cadena de diferentes animales entrenados para transmitir el mensaje sin entenderlo: caballo a loro a paloma migratoria a perro a vecino. William Dembski llama a esta propiedad la «realizabilidad múltiple» de la información.2

Para otro ejemplo, piense en un hombre que escribe «Te amo» en la arena de una playa de California. Un amigo le toma una foto y la envía a una empresa de redacción aérea. El piloto lo escribe en el cielo y a la esposa le da un vuelco el corazón en Nueva York. El mismo mensaje pasó de la mente a la arena, al sensor de la cámara, al teclado mecánico, a los circuitos integrados, al espacio (si los bits pasan a través de un enlace satelital), a los LED en una pantalla, al avión, a los rastros de vapor en el cielo, a la retina de la esposa, a su cerebro. . El mismo mensaje se ha transmitido en varios medios, lo que demuestra que la información no es física. Es justo preguntar, ¿qué (o quién) puso la información en el ADN de E. coli?

Traducción no humana

Los ejemplos anteriores de esquemas de traducción son productos de diseño humano. ¿Qué pensaría un observador de mentalidad materialista de una instancia no humana de un sistema de traducción? Podría proponer la hipótesis de un ciclo de retroalimentación, del cual hay muchos ejemplos en la naturaleza. En la ciencia del clima, por ejemplo, el aumento de la temperatura del océano puede crear nubes que bajan la temperatura (retroalimentación negativa). La radiactividad natural podría alcanzar un punto crítico para iniciar la fisión nuclear (retroalimentación positiva). Los poderes naturales también podrían considerarse sistemas de traducción. Dependiendo del flujo estacional, algunos arroyos de las cuevas crean sifones naturales que arrojan agua periódicamente al exterior, lo que influye en el entorno exterior del río. Un geólogo podría considerar los efectos codificados en la arena del río como un indicador de la estación. El problema de esas propuestas de traducción de información es que no tienen significado semántico, salvo el de la inteligencia humana que las interpreta. También carecen de suficiente información compleja especificada para pasar el filtro de diseño.

Existe un notable sistema de traducción en el núcleo de cada célula viva que cumple con los requisitos de complejidad y especificidad: el sistema de traducción del ADN, donde la información del código del ADN (nucleótidos) se traduce en información funcional en el código de la proteína (aminoácidos). Los nucleótidos y los aminoácidos son portadores de información pero no originadores de información. Los dos códigos se unen en máquinas que relacionan ambos códigos: la familia de veinte aaRS-tRNA sintetasas que leen un codón de nucleótido en un ARN de transferencia y le fijan el aminoácido apropiado en el otro extremo. El codón no tiene relación semántica con el aminoácido. AGC no «significa» serina; no parece serina; no actúa como la serina. La sintetasa une a los dos porque esa es la convención en un código genético universal.

Un sello distintivo del diseño

Una convención de idiomas es un sello distintivo del diseño inteligente. El ribosoma luego lee el código de nucleótidos como una cinta de papel y une los aminoácidos en una proteína. Ingrese información de ADN; información de proteínas de salida. Ninguna de las moléculas «sabe» lo que está pasando; simplemente funcionan porque fueron diseñados para seguir instrucciones integradas desde fuera del sistema.

Para relacionar esta realidad con el sistema de almacenamiento bacteriano del equipo de Columbia, los nucleótidos son como el mensaje que los ingenieros humanos decidieron enviar y anotar. Las proteínas son como la secuencia que termina en el genoma bacteriano. Nada de eso tiene ningún significado para las moléculas involucradas. Sólo la mente humana al principio y el lector humano al final comprenden el significado; el resto es solo mecánica.

Cuando se observa un sistema de traducción como ADN a proteína, por lo tanto, se puede inferir una mente antes del mensaje de ADN. Si el resultado deseado es una proteína funcional al final de la línea, un diseñador inteligente tuvo que haber tenido la previsión de diseñar una cadena de máquinas que almacenarían el mensaje en una molécula estable (ADN) y también lo traducirían a formas muy diferentes. moléculas (aminoácidos), cuya secuencia particular podría realizar el trabajo necesario. Dado que está claro que se necesitaba una mente diseñadora inteligente en la parte delantera del sistema de almacenamiento de ADN de Columbia, también se necesitaba una mente diseñadora inteligente en la parte delantera del sistema de traducción de información de ADN.

Para pensar: si un biólogo secuenciara las bacterias del equipo de Columbia y no supiera sobre la región que contiene el mensaje, ¿lo considerarían ADN basura? Si se les dice que es un mensaje incrustado, ¿esperarían que las mutaciones aleatorias mejorarían el mensaje o lo convertirían en un mensaje con más información semántica?

Notas

  1. Yim, S.S., McBee, R.M., Song, A.M. et al. Robust direct digital-to-biological data storage in living cells. Nat Chem Biol (2021). https://doi.org/10.1038/s41589-020-00711-4.
  2. Dembski, William. Being as Communion (Ashgate, 2014), p. 100.

Artículo originalmente publicado en inglés por Evolution News