La base de datos en línea AlphaFold representa un avance sorprendente en cualquier medida de la palabra «avance». La biología es una ciencia mucho más fuerte hoy en día por tener AlphaFold en su armamento analítico.

Pero el algoritmo, por poderoso que sea, NO ha resuelto el problema del plegamiento de proteínas, si consideramos que ese problema significa esto:

  • Predecir la conformación tridimensional de una proteína estrictamente a partir de su secuencia primaria de ADN, ab initio.

Una analogía con el lenguaje natural puede ayudar. Supongamos que le doy una cadena de caracteres en inglés que nunca ha visto antes, sin contexto semántico circundante y sin léxico o referencias de diccionario correspondientes, ni siquiera aproximados. Aquí hay dos de esas palabras: estas son palabras que se usan semanalmente en las conversaciones familiares de mi familia durante más de 25 años:

  • googlimasha
  • mecky

Mi esposa y mis hijas saben EXACTAMENTE lo que significan estas palabras. ¿Tú? A menos que te lo hayamos dicho, casi seguro que no. (Desplácese hacia abajo hasta el final para conocer sus significados). En lo que respecta al lector, estas palabras son únicas y solo puede adivinar sus significados (roles funcionales en inglés).

AlphaFold utiliza secuencias existentes y sus conformaciones/estructuras conocidas para predecir estructuras desconocidas. Bajo la analogía del lenguaje natural, AlphaFold se basa en los diccionarios genéticos y proteómicos existentes. Pero si una secuencia existe como singleton, en una región aislada del espacio de secuencias, AlphaFold funciona mal. Lo que significa que el problema del plegamiento de proteínas, en su forma original, sigue sin resolverse.

Depende de tí descubrirlo

Un nuevo manuscrito inédito de Yves-Henri Sanejouand del Centro Nacional de Investigación Científica de Francia merece su atención, en relación con el problema del plegamiento de proteínas, pero también con la alta frecuencia de proteínas únicas (singleton) en especies eucariotas. Véase, «Sobre las proteínas desconocidas de los proteomas eucariotas». Las fascinantes implicaciones del análisis preliminar de Sanejouand están a su disposición para que las descubra.

Pero si uno amplía su alcance para incluir TODAS las secuencias de ácido nucleico en la Tierra (no solo eucariotas), las cosas se vuelven realmente salvajes. En un nuevo artículo de Environmental Microbiology, Eugene Koonin y sus colegas argumentan que, dada su diversidad de secuencias, los virus en la Tierra deben tener muchos orígenes independientes. Véase, “El viroma global: ¿cuánta diversidad y cuántos orígenes independientes?”

No hay teoría viable

Después de leer el artículo de Koonin et al., reflexione por un momento sobre sus implicaciones. La gran mayoría de la diversidad de ácidos nucleicos en este planeta es única, representada por singletons (énfasis agregado):

…también podemos estimar aproximadamente el tamaño del pangenoma del virus, en otras palabras, el número total de genes en la virosfera. Los virus grandes abarcan muchos genes específicos de especies pobremente conservados que obviamente representan la mayor parte del pangenoma del virus. Suponiendo 10 genes únicos de este tipo por especie de virus, habría entre 108 y 1010 genes de virus únicos en total, un vasto repertorio de genes, para decirlo con modestia.

Todas estas secuencias deben haber sido procesadas a través de un ribosoma, tomado de una célula de vida libre. Actualmente no existe una teoría viable para la replicación de genomas virales sin la presencia simultánea de sistemas orgánicos (básicamente, ribosomas) para ser secuestrados. Por lo tanto, el reloj evolutivo para el origen de 108 a 1010 genes virales no puede comenzar a correr hasta el origen de los ribosomas.

Esta parece ser la madre de todos los problemas de los tiempos de espera.

Ah, ¿y esas palabras que mencioné antes? “Googlimasha” es un sustantivo. Significa «lo que Paul hizo esa tarde para la cena, pero no quiere decirles a sus hijas cuando las recoja al final de la jornada escolar, porque se quejarán de que no están de humor para chuletas de cerdo, o lo que sea, y Paul, que acaba de trabajar como un esclavo en la preparación de la cena, simplemente no está interesado en su malcriado dolor de barriga suburbano”.

En cuanto a «mecky», puede ser un sustantivo, pero la mayoría de las veces es un adjetivo. Describe el estado híbrido de «diablos» y «desordenado», en otras palabras, una situación horrible que empeora constantemente. En su forma sustantiva, es un término cariñoso para el mismo Paul, usado con frecuencia por su hija, quien ahora es profesora de ciencias en una escuela secundaria en Yonkers, Nueva York.

Artículo publicado originalmente por Paul Nelson Ph.D en Evolution News & Science Today