En el debate sobre la evolución, un tema clave es la capacidad de la selección natural para producir innovaciones complejas. En un artículo anterior, expliqué con base en teorías de ingeniería de la innovación por qué los cambios a pequeña escala que impulsan la microevolución no pueden acumularse para generar los cambios a gran escala necesarios para la macroevolución. Esta observación corresponde perfectamente a la investigación en biología del desarrollo y al patrón del registro fósil. Sin embargo, las limitaciones de la evolución darwiniana se han demostrado aún más rigurosamente desde los campos de la computación evolutiva y las matemáticas. Estos desafíos teóricos se detallan en un nuevo libro que se publica esta semana, Introduction to Evolutionary Informatics [Introducción a la informática evolutiva].
Los autores Robert Marks, William Dembski y Winston Ewert aportan décadas de experiencia en algoritmos de búsqueda y teoría de la información para analizar la capacidad de la evolución biológica para generar diversas formas de vida. Su conclusión es que ningún proceso evolutivo es capaz de producir resultados diferentes (por ejemplo, nuevos planes corporales), sino que se limita a una gama muy estrecha de resultados (por ejemplo, pinzones con diferentes tamaños de pico). Más bien, producir algo de complejidad significativa requiere que el conocimiento de los resultados se programe en las rutinas de búsqueda. Por lo tanto, cualquier afirmación de la capacidad ilimitada de la evolución no dirigida para transformar la vida es necesariamente inverosímil.
Los autores comienzan su discusión proporcionando algunos antecedentes necesarios. Presentan una descripción general de cómo se define la información y definen las medidas estándar de complejidad de KCS (Kolmogorov-Chaitin-Solomonov) e información de Shannon. El primero proporciona ese número mínimo de bits necesarios para repetir un patrón: la máxima compresibilidad. Este último se relaciona con el logaritmo de la probabilidad de que surja algún patrón como resultado. Por ejemplo, la probabilidad de lanzar cinco monedas y que todas caigan cara es 1/32. El contenido de información de CCCCC es entonces el log negativo (base 2) de 1/32, que es de 5 bits. Más simplemente, un resultado específico de 5 lanzamientos de monedas equivale a 5 bits de información.
Describen cómo las búsquedas en ingeniería para algún resultado de diseño involucran los tres componentes de experiencia en el dominio, criterios de diseño y búsqueda iterativa. El proceso implica la creación de un prototipo y luego verificar si cumple con los criterios, lo que funciona como un objetivo teleológico. Si el diseño inicial no lo hace, se refina el prototipo y se repite la prueba. Cuanto mayor sea la experiencia en el dominio, más eficientemente se realizarán los ajustes, por lo que es necesario probar menos posibilidades. Entonces, el éxito se puede lograr más rápidamente.
Demuestran este proceso con un ejemplo hogareño: cocinar panqueques. El primer caso implica ajustar los tiempos de cocción de los panqueques por delante y por detrás. Un panqueque inicial se cocinó dos veces al azar y luego se probó. Según el sabor, los tiempos se ajustaron luego para la segunda iteración. Este proceso se repitió hasta que el sabor de un panqueque alcanzó un umbral de calidad. Para casos futuros, se agregaron variables adicionales, como la cantidad de leche utilizada en la masa, el ajuste de temperatura y la cantidad de sal agregada. Si a cada variable se le asignó un valor entre 1 y 10, como los diez ajustes en el quemador de la estufa, el número de posibles intentos aumentaba en un factor de 10 para cada nueva variable. El número de posibilidades crece muy rápidamente.
Para varias variables, si el catador no tuviera conocimientos de cocina, el tiempo necesario para encontrar un resultado adecuado probablemente sería prohibitivamente largo. Sin embargo, con un mayor conocimiento, se podrían tomar mejores decisiones para reducir el número de búsquedas requeridas. Por ejemplo, un cocinero experimentado (es decir, un cocinero con mayor experiencia en el dominio) sabría que el tiempo en ambos lados debe ser aproximadamente el mismo y que los panqueques que son demasiado aguados requieren harina adicional.
Este ejemplo sigue el enfoque básico de las búsquedas comunes de diseño evolutivo. La principal diferencia es que a menudo se pueden simular varios ensayos en una computadora a la vez. Luego, cada individuo puede ser probado y alterado de forma independiente. Los componentes de cada ciclo incluyen una función de aptitud (también conocida como oráculo) para definir el estado de un individuo (por ejemplo, el sabor del panqueque), un método para determinar qué individuos se eliminan y cuáles permanecen o se duplican, y cómo se modifican los individuos para la siguiente iteración (por ejemplo, más leche). Los autores proporcionan varios ejemplos de cómo estos algoritmos evolutivos podrían aplicarse a diferentes problemas. Uno de los ejemplos más interesantes que dan es cómo la NASA usó un algoritmo evolutivo para doblar una longitud de cable en una antena de banda X efectiva.
De esta forma, los autores demuestran las limitaciones de los algoritmos evolutivos. El desafío general es que todos los algoritmos evolutivos se limitan a converger en un rango muy estrecho de resultados, un límite conocido como techo de Basener. Por ejemplo, un programa diseñado para producir una antena convergerá en el mejor de los casos a la solución de una antena óptima y luego permanecerá atascado. Nunca podría generar un resultado completamente diferente, como una trampa para ratones. Alternativamente, un algoritmo diseñado para generar una estrategia para jugar a las damas nunca podría generar una estrategia para jugar al backgammon. Para cambiar los resultados, el programa tendría que ajustarse deliberadamente para lograr una meta predeterminada separada. En el contexto de la evolución, ningún proceso aleatorio podría converger en un organismo, como un pez, y luego converger en un anfibio.
Este principio se ha demostrado tanto en simulaciones como en experimentos. El programa Tierra fue creado con la esperanza de simular la evolución biológica a gran escala. Sus resultados fueron decepcionantes. Surgieron varios organismos simulados, pero su variabilidad pronto llegó al techo de Basener. Nunca se generó una verdadera novedad, sino simplemente reordenamientos limitados de la información suministrada inicialmente. Hemos visto un resultado similar en experimentos con bacterias realizados por el biólogo del estado de Michigan Richard Lenski. Hizo un seguimiento del desarrollo de 58.000 generaciones de E. coli. No vio una verdadera innovación, sino principalmente la ruptura de genes no esenciales para ahorrar energía y el reordenamiento de la información genética para acceder a capacidades preexistentes, como el metabolismo del citrato, bajo diferentes tensiones ambientales. Los cambios siempre fueron de alcance limitado y de magnitud limitada.
Los autores presentan una limitación aún más definitoria, basada en los Teoremas de Sin almuerzo gratis (NFL), que se conoce como Conservación de la Información (COI). En pocas palabras, ninguna estrategia de búsqueda puede, en promedio, encontrar un objetivo más rápidamente que una búsqueda aleatoria, a menos que se incorpore alguna información sobre ese objetivo en el proceso de búsqueda. A modo de ilustración, imagina a alguien que te pide que adivines el nombre de una persona famosa, pero sin darte ninguna información sobre esa persona. Puede utilizar muchas estrategias diferentes de adivinación, como enumerar a las personas famosas que conoce en orden alfabético, por altura o por fecha de nacimiento. Ninguna estrategia pudo determinarse de antemano como mejor que una búsqueda aleatoria.
Sin embargo, si se le permitiera hacer una serie de preguntas, las respuestas le darían información que podría ayudar a limitar o guiar su búsqueda. Por ejemplo, si le dijeran que la persona famosa era contemporánea, eso reduciría drásticamente su espacio de búsqueda. Si luego supiera que la persona era un actor, tendría aún más orientación sobre cómo adivinar. O puede que sepa que el que elige es un fanático de la ciencia ficción, en cuyo caso podría enfocar sus conjeturas en las personas asociadas con el género de ciencia ficción.
Podemos entender el teorema de forma más cuantitativa. El tamaño de su espacio de búsqueda inicial podría definirse en términos de la medida de información de Shannon. Si supiera que uno de los 32 personajes famosos es el objetivo, el espacio de búsqueda correspondería al registro (base 2) de 32, que es de 5 bits. Este valor se conoce como información endógena de la búsqueda. La información proporcionada de antemano para ayudar en la búsqueda se conoce como información activa. Si le dieran información que eliminara todas las opciones posibles excepto 1/4, tendría log (base 2) de 4, que son 2 bits de información activa. La información asociada con encontrar el objetivo en el espacio de búsqueda reducido es entonces el registro (base 2) de 32/4, que es de 3 bits. La información relacionada con la búsqueda se conserva: 5 bits (endógeno) = 2 bits (activo) + 3 bits (espacio de búsqueda restante).
El teorema de la conservación de la información es válido para todas las búsquedas evolutivas. El programa de antenas de la NASA solo funciona porque utiliza un método de búsqueda que incorpora información sobre antenas efectivas. Otros programas diseñados para simular la evolución, como Avida, también cuentan con la información activa necesaria para generar los resultados deseados. Por el contrario, la evolución biológica está dirigida por la selección natural ciega, que no tiene información activa para ayudar en la búsqueda de nuevos objetivos. El proceso no se ve favorecido por cambios en el entorno o interacciones coevolutivas, que alteran el panorama de la aptitud, ya que tales cambios no contienen información activa relacionada con un resultado radicalmente diferente.
Al final, la información endógena asociada con encontrar un nuevo plan corporal o alguna otra modificación significativa es mucho mayor que la asociada con el espacio de búsqueda que la descendencia biológica posiblemente podría explorar en toda la era del universo. Por lo tanto, como estos autores muestran con fuerza, en línea con muchas investigaciones anteriores en el campo del diseño inteligente, todas las innovaciones radicales en la naturaleza requerían información de alguna fuente inteligente externa.
Artículo publicado originalmente en inglés por Brian Miller Ph.D. en Evolution News