Un nuevo artículo en Nature Reviews Genetics, «Superando desafíos y dogmas para comprender las funciones de los pseudogenes», es simplemente increíble. Documenta no solo que se ha encontrado que los pseudogenes tienen una función generalizada, sino también que bajo el «dogma» actual en biología, y dadas las limitaciones técnicas, no estamos reconociendo sus funciones. Como lo expresó Seth W. Cheetham y sus coautores, la biología sufre de «desmotivación en la exploración de la función del pseudogen por la suposición a priori de que no tienen función», donde «La limitación dominante en el avance de la investigación de pseudogenes ahora radica en las trampas de la mentalidad predominante de que las regiones pseudogénicas son intrínsecamente no funcionales «.

El resumen expone exactamente lo que piensan:

Los pseudogenes se definen como regiones del genoma que contienen copias defectuosas de genes. Existen en casi todas las formas de vida, y en los genomas de mamíferos se anotan en números similares a los genes codificadores de proteínas reconocidos. Aunque a menudo se presume que carece de función, se encuentra que un número creciente de pseudogenes desempeña funciones biológicas importantes. Teniendo en cuenta sus orígenes evolutivos y las limitaciones inherentes a las prácticas de anotación del genoma, postulamos que los pseudogenes se han clasificado sobre una base científicamente sin fundamento. Reflejamos que un amplio malentendido de los pseudogenes, perpetuado en parte por la inferencia peyorativa de la etiqueta de «pseudogenes», ha llevado a su frecuente abandono de evaluación funcional y la exclusión de los análisis genómicos. Con el advenimiento de tecnologías que simplifican el estudio de los pseudogenes, proponemos que una reevaluación objetiva de estos elementos genómicos revelará información valiosa sobre la función y evolución del genoma.

Inmediatamente advierten que hay muchos casos en los que se descubrió que el ADN que se descartó como basura pseudogénica era funcional: «con un número creciente de regiones anotadas de pseudogene que luego se descubre que exhiben una función biológica, existe un riesgo emergente de que estas regiones del genoma se descartan prematuramente como pseudogénicos y, por lo tanto, se consideran vacíos de función «

Busca la funcionalidad y la encontrarás

En 2003, Francisco Ayala y Evgeniy Balakirev escribieron en la Revisión Anual de Genética que «los pseudogenes que han sido investigados adecuadamente a menudo exhiben roles funcionales». Este nuevo artículo de Nature Reviews Genetics ofrece una declaración muy similar: «Donde los pseudogenes se han estudiado directamente, a menudo se descubre que tienen roles biológicos cuantificables». Es una narración larga que relata cuántos científicos descartaron erróneamente extensiones de ADN como «pseudogenes». Documentan docenas de casos en los que se ha encontrado que los» pseudogenes «en humanos y otros organismos tienen función.

Algunas de estas funciones están «basadas en proteínas», lo que significa que el pseudogen en realidad genera una proteína funcional. Pero otras funciones pueden ser «basadas en ARN» o «basadas en ADN». Por ejemplo, la mayoría de los evolucionistas supondría que un pseudogen que no produce una proteína no puede ser funcional. Pero el artículo observa que los «pseudogenes» que no pueden traducirse en una proteína aún pueden tener una función a través de su transcripción de ARN:

Muchos pseudogenes contienen una frecuencia de mutaciones que los hace improbables de ser (o incapaces de ser) traducidos en proteínas. Sin embargo, tales mutaciones no necesariamente impiden que los pseudogenes realicen una función biológica.

El documento señala que incluso si la transcripción de ARN de un pseudogen no puede traducirse en proteína, «se han descrito una miríada de mecanismos reguladores basados ​​en ARN para pseudogenes, incluido el procesamiento en pequeños ARN interferentes (ARNip) que pueden regular sus genes padres , actuando como un señuelo para los factores de transcripción y, lo más importante, como esponjas moleculares para microARN «.

Muchos evolucionistas supondrían con fuerza que si un pseudogen ni siquiera puede producir una transcripción de ARN, entonces no puede ser funcional. Pero resulta que los pseudogenes que no producen ninguna transcripción de ARN (es decir, no se transcriben) aún pueden tener funciones importantes:

Otro mecanismo a través del cual los pseudogenes pueden funcionar es influenciando la cromatina o la arquitectura genómica. HBBP1, un pseudogen que reside dentro del locus de hemoglobina, permite los cambios dinámicos de cromatina que regulan la expresión de genes de globina fetales y adultos durante el desarrollo. Notablemente, aunque inhibir la transcripción de HBBP1 no tiene ningún efecto, la eliminación del locus genómico reactiva la expresión de globina fetal. Los contactos de ADN HBBP1, pero no la transcripción, son necesarios para suprimir la expresión de genes de globina fetal en células eritroides adultas.

En el documento se registra una variedad de otras funciones no transcripcionales, que incluyen la estabilización de los cromosomas, la mediación del empalme de la transcripción y la regulación de la recombinación. Por lo tanto, en muchos casos, el número de copias de pseudogenes parece tener una importancia funcional, donde las desviaciones del estado genético normal causan la enfermedad. Ellos predicen: «Se espera que en los próximos años se identifiquen más vínculos entre los polimorfismos del pseudogen humano y las enfermedades complejas».

La implicación es que una razón por la que presumimos que los pseudogenes no tienen función es porque no hemos estado buscando sus funciones. ¿Y por qué no buscamos sus funciones? ¡Porque supusimos que no funcionaban! Entonces, hay un aspecto circular en el razonamiento aquí. Ha creado el paradigma de ADN basura que detiene la ciencia, lo que nos ha impedido entender lo que realmente hacen los pseudogenes.

No anomalías

La respuesta típica de los evolucionistas sería que todos estos ejemplos de pseudogenes funcionales son solo casos aislados, y que la mayor parte de los pseudogenes son claramente basura. Los autores del artículo, que no dan muestras de simpatía por el diseño inteligente, pero definitivamente se oponen a descartar a los pseudogenes como «basura», son conscientes de esta objeción. Dicen lo siguiente en refutación directa:

Los ejemplos de función de pseudogene elaborados aquí no deberían implicar que la funcionalidad de pseudogene es probable que se limite a instancias aisladas. Al menos el 15% de los pseudogenes son transcripcionalmente activos en tres filamentos, muchos de los cuales son proximales a las regiones reguladoras conservadas. Se estima que al menos 63 nuevos genes codificadores de proteínas específicas de humanos se formaron por retrotransposición desde la divergencia de otros primates. Numerosos «retrogenes» continúan siendo reconocidos como genes que codifican proteínas funcionales en lugar de pseudogenes entre especies. Los enfoques de espectrometría de masas de alto rendimiento y perfil ribosómico han identificado cientos de pseudogenes que se traducen en péptidos. Aunque las funciones de estos péptidos aún no se han determinado experimentalmente, tales ejemplos ilustran el desafío de corroborar una dicotomía gen-pseudogen.

Continúan: “Como la abundancia de tales funciones adquiridas [ADN que no codifica] no parece ser un fenómeno especialmente raro o aislado, parecería negligente tomar la perspectiva predeterminada de que los pseudogenes procesados ​​no tienen función. En cambio, es probable que las regiones del genoma que contienen pseudogenes alberguen funciones biológicas importantes que aún no se han revelado».

Señalan que los métodos algorítmicos y computacionales actuales empleados para diferenciar los pseudogenes y los genes codificadores de proteínas pueden sobrestimar la proporción del genoma que se compone de pseudogenes. ¿Por qué? Debido a que las propiedades que se utilizan para definir muchos «pseudogenes» también se encuentran a menudo en genes codificadores de proteínas normales. Por ejemplo:

  • Los pseudogenes procesados ​​a menudo se identifican por su falta de intrones, pero algunos genes que codifican proteínas también carecen de intrones.
  • Algunos pseudogenes carecen de «mutación sin sentido» que truncan la proteína y, por lo tanto, «tienen la misma capacidad de codificación de proteínas que sus genes originales».
  • Las bajas proporciones de mutaciones no sinónimas a sinónimas no distinguen los pseudogenes recientes de los genes normales.
  • La falta de transcripción no es una buena prueba porque «determinar el estado transcripcional de los pseudogenes es técnicamente un desafío».

Debido a esto, argumentan que «la diferenciación computacional de los pseudogenes de los genes en un sistema puramente basado en reglas es poco probable que sea factible, ya que inherentemente entrará en conflicto con muchos genes codificadores de proteínas». Por lo tanto, proponen afirmaciones notablemente más suaves que un tramo de ADN es un pseudogen: «puede ser útil considerar la anotación de pseudogenes en genomas como una predicción o una hipótesis en lugar de una clasificación».

Como muestran los autores, debe abandonarse la presunción de que un pseudogen no funciona. Pero entonces, ¿por qué seguimos suponiendo que no funcionan? Hay tres razones principales: (1) el pensamiento evolutivo ha supuesto que los pseudogenes son basura sin función, (2) el «dogma» terminológico refuerza una «mentalidad de que las regiones pseudogénicas son intrínsecamente no funcionales», y (3) las limitaciones tecnológicas nos impiden descubrir su función El documento reconoce que el problema (3) se deriva del problema (2), pero no reconoce explícitamente que ambos problemas (2) y (3) finalmente se derivan del problema (1). De hecho, ni siquiera identifica el problema (1) como un problema. Sin embargo, toda la situación se remonta a malas predicciones evolutivas. Veamos estas causas brevemente, en orden inverso:

(3) Limitaciones tecnológicas

La causa proximal que nos impide comprender las funciones del pseudogen son las limitaciones tecnológicas. Debido al paradigma del ADN basura, muchas de nuestras técnicas y tecnologías bioquímicas están configuradas solo para identificar genes codificadores de proteínas estándar. Ignoran y descartan el ADN que no encaja en ese molde. Solo actualizando nuestra tecnología para detectar elementos funcionales de ADN que no necesariamente se ajustan a la definición estándar de un «gen» podemos comenzar a comprender qué hacen realmente los pseudogenes. El documento explica que las limitaciones técnicas, informadas por nuestros prejuicios y suposiciones, desmotivan el estudio de las funciones de pseudogen:

Además de la desmotivación para explorar la función del pseudogen por la suposición a priori de que no tienen función, su estudio sistemático también se ha visto obstaculizado por la falta de metodologías robustas capaces de distinguir las actividades biológicas de los pseudogenes de las funciones de los genes de los que son derivado.

Comparan la situación con la de los ARN no codificantes largos (lncRNA), que «inicialmente fueron descartados de manera similar por emanar ‘ADN basura’ o como ruido transcripcional, en gran parte en virtud de su definición como codificación no proteica». Con el desarrollo de la tecnología, los lncRNA ahora son ampliamente reconocidos como funcionales y regularmente analizamos sus funciones:

Tras una combinación de desarrollos tecnológicos, estudios de todo el genoma y estudios bioquímicos detallados, los lncRNA ahora se incluyen de manera rutinaria en los análisis de todo el genoma, y ​​su potencial funcional como reguladores celulares es ampliamente reconocido.

Sin embargo, en la actualidad, los autores señalan que «debido en parte al desafío experimental de investigar su función y expresión, los pseudogenes están típicamente excluidos de las pantallas funcionales y análisis de expresión de todo el genoma». En otras palabras, una de las razones principales por las que no estamos encontrando la función de pseudogenes es porque no la estamos buscando. Esto necesita cambiar, y argumentan que se puede.

Por ejemplo, según el artículo, los pseudogenes procesados ​​»se suponía que se habían silenciado transcripcionalmente por la pérdida de elementos reguladores en cis«. Pero ahora sabemos que «miles de copias de genes retrotranspuestos se transcriben y a menudo se empalman en proteínas conocidas». codificación de transcripciones «y» hasta 10,000 pseudogenes de ratón tienen evidencia de transcripción». Al tratar de estudiar estas transcripciones podemos entender lo que pueden estar haciendo.

Una complicación es que la transcripción del pseudogen muestra «especificidad de tipo celular y expresión dinámica», lo que significa que solo se pueden transcribir en lugares particulares en momentos particulares. ¡Esta es una razón más para no asumir que la falta de evidencia para la función de un pseudogen es evidencia de que el pseudogene no tiene función! Es muy probable que sea funcional en un tipo de célula o en una situación que todavía no hemos investigado adecuadamente. Tal como lo expresan, «el uso de ensayos inadecuados para el análisis de pseudogenes ha posiblemente obstaculizado el esclarecimiento de sus roles biológicos». Pero tienen esperanzas: «Los enfoques basados ​​en CRISPR, aplicados cuidadosamente, tienen el potencial de revolucionar nuestra capacidad de disección». las funciones de los pseudogenes». Llegan a la conclusión de que es hora de dejar de excluir a los pseudogenes de los análisis bioquímicos y comenzar a utilizar técnicas que puedan identificar sus funciones:

El uso de una definición liberal de pseudogenes es atractivo ya que simplifica los análisis genómicos. Este enfoque, a menudo sin saberlo para el investigador, conduce a la consolidación de la clasificación de pseudogene, es decir, su exclusión por conveniencia en estudios funcionales. Muchas regiones ahora consideradas como «genes muertos» potencialmente codifican elementos reguladores en cis, ARN no codificantes y proteínas con impactos en la biología y la salud humana. En consecuencia, determinar las funciones de los supuestos pseudogenes garantiza la búsqueda activa mediante su inclusión en pantallas funcionales y análisis de datos genómicos, transcriptómicos y proteómicos. Con las innovaciones en la secuencia de lectura larga y las metodologías basadas en CRISPR ahora fácilmente accesibles, las limitaciones tecnológicas que anteriormente motivaban la exclusión de la investigación funcional se resuelven en gran medida.

Hasta que desarrollemos y apliquemos estas tecnologías para poner a los pseudogenes a prueba, la suposición de que son basura sin función es completamente injustificada. Y no es difícil predecir cuál será el resultado. Como señalaron Ayala y Balakirev, «los pseudogenes que se han investigado adecuadamente a menudo exhiben roles funcionales». O como observa este nuevo artículo, «donde los pseudogenes se han estudiado directamente, a menudo se descubre que tienen roles biológicos cuantificables».

(2) Mala terminología y falsos paradigmas

La tecnología solo refleja lo que la gente quiere hacer, y hay razones por las cuales los biólogos apenas han creado tecnología para investigar pseudogenes: los biólogos suponen (erróneamente) que los pseudogenes son basura no funcional. El artículo argumenta que la terminología asociada con el paradigma de ADN «basura» desalienta la investigación de su función. Por lo tanto, tenemos términos como «pseudogenes» que, por su propia naturaleza, implican que el ADN no es un gen, sino algo así como un gen aspirante que no hace nada. Como señalan los autores, la definición de un «pseudogen» como «defectuoso» significa «la no funcionalidad de los pseudogenes sigue siendo la percepción dominante y predeterminada». Citando a Thomas Kuhn y su concepto de un «paradigma dominante» que es intolerante a las críticas, azotan el paradigma basura- «pseudogen» en términos fuertes:

[El] pseudogen en sí mismo afirma un paradigma de no funcionalidad a través de su construcción taxonómica. Los pseudogenes se definen como defectuosos y no genes. Este punto se destaca porque se sabe que un lenguaje imparcial en la ciencia restringe inherentemente la investigación neutral entre paradigmas en conflicto. En el caso de los pseudogenes, el término en sí está construido para apoyar el paradigma dominante y, por lo tanto, limitar, consciente o inconscientemente, la objetividad científica en su investigación.

Es difícil imaginar una mayor acusación de la idea de que los pseudogenes generalmente no funcionan. Continúan explicando cómo el uso del término «pseudogen» dificulta la investigación científica:

Aunque el concepto de pseudogen surgió para describir un fenómeno molecular individual, el término se adoptó rápidamente para anotar decenas de miles de regiones genómicas que solo cumplían criterios poco definidos y se axiomatizaba efectivamente sin estar sujeto a ningún debate científico riguroso. Esta falta de proceso de búsqueda de consenso ha dejado a la biología genómica con un concepto heredado que oscurece la investigación objetiva de la función genómica.

Recomiendan usar un lenguaje diferente donde “[l] a clasificación automatizada de secuencias similares a genes como pseudogenes debe evitarse. En su lugar, proponemos que los términos descriptivos que no hacen inferencias funcionales deben usarse en referencia a elementos genómicos que surgieron de la duplicación y retrotransposición de genes «y» la terminología no debería imponer ninguna suposición no demostrada a los usuarios finales «.

Entonces, ¿qué nos impide aclarar las funciones de los pseudogenes? El único obstáculo es un bloqueo mental, no técnico o probatorio:

La limitación dominante en el avance de la investigación de pseudogenes ahora radica en las trampas de la mentalidad predominante de que las regiones pseudogénicas son intrínsecamente no funcionales.

El documento predice que tan pronto como perdamos esta «mentalidad», no habrá limitaciones técnicas que nos bloqueen el progreso en la comprensión de las funciones de los pseudogenes: «Con una objetividad científica renovada, anticipamos que una gran cantidad de descubrimientos para comprender la función del genoma, su papel en la enfermedad y el desarrollo de nuevos tratamientos está al alcance «.

Es una buena noticia, pero debemos hacer una pregunta que el documento no puede hacer: ¿por qué se desarrolló esta terminología en primer lugar?

(1) Pensamiento evolutivo: «¿Una reliquia de la evolución»?

El pensamiento evolutivo es la causa que finalmente creó, alimentó y sostuvo el paradigma del ADN «basura». Sin embargo, el documento adopta un enfoque totalmente evolutivo y, por esta razón, nunca identifica el pensamiento evolutivo como el problema raíz. Lo más cerca que se ponen los autores es cuando cuentan cómo el primer artículo en identificar un pseudogen (publicado en 1977) descartó su función potencial como una «reliquia de la evolución»:

En ausencia de evidencia de que los pseudogenes 5S fueron transcritos, Jacq et al. Llegó a la conclusión de que la explicación más probable para la existencia de los pseudogenes es que son una reliquia de la evolución y no tienen función1. Desde la acuñación del término pseudogen, su definición se ha ampliado y ahora se acepta ampliamente para definir cualquier secuencia genómica que sea similar a otro gen y sea defectuosa.

Este artículo de 1977 de Jacq et al. fue publicado en la revista Cell y encontró un pseudogen en una rana africana. Ese documento concluyó:

Por lo tanto, nos vemos obligados a concluir que la explicación más probable de la existencia del pseudogen es que es una reliquia de la evolución. Durante la evolución del ADN 55 de Xenopus laevis, se produjo una duplicación génica que produce el pseudogen. Presumiblemente, el pseudogen funcionó inicialmente como un gen 55, pero luego, por mutación, se separó lo suficiente del gen en su secuencia para que ya no se transcribiera en un producto de ARN.

Y ahí lo tiene: el pseudogen se ve como una mera «reliquia» producida «por mutación» hasta que divergió tanto que «ya no se transcribió en un producto de ARN». Esta es la visión clásica de un pseudogene.

Irónicamente, el artículo de 1977 llegó a especular que tal vez haya evidencia para la función del pseudogen, pero los autores privilegian la visión «reliquia» como la respuesta correcta hasta que se pueda probar una función:

Sin embargo, esta explicación evolutiva de la presencia del pseudogen es incompleta en sí misma, ya que ignora la conservación en secuencia del pseudogene, y de hecho del espaciador rico en G + C del ADN 55. En un intento de explicar esto, se ha sugerido que el pseudogen puede ser un «espaciador transcrito» correspondiente a una transcripción primaria del ARN 55, que es un precursor transitorio y hasta ahora no se ha detectado. Si esto es así, entonces la mayor parte de la región rica en G + C de 55 ADN sería el gen estructural para el ARN 5S. Esta función, si es verdadera, proporcionaría la presión selectiva necesaria para conservar la secuencia del «enlazador» y la región del pseudogen para que se mantuviera el procesamiento correcto de los 300 precursores largos postulados. Sin embargo, en ausencia de evidencia experimental para un precursor tan largo, esta sugerencia debe considerarse especulativa; Es más probable que el pseudogen sea una reliquia de la evolución.

El reciente artículo de Nature Reviews Genetics espera remediar este problema revisando gran parte de la abrumadora evidencia de la función del pseudogen y enfatizando cómo la «no funcionalidad de los pseudogenes sigue siendo la percepción dominante y predeterminada». Esto «limitará, consciente o inconscientemente, la ciencia objetividad en su investigación. ”Los autores deben ser elogiados. Sin embargo, la experiencia enseña que, a menos que aborde la causa raíz de un problema, rara vez desaparece. La tendencia a ver a los pseudogenes como una «reliquia de la evolución» probablemente no cambiará siempre y cuando presumas que todo el genoma es producto de una evolución aleatoria. El documento respalda completamente esta última visión, proporcionando todo tipo de brillo narrativo que describe los pseudogenes (funcionales o no) como «retrocopias» que «surgieron de la duplicación y transposición de genes». Ellos enfatizan:

En el enfoque reduccionista fundamental que a menudo se asume en genética y biología molecular, a menudo se pierde la perspectiva de que la vida tal como la observamos hoy no solo es producto de miles de millones de años de procesos evolutivos, sino que también está sujeta a estos mismos procesos.

Son bienvenidos a adoptar el «enfoque reduccionista que a menudo se asume en genética y biología molecular». Pero hasta que esas visiones evolutivas fundamentales del genoma estén sobre la mesa para ser cuestionadas, no avanzarán mucho en sacudir las suposiciones de la ciencia sobre el paradigma del ADN «basura».

Artículo publicado originalmente en inglés por Evolution News

Imagen: Xenopus laevis, by Brian Gratwicke [CC BY 2.0], via Wikimedia Commons.