- la revista Naturepublicaba un interesante artículo de investigación [Wang, K. C., Y. W. Yang, et al. (2011): «A long noncoding RNA maintains active chromatin to coordinate homeotic gene expression [Un largo ARN no codificante mantiene cromatina activa para coordinar la expresión de los genes homeóticos]».En el estudio se ha identificado una fascinante nueva función reguladora para largos ARNs intergénicos no codificantes (lincRNAs). Previamente considerados como «basura» o vestigios carentes de función de genes que en el pasado hubieran sido codificantes de proteínas, y que, a lo largo de la historia evolutiva, habrían mutado para caer en un estado no funcional, la investigación ha dilucidado que estos lincRNAs tienen una función extremadamente importante —incluso crucial— con respecto a la determinación de la identidad celular. Es decir, los lincRNAs desempeñan un papel crítico en la determinación del conjunto de productos génicos que se expresarán en cada tipo respectivo de célula.
La diferenciación de los tipos de células desde las totipotentes de las primerísimas etapas del embrión hasta las especializadas de cada órgano y función del organismo va regida en parte por factores de regulación presentes en zonas del ADN y en sus productos de ARN que, por no resultar en proteínas, se consideraron desde la perspectiva del materialismo darwinista como vestigios inútiles de la evolución que habían permanecido como «ADN basura». Los constantes descubrimientos de complejas funciones de regulación y control asignadas a estos segmentos antes considerados inútiles constituye otra refutación de las tesis darwinistas. Para ver bien la imagen, pulse sobre ella con el ratón. Ilustración cortesía de Zephyris.
Un fenómeno biológico concreto que siempre ha ejercido fascinación sobre mí es el extraordinario proceso de especificación y diferenciación del tipo de célula que ocurre durante la embriogénesis. En tanto que hay un elemento de elegancia intrínseca en prácticamente cada sistema de expresión génica, el proceso de la embriogénesis ha de ser considerado como la cumbre de la elegancia. En el presente estudio, los investigadores (Wang et al.) exploran la base molecular que subyace a la capacidad de los fibroblastos para determinar la identidad local de las células de la piel y para mantener el patrón característico de expresión génica a lo largo de docenas de divisiones celulares.Los autores observan en el resumen que:Aquí identificamos el HOTTIP, un lincRNA transcrito desde el extremo (tip) 5′ del locus HOXA que coordina la activación de diversos genes HOXA 5′ in vivo. La conformación cromosómica en bucle lleva el HOTTIP a una estrecha proximidad a sus genes diana. El ARN HOTTIP enlaza directamente con la proteína adaptadora WDR5 y fija como objetivos los complejos WDR5/MLL a lo largo del HOXA, impulsando la trimetilación de la lisina 4 de la histona H3 y la transcripción génica. La proximidad inducida es necesaria y suficiente para la activación por parte del ARN HOTTIP de sus genes diana. Así, al servir como intermedios clave que transmiten información procedente de un bucle cromosómico de orden más elevado a modificaciones de la cromatina, los lincRNAs pueden organizar dominios de la cromatina para coordinar la activación génica a largo plazo.El acrónimo HOTTIP, según observan los autores más adelante, significa «transcripción de HOXA en el extremo distal». En contraste con el HOTAIR previamente identificado (descubierto por el mismo grupo) que actúa como un represor de la expresión génica, el recién identificado lincRNA HOTTIP actúa para organizar dominios de cromatina (es decir, la topología de la arquitectura del ADN nuclear) para coordinar la activación de la expresión génica.Entonces, ¿cómo operan estos lincRNAs para coordinar el mantenimiento de la expresión génica diferencial? Bien, en el caso del recién identificado HOTTIP, el lincRNA (después de contorsionarse para formar su estructura en bucle) enlaza con una proteína adaptadora llamada WDR5, un componente del complejo mixto del linaje de leucemia (MLL) que metila la lisina 4 de la histona H3. Esto permite al ARN HOTTIP activar sus genes Hox diana.El motivo de llamar la atención a este fenómeno es por su incidencia directa en el debate Diseño Inteligente/Darwinismo. En primer lugar, está la cuestión obvia de que aquello que hasta ahora se creía que era «ARN basura» o «ruido genómico» ha resultado no ser basura en absoluto, sino que en realidad es un factor de crucial importancia para el proceso de la especificación y el desarrollo de la identidad celular.He sospechado durante largo tiempo que los patrones de metilación no son, en lo principal, el determinante clave de la activación o silenciado de los genes. Más bien, la metilación del ADN podría sólo afectar a genes que estén ya silenciados por otros mecanismos en el embrión. Véase, por ejemplo, este excelente artículo de 2002(publicado en Genes and Development por Adrian Bird) para algunas razones de ello. Más bien, la metilación del ADN parece idóneamente adaptada para una función específica de memoria celular durante el desarrollo.Está claro que la secuencia de ADN en cada una de las células de un determinado animal (con la evidente excepción de las células T y B) es la misma, y esto incluye su respectivo complemento de genes Hox(que son en gran medida responsables de la determinación de la segmentación anterior-posterior de los organismos durante la embriogénesis). Como se sabe, las mutaciones en estos genes Hoxllevan a una parte del cuerpo a desarrollarse en una ubicación anormal durante la embriogénesis. En la Drosophila, por ejemplo, las mutaciones en el gen Antennapedia pueden llevar a que el embrión desarrolle patas en la cabeza en lugar de antenas; mutaciones en el gen Ultrabithorax pueden llevar al embrión a desarrollar el segundo par de alas en lugar de los halterios o balancines que normalmente estabilizan el vuelo del insecto. Pero ahora llegamos tenemos esto: si la secuencia de ADN es la misma en cada tipo de célula del organismo, ¿cómo puede ser el ADN en solitario el determinante único de la especificación del tipo de célula en virtud de una expresión diferencial de genes? Me parece claro que la información que especifica el plan general, o proyecto, del organismo, tiene que residir —al menos en cierta medida— más allá del cometido de la secuencia del ADN. Parece que esta es la única forma factible de resolver la paradoja de la especificidad espacial (a fin de cuentas, la regulación de la expresión génica presupone —no determina— un sistema espacial coordinado predefinido). Por tanto, me siento intensamente inclinado a la idea de que los genes Hox son activados y desactivados en los tipos celulares respectivos por un sistema de regulación que interacciona con un sistema espacial coordinado previamente especificado.Y si el ADN no es el único determinante de la morfología organísmica —quizá ni siquiera el principal—, ¿dónde queda entonces el darwinismo? Todos los humanos somos un 99,9 por ciento idénticos, desde un punto de vista genético. Pero esa pequeña variación del 0,1 por ciento tiene grandes consecuencias, que influyen en el color de los ojos, la talla o el riesgo de enfermar.
A pesar de que las variaciones se hallan dispersas por todo el genoma, los científicos, al buscar las diferencias que intervienen en la salud humana y en la enfermedad, han ignorado en gran medida las secuencias repetitivas de ADN, denominadas con desdén ADN «basura».
N
Un nuevo estudio demuestra que los cambios en estas regiones repetitivas olvidadas también pueden influir en la salud humana. Estas regiones pueden afectar la estabilidad del genoma y la función de los cromosomas, y pueden dar lugar a un mayor riesgo de cáncer, defectos de nacimiento o infertilidad. Los resultados se han publicado en la revista Genome Research.
«Las variaciones no solo incumben a la función de los genes y proteínas, sino que también pueden suceder en las secuencias no codificantes y repetitivas del genoma», comenta Beth A. Sullivan, Ph.D., autora principal del estudio y profesora de biología molecular y microbiología de la facultad de medicina de la Universidad Duke.
«Lo que hemos hallado en este estudio es probablemente la punta del iceberg», afirma Sullivan. «Debido a las variaciones en la compleja parte repetitiva del genoma, podrían darse todo tipo de alteraciones funcionales que todavía desconocemos.»
Estas secuencias del centrómero, denominadas ADN satélite, se componen de bloques de exactamente 171 A (adenina), C (citosina), T (timina) y G (guanina), repetidos una y otra vez hasta alcanzar millones de pares de bases. En el pasado se creía que cada cromosoma contenía un único tramo de este ADN satélite, el cual determinaba dónde residiría su centrómero. Pero, hace unos años, el laboratorio de Sullivan descubrió que muchos cromosomas humanos poseían más de una de estas regiones, y dependiendo de la persona, el centrómero se podría formar en otro sitio.A pesar de que la secuencia del genoma humano se declaró finalizada hace más de una década, todavía existen varias lagunas evidentes, sobre todo en las secuencias repetitivas alrededor de los centrómeros, los «nudos» que mantienen juntas las dos cromátidas (o copias) de los cromosomas, en forma de X, y que coordinan sus movimientos durante la división celular.En el presente estudio, Sullivan quería averiguar cómo decide el cromosoma dónde ubicar su centrómero, y si un lugar concreto construía un centrómero «mejor» que otro. De los 23 pares de cromosomas humanos, se concentró en el cromosoma 17, que se halla reordenado estructuralmente o mutado en distintos tipos de cáncer y defectos de nacimiento.
En primer lugar, Sullivan y su equipo combinaron ensayos moleculares y visuales: extendieron el cromosoma en largas fibras de cromatina que tiñeron con sondas fluorescentes para cartografiar la variación de la secuencia genómica en las dos regiones de ADN satélite. A continuación, examinaron cada región satélite para identificar la presencia de las proteínas necesarias para construir un centrómero totalmente funcional.
Los investigadores descubrieron que la variación genómica en una de estas regiones de ADN satélite (ya sea en el tamaño o en la secuencia de sus unidades repetitivas de 171 pares de bases) determinaba, en última instancia, si el centrómero se formaba en su ubicación primaria o en un lugar alternativo.
Cuando examinaron las muestras procedentes de un banco de ADN humano, hallaron que alrededor del 70 por ciento de las personas presentan escasa variación genómica en el lugar primario, mientras que el 30 por ciento restante muestran diferentes grados de variación. En tales casos, los centrómeros no suelen formarse en la ubicación primaria, sino que se ensamblan en el lugar «alternativo», en las inmediaciones. Pero cuando esto sucede, el resultado puede ser un centrómero disfuncional, estructuralmente débil, y un cromosoma inestable que puede estar presente en un número excesivo o insuficiente de copias.
«Resulta fascinante pensar que hay tantas personas que son esencialmente heterogéneas en sus centrómeros», apunta Sullivan. «Uno de sus centrómeros, en uno de sus cromosomas, tiene el potencial de ser inestable, un hecho que podría alterar su capacidad reproductora o predisponerle al cáncer.»
En el futuro, Sullivan planea investigar el riesgo que suponen las regiones satélite variantes para quienes las llevan, así como la posibilidad de desarrollar una manera de utilizar estas secuencias como biomarcadores de las anomalías cromosómicas que pueden dar lugar a enfermedades.
“Descubren algo interesante en la región del genoma que hasta hace poco se consideraba basura”
Ese algo interesante puede consistir en secuencias que determinan el desarrollo del cerebro o la forma de nuestra cara, un gen clave para la celiaquía, un trocito de ADN que determina la evolución del cáncer, otro que permitirá curar la diabetes… todo tipo de maravillas, halladas gracias a que a alguien se le ocurrió buscar en lo que sus poco espabilados colegas creían un vertedero genético.
El mito del tesoro en el vertedero
El concepto ADN basura lleva muchos años divulgándose y enseñándose como si se tratase de un error surgido directamente de la arrogancia de los científicos. Un error que ahora, gracias a nuevos hallazgos y a un cambio de mentalidad, se estaría corrigiendo.
El mito dice así: Cuando los científicos empezaron a leer el genoma humano comprobaron que solo una minúscula parte consiste en ADN codificante, es decir, en genes con información para sintetizar proteínas. El resto del ADN, ¿para qué sirve? ¿Qué hace ahí? No lo sabían. Y, como no lo sabían, decidieron que se trataba de ADN inútil. Que estaba ahí simplemente porque no hacía daño. Que era chatarra. Y así quedó establecido como ortodoxia durante un tiempo vergonzosamente largo. Hasta que, por fin, las nuevas investigaciones comprobaron que esa gran cantidad de ADN no codificante tiene papeles cruciales.
El mito tiene variantes y oscila entre dos extremos:
1.- El ADN no codificante, “antes considerado basura” contiene algunos tesoros genéticos.
2.- El mal llamado ADN basura es todo él un tesoro genético.
Es una narración atractiva. Enfrenta de un modo más o menos explícito a unos “malos”: científicos anticuados, engreídos y sin imaginación, con unos “buenos”: científicos modernos, abiertos de mente y humildes ante la magnificencia de la naturaleza. Ésta nos habría dado una lección de modestia: aquello que creíamos que era absurdo porque no comprendíamos, en realidad tendría perfecto sentido.
Incontables noticias en los periódicos, blogs, libros de divulgación y abstracts de trabajos científicos reproducen el mencionado esquema año tras año. Profesores de biología de todo el mundo, en institutos y universidades, están enseñando a sus alumnos que el ADN basura es una hipótesis fallida.
Quizá debido a la compartimentación del saber, a una no siempre buena comunicación entre expertos de distintas especialidades, y a malentendidos habituales sobre la evolución, el negacionismo del ADN basura está muy extendido entre biólogos y bioquímicos. A menudo lo expresan con argumentos que harían alzar las cejas a cualquier iniciado en biología evolutiva:
“si este ADN ha llegado hasta nuestros días es que debe tener alguna función”.
El mismísimo Francis Collins, prestigioso genetista que dirigió el Proyecto Genoma Humano y luego los Institutos Nacionales de Salud estadounidenses, se ha revelado también como un negacionista del ADN basura: “Ya no usamos más esa expresión. Fue en gran medida un caso de arrogancia eso de imaginar que podríamos prescindir de alguna parte del genoma, como si supiéramos lo bastante para afirmar que no era funcional”.
Collins es un creyente cristiano, pero no es un creacionista. Quienes rechazan la evolución desde posturas religiosas no pueden aceptar que el diseñador inteligente que supuestamente nos creó haya metido tal cantidad de morralla en nuestros núcleos celulares. Una buena proporción de los textos que atacan al ADN basura procede de las organizaciones creacionistas. ¡Lo odian! Un genoma repleto de secuencias inútiles es prueba de que los seres vivos han ido cambiando mediante procesos ciegos, inconscientes, naturales. Siempre que un equipo científico ha encontrado algo interesante en una región del genoma “anteriormente considerada basura”, los creacionistas lo han celebrado como un golpe más en la cara de Darwin.
El Proyecto ENCODE
El “meme” del ADN basura como concepto erróneo y obsoleto alcanzó su apogeo en 2012, en lo que debería ser recordado como una de las mayores catástrofes de la comunicación científica. Ese año, con gran bombo, el Consorcio del Proyecto ENCODE (Encyclopaedia of DNA Elements) publicó simultáneamente treinta trabajos sobre el genoma humano. Más del 80% de éste, según hallaron, tenía “funciones bioquímicas”.
Se gastaron unos 400 millones de dólares. Espléndidos materiales divulgativos fueron producidos al mismo tiempo que se preparaban los papers científicos. La revista Nature lanzó un portal dedicado a ENCODE. En este vídeo de dibujos animados, narrado por el comediante y activista del pensamiento crítico Tim Minchin, ENCODE aparece representado como un robot gigante que, entre otras proezas, lucha contra el cáncer. ENCODE, explica el vídeo, “es un mapa que revela que el genoma entero es una jungla de ruidosa actividad, incluso las partes que solíamos considerar chatarra; no solo los genes sino también las instrucciones que les dicen qué hacer y cuándo”.
Hubo profusión de entrevistas a los científicos que habían participado en ENCODE. Ewan Birney, uno de los líderes, afirmó que ese 80% del genoma con función se convertiría probablemente en el 100% una vez avanzaran los estudios, y añadió: “Realmente no tenemos ninguna gran porción de ADN redundante. Esta metáfora del ADN basura no es tan útil”.
Roderic Guigó, coordinador del programa Bioinformática y Genómica del Centro de Regulación Genómica, dijo: “Hemos visto que partes del genoma que considerábamos ADN basura, sin utilidad, son en realidad muy importantes. Identificamos en estas secuencias unos 4 millones de interruptores de genes, es decir, de regiones reguladoras.”
¡Cuatro millones! Varios medios publicaron que El ADN antes conocido como basura era, en realidad, un gigantesco panel de control, un sistema operativo de la célula. Los titulares fueron sensacionales:
El ADN basura, demolido (The Wall Street Journal)
El estudio Encode desacredita la teoría del «ADN basura» (The Independent)
El ADN basura es esencial para el genoma humano (ABC)
El Proyecto Encode escribe una elegía para el ADN basura (Science)
No existe el ADN basura (QUO)
Pero el ADN basura sí existe y está presente en cantidades ingentes en los genomas de la mayoría de las especies vivas. La evidencia científica a su favor es aplastante y procede de múltiples ramas de la biología. Su negacionismo es una combinación de malentendidos, exageraciones, falsa modestia, ceguera ideológica y adanismo.
¿Cómo desmontar este titánico mito construido y defendido por investigadores de incuestionable valía, las mejores revistas científicas, un multimillonario proyecto genómico internacional, profesores, periodistas, divulgadores… y, además, por si fuera poco, la estrafalaria ayuda de los creacionistas? Parece una tarea imposible. Ante tan gargantuesco y multicéfalo rival parece que solo cabe rendirse. Quizá aquí debería acabarse este artículo. Pero no; queda mucho todavía.
Muchos investigadores, por supuesto, han salido en defensa del ADN basura. Algunos de los más activos y visibles son el experto en genómica T. Ryan Gregory, el vitriólico biólogo evolutivo Dan Graur, el bioquímico Laurence A. Moran, el biólogo del desarrollo y conocido bloguero PZ Myers o el biólogo molecular y computacional Sean Eddy. Las críticas al proyecto ENCODE llegaron también a las revistas científicas en forma de diversos papers, algunos muy interesantes por su carácter divulgativo. Con la ayuda de estos científicos, comenzamos el combate dividiendo al adversario en seis malentendidos o errores principales.
El ADN basura no surge de la ignorancia
El primer malentendido en esta historia es la leyenda según la cual el ADN basura fue un parche, una solución torpe que dieron los científicos cuando descubrieron una montonera de ADN extraño y no supieron para qué servía.
En realidad, el ADN basura fue una predicción basada en los límites de la selección natural y calculada mediante las matemáticas de la genética de poblaciones. Su origen es bastante anterior al comienzo de la era genómica. Como tal predicción, se fue cumpliendo a medida que se fueron secuenciando genomas de todo tipo de especies.
La selección natural hace muchas cosas. Adapta a las poblaciones al medio, las separa y modifica hasta producir nuevas especies, estructuras, órganos, instintos… Éste es el papel constructor o creativo de la selección natural. Lo lleva a cabo con la colaboración imprescindible de las mutaciones y con la participación de otros mecanismos evolutivos. Es su aspecto peor comprendido por los no expertos y el más atacado por los “antidarwinistas”. Pero no es el que nos interesa ahora.
El que ahora toca es el papel conservador de la selección natural, mucho más intuitivo, fácil de comprender y menos polémico. La selección natural conserva las funciones biológicas y evita que los genomas degeneren fatalmente por acumulación de errores aleatorios que suceden constantemente.
Todos somos mutantes; cada uno de nosotros nace con nuevas mutaciones que, cuando afectan un gen, pueden estropearlo, deteriorando su función o anulándola por completo. Además, todos heredamos de nuestros padres un conjunto distinto de alelos (variantes de un mismo gen) estropeados que nos pueden provocar desde nada (ningún efecto detectable) hasta pequeñas molestias o desventajas, enfermedades serias o incluso la muerte prematura. Cada población de seres vivos soporta una carga mutacional que, en ocasiones, llega a resultar fatídica.
Pero, en general, los genes se mantienen buen estado. Lo que los conserva no es magia arcana; simplemente, los individuos que tienen genes menos estropeados suelen reproducirse más que aquellos que tienen los genes más estropeados. Eso hace que, en cada generación, parte de las variantes defectuosas desaparecen de las poblaciones. Sin la selección purificadora (así se llama), la información de los genomas degeneraría a lo largo de las generaciones. Los organismos nacerían cada vez menos aptos y, finalmente, la vida se extinguiría por completo.
Los límites de la selección natural
Pero la selección purificadora no es un espectro inteligente (con la cara de Charles Darwin) que detecta cualquier pequeño error en el mundo y lo elimina ipso facto. Tiene limitaciones que los especialistas conocen y calculan. La capacidad de la selección natural para limpiar los genomas depende de factores como el tamaño de las poblaciones, sus oscilaciones o su diversidad. Sin una buena formación en teoría evolutiva, tendemos a considerar que la selección es omnipotente. En general, funciona de forma mucho menos eficaz de lo que creemos.
Nuestro genoma es larguísimo. Si todo él, enterito, tuviera funciones biológicas cruciales, la selección natural tendría que haber estado protegiendo y conservando varios millones de secuencias útiles distintas. Y no puede hacerlo.
Los genetistas de poblaciones, teniendo en cuenta lo que saben sobre las tasas de mutación, los tamaños habituales de los genes, la recombinación, el censo efectivo de las poblaciones, etc., comprueban que tal hipótesis es inviable. Una selección natural tan eficaz habría requerido que cada humano tuviera una cantidad astronómica de hijos (los números, en este trabajo de Graur). Millones de hijos que luego, casi todos, a causa de pequeños defectos, tendrían que haber muerto sin descendencia. Esto habría que aplicarlo al resto de animales, plantas y microorganismos de la Tierra. No cabríamos en en el Sistema Solar.
Por tanto, en el mundo real existe un límite en el número de loci (genes en sentido amplio), que la selección natural puede conservar. En 1970 ya se había estimado que el número total de genes humanos sería como mucho de unos 30.000. Esta cantidad era asombrosamente pequeña para el pensamiento de la época. Hoy en día, sin embargo, parece muy acertada.
Susumu Ohno es citado a menudo como el padre del ADN basura (aunque la historia es más complicada). Dedujo en 1972 que esos treinta mil loci útiles incluirían tanto los genes típicos que codifican proteínas como sus posibles regiones reguladoras. El ADN esencial (útil) representaría aproximadamente el 6% de nuestro genoma. El resto, más de un 90% del genoma, no puede estar siendo conservado por la selección natural y, por tanto, carece de función. El ADN basura fue deducido mediante una teoría científica sólida, no inventado a la desesperada para tapar un misterio. Surgió del conocimiento, no a partir de la ignorancia.
ADN basura no equivale a ADN no codificante
El segundo gran malentendido es la ubicua confusión entre ADN no codificante y ADN basura. Recordemos que el ADN no codificante es aquél que no contiene información que será traducida por la célula a secuencias de proteínas. Sabemos hoy en día que alrededor del 98% del genoma humano consiste en este tipo de ADN.
Cuando la típica noticia dice “se ha encontrado algo estupendo en una región del genoma que antes se creía basura”, lo que quiere decir casi siempre es que se han encontrado algo estupendo en una región de ADN no codificante.
Pero no son lo mismo. El ADN basura no tiene utilidad, no puede tenerla por definición. El ADN no codificante puede tener diversas funciones, y esto se sabe desde hace casi medio siglo.
Se podría responder: bien, de acuerdo, pero no seamos cínicos; se trata de enfatizar que, durante mucho tiempo, los genetistas creyeron que todo el ADN no codificante era basura, sin excepción. El problema es que esa historia no es cierta. Semejante opinión nunca estuvo extendida en la comunidad científica. Los biólogos descubrieron funciones reguladoras en el ADN no codificante antes (años 60), durante (años 70) y después (80, 90…) de la consolidación del ADN basura como hipótesis. La “creencia” en el ADN basura no parece haber obstaculizado en ningún momento la investigación sobre la regulación genética. En todo momento la compatibilidad fue total.
Veamos el caso de los intrones. Son secuencias no codificantes que están en medio de genes que sí son codificantes. En nuestra especie, el típico gen con información para sintetizar una proteína está interrumpido por varios intrones, a veces larguísimos. Después de que el ADN se transcribe a ARN, las secuencias correspondientes a los intrones son cortadas y no se tienen en cuenta para fabricar la proteína.
Los intrones constituyen casi el 30% de nuestro genoma. Se descubrieron en 1977 y nadie sabía por qué existían o si contenían algo interesante. El mito dice que fueron “inmediatamente y universalmente considerados basura genómica” pero, como muestra T. Ryan Gregory, eso no fue así. Lo que abundaba era justo la opinión contraria, el “aquí tiene que haber algo”. Los científicos especularon con la utilidad oculta de los intrones desde el principio, buscaron secuencias reguladoras en su interior y realizaron interesantes experimentos para detectarlas. Si realmente hubo algunos extremistas defendiendo la inutilidad absoluta de todo el ADN de los intrones, no parece que influyeran demasiado en la opinión y en las investigaciones de sus colegas.
Hoy sabemos que, como sospechaban los genetistas de hace décadas, los intrones contienen mucha chatarra y algunas secuencias funcionales. El “gen de los ojos azules” es una variante de una secuencia reguladora que pertenece a un intrón. La variante más común está asociada con los ojos marrones y está conservada por la selección natural. La que da ojos azules cuando está en doble dosis ha sido, además, promocionada por la selección positiva durante los últimos milenios en algunas poblaciones humanas. Es solo un ejemplo de las muchas secuencias interesantes que se han encontrado formando parte del ADN no codificante… al lado de montones de ADN basura.
¿Qué es función biológica?
El tercer gran malentendido surge del Proyecto ENCODE y su concepto de función. ENCODE es, supuestamente, una enciclopedia de elementos funcionales del genoma humano pero, aquí viene el truco, ha definido “elemento funcional” a su manera..
La función biológica no es un asunto sencillo, filosóficamente hablando. Sin embargo, se suele entender que algo es funcional si tiene un efecto seleccionado. Simplificando, si una secuencia de ADN tiene un efecto que esté siendo conservado o promocionado por la selección natural, entonces es funcional. ¿Por qué usar éste y no otro criterio? Primero, porque la teoría evolutiva es la gran unificadora en la ciencia de los seres vivos (nada tiene sentido en biología si no es a la luz de la evolución) y segundo, porque otros conceptos de función no generan fácilmente hipótesis testables y por tanto científicas.
ENCODE ignora esta noción evolutiva y se saca de la manga otra completamente distinta. Para ENCODE, una secuencia de ADN es funcional si tiene “actividad bioquímica específica”. Por ejemplo, si una secuencia de ADN es transcrita, generándose una molécula de ARN, contará como funcional aunque luego ese ARN esté presente en cantidades minúsculas y se degrade sin realizar ninguna tarea dentro de la célula. Otro ejemplo: si una secuencia de ADN es reconocida por ciertas proteínas, que se adhieren a ella, también contará como funcional para ENCODE; incluso aunque tal interacción no provoque ningún tipo de efecto relevante en la célula.
El problema es que es esperable que esa “actividad bioquímica específica” también la presente el ADN basura. Por el puro azar, por las huellas o restos de su historia evolutiva, e incluso por el ruido y el caos bioquímico del interior de las células, un ADN completamente inútil puede adherirse de forma inútil a diversas moléculas, puede ser transcrito a ARN inútil o puede ser incluso, a veces, traducido a proteínas inútiles.
Toda esta actividad absurda, este derroche, este caos, no es lo que muchos tienen en mente cuando se imaginan el funcionamiento de la célula. Tanto para quien cree en una creación inteligente como para el que se imagina una selección natural todopoderosa, este escenario chapucero resulta chocante e incluso ofensivo. Pero la vida es así, y quizá no pueda ser de otra manera.
Si fabricamos secuencias totalmente aleatorias de ADN sintético también obtendremos esa “actividad bioquímica específica” que la propaganda del ENCODE ha vendido como algo inesperado y apasionante. Imaginad la siguiente inocentada: alguien crea un genoma completamente aleatorio como el que propone Sean R. Eddy y consigue colárselo al Proyecto ENCODE como si fuera un genoma real para que lo estudie. ¿Cómo serían los resultados? ¿Descubrirían un gran porcentaje de ADN con “funciones esenciales” para un organismo inexistente? ¿quizá otro gigantesco “panel de control”? La selección natural no fue el único concepto básico que desatendieron; también se les escapó el azar.
La carga de la prueba
Ya hemos visto que el ADN basura no es aquél que no sabemos para qué sirve, sino aquél que realmente no sirve para nada. Si algún buen lector sigue encontrando “arrogante” esta proposición, puede que estemos en presencia de un cuarto malentendido, que tiene que ver con la carga de la prueba.
Cierta tendencia a idealizar la naturaleza a veces nos conduce a creer que los seres vivos están optimizados a la perfección y que cualquier pequeño detalle biológico ha de ser necesario y esencial. Es fácil entonces ver el ADN basura como una bravuconada, una cuñadez, una afirmación extraordinaria que debe rechazarse, o al menos ser revisada con la misma desconfianza con la que examinaríamos una máquina de movimiento perpetuo o una demostración de percepción extrasensorial.
En realidad, la visión de los organismos como máquinas perfectas donde cada elemento es imprescindible no puede apoyarse en la teoría evolutiva y carece de base científica. Aunque resulte poco intuitivo, la ausencia de función no solo es a veces perfectamente razonable, sino que en muchos casos debe ser la hipótesis que se plantée por defecto.
Imaginemos que estudiamos una secuencia concreta, una pequeña porción del genoma específica. ¿Cómo averiguamos si es basura o no? Es imposible, podría argumentarse. Que no seamos capaces de encontrarle una función no significa que no la tenga. Quizá su utilidad se nos escape siempre, por mucho que investiguemos. En cierto experimento se extirpó una gran porción de ADN no codificante en el genoma de unos ratones. Los animales así “mutilados” se desarrollaron bien y aparentemente no presentaban diferencias con el resto. Todo apuntaba a que la porción eliminada era ADN basura. Pero ¿y si los ratones manipulados tenían una desventaja demasiado sutil? ¿Y si solo se manifestaba en el medio natural, fuera de las condiciones del laboratorio? Esos ratones, como reconocieron los propios autores, quizá tuvieran alguna anomalía no revisada. ¿Estamos ante un problema irresoluble?
No, salvo que seamos poco realistas y exijamos seguridad absoluta. Si una porción de ADN no contiene nada similar a genes ni a secuencias reguladoras conocidas, y además puedes eliminarla sin causar defectos evidentes, entonces probablemente es ADN basura. No habrá certeza total, pero tampoco una posición inamovible o dogmática. Lo que ocurre es que la carga de la prueba la tiene quien afirme, contra los indicios, que existe una función oculta en esa secuencia. Es quien debe hacer el esfuerzo de aportar evidencias.
Recordemos, además, que la selección natural debe estar actuando sobre una secuencia para que pueda hablarse propiamente de función biológica. Gracias a los avances en genómica y bioinformática, los científicos comparan masivamente genomas de muchas poblaciones y especies (¡extintas, en ocasiones!). Cada vez resulta más fácil estudiar la evolución de esa secuencia; saber su está o no conservada, si muestra señales de selección o si, por el contrario lleva millones de años cambiando a la deriva, de forma neutra.
Si algo grazna como un pato, nada como un pato, camina como un pato… no tachemos de arrogante a quien lo llama “pato”. Cuando una secuencia parece basura y evoluciona justo como corresponde al ADN basura, entonces muy probablemente es ADN basura. Ésta es la hipótesis por defecto. Quien proponga lo contrario tiene dos trabajos: probar la existencia de una función y explicar la razón de tan extraño y engañoso comportamiento evolutivo.
El test de la cebolla
El negacionismo del ADN basura viene en distintos colores y grados. La postura de algunos es confusa: claramente están incómodos pero no dejan claro exactamente por qué; quieren redefinir el concepto de alguna forma, cambiarlo de nombre o que se deje de hablar del asunto. El negacionista típico cree que el genoma es funcional en un porcentaje cercano al 100%; admite que podría haber una pizca de ADN inútil pero nunca el enorme porcentaje que suele estimarse. Esto implica rechazar (pocas veces desde el conocimiento) el desarrollo teórico que llevó a descubrir el ADN basura. Algunos sostienen que el “mal llamado” ADN basura posee, en realidad, alguna función general, universal.
El test de la cebolla es un famoso desafío para ellos planteado por T. Ryan Gregory. Si el ADN basura tiene en realidad una función universal, ¿por qué la cebolla (Allium cepa) necesita, para realizar esa función, cinco veces más ADN que un ser humano? Y, a su vez, ¿por qué unas especies cercanas de Allium, el género de la cebolla, necesitan casi 5 veces más ADN que otras?
Gregory escogió la cebolla pero es solo un ejemplo posible entre miles. Los genomas de distintos seres vivos tienen tamaños extraordinariamente diferentes que no guardan proporción con la complejidad del organismo. Una hormiga, insecto social, puede tener el doble de genoma que una abeja, otro insecto social. Las especies de salamandras tienen entre 4 y 35 veces más ADN que nosotros. Cierta ameba, no mucho más compleja que uno de nuestros miles de millones de glóbulos blancos, supera nuestro genoma en 200 veces. Un pez pulmonado tiene un genoma casi 40 veces más grande que el Homo sapiens y más de 300 veces mayor que el de un pez globo. Una planta con flor, Paris japonica, tiene un genoma más de ¡2400 veces! mayor que otra planta con flor, Genlisea aurea.
Las razones de estas descomunales y aparentemente caprichosas diferencias no se conocen aún completamente. Sin embargo, gran parte y probablemente el meollo del asunto se explica acudiendo a fenómenos biológicos bien conocidos:
Las mutaciones espontáneas duplican segmentos de ADN con una frecuencia muy alta. En las poliploidías, que muchas veces han surgido por hibridación entre especies, se multiplican los genomas (y por tanto se multiplica la gran fracción de ADN basura). Los genes así repetidos son a menudo prescindibles; dejan de ser conservados por la selección darwiniana y evolucionan hacia la degradación. Ciertas infecciones víricas y la proliferación de elementos móviles pueden incrementar el ADN drásticamente, sobre todo en periodos en los que la población se ha reducido y la selección natural es poco eficaz. Millones de estas secuencias de ADN parasitario infestan los genomas. Con el tiempo, la mayoría acaban siendo inutilizadas por mutaciones y convirtiéndose en reliquias que evolucionan a la deriva.
Las deleciones por otra parte, son mutaciones que eliminan secuencias de ADN. Ciertas especies parecen tener un sesgo interno en favor de las deleciones y esto, junto con la selección natural, ayuda a explicar por qué algunos organismos han miniaturizado el genoma durante su evolución, conservando el número habitual de genes típicos pero eliminando chatarra a mansalva.
Efectivamente, se trata de fenómenos implicados en la producción y eliminación de ADN basura. Si sostenemos que el 100% del genoma es funcional, la tremenda diversidad en el tamaño de los genomas que existe en la Tierra se convierte en un misterio científico sobrecogedor.
El test de la cebolla nos recuerda que hay una formidable variación en el mundo vivo y que no tenemos el menor indicio de que el genoma humano sea especial o radicalmente distinto al resto. Cualquier especulación salvaje sobre “paneles de control” o “millones de funciones” debe poder aplicarse también, y con todas las consecuencias, a la humilde cebolla, al murciélago, a la ameba o a la plantita carnívora. De lo contrario, estaríamos cayendo en un quinto error: el antropocentrismo.
¿Qué hay en el genoma?
Veamos, para terminar, algunos datos sobre la composición del genoma humano. Un 9% de nuestro genoma consiste en virus defectivos (estropeados, “muertos”). Alguna que otra vez, la evolución ha convertido ADN de origen vírico en una secuencia funcional, útil para el organismo, pero se trata de acontecimientos muy raros. Ese nueve por ciento procede de antiguas infecciones, son como restos en descomposición y probablemente siguen ahí porque no resultan perjudiciales.
Un impresionante 44% del genoma está hecho de transposones defectivos. Los transposones son elementos genéticos móviles descubiertos por la premio Nobel Barbara McClintock. “Saltan” en los cromosomas e insertan copias de sí mismas. Se trata casi siempre de secuencias parásitas. De nuevo, en algunas ocasiones, mutaciones surgidas en un transposón o provocadas por éste han dado lugar a funciones útiles. Ojo: solo un 0,05% de nuestros transposones pueden funcionar como tales. El resto ya no puede saltar; están “muertos” y la evolución molecular degenera sus secuencias progresivamente. Hay que decirlo otra vez: ¡son el 44% de nuestro genoma!
Los intrones (casi el 30% del genoma, como ya vimos) consisten principalmente en ADN que no está evolutivamente conservado, que carece en su mayor parte de funciones conocidas y que está plagado de transposones.
Los pseudogenes constituyen un modesto 1% del genoma del Homo sapiens (pero puede que una proporción mucho mayor en una bacteria como la Rickettsia). Una vez más se trata de secuencias cadavéricas. Antaño fueron genes codificantes clásicos, pero la selección natural los abandonó y quedaron inutilizados por las mutaciones. Desde entonces, su secuencia se desbarata acumulando cambios al azar. Un ejemplo es el gen GLO, necesario para sintetizar vitamina C, que se fastidió en el linaje de los antropoides. GLO es ahora un pseudogén sin función alguna y, como consecuencia, podemos padecer escorbuto.
Se conocen relativamente bien muchos otros elementos y tipos de secuencias en nuestro genoma. Están los genes que codifican proteínas y RNAs, las secuencias reguladoras, los telómeros, el ADN satélite… L. A. Moran tiene este post clásico sobre el asunto. En él encontraréis estimaciones conservadoras acerca de las cantidades de ADN basura y su localización.
La creencia en un genoma inexplorado y prácticamente desconocido forma parte necesaria del mito del “tesoro en el vertedero”. Este es el sexto error: el adanismo. Creer que partimos de cero, ignorar el progreso previo. Sin duda hay mucho por averiguar y las sorpresas están garantizadas, pero no debemos desdeñar la investigación acumulada. El ADN basura encaja confortablemente con todo ese conocimiento. De hecho, está bien fundido con éste; forma parte del armazón. Quien pretenda extirparlo lo tiene muy crudo, científicamente hablando. Y, sin embargo, ¡triste paradoja! su mala fama y el mito del tesoro en el vertedero durarán aún muchos años.
A qué nos referimos cuando hablamos de ADN Basura
En los años 90 se inició el llamado Proyecto Genoma Humano. Un ambicioso estudio que pretendía leer la molécula de ADN humana para analizar cada uno de nuestros genes. Cuál fue la sorpresa de los investigadores al encontrar que de millones de pares de bases en el ADN, un humano solo tenía unos 20000 genes que codificaban para proteínas. Esto supone solo un 5% del ADN total.
El ADN se compone de dos cadenas, que tienen como unidades bases nitrogenadas como puedes ver el dibujo. Hablamos de pares de bases porque estas bases se agrupan por pares, fusionándose una cadena con la otra. De toda la secuencia de millones de bases de una cadena, se leen algunos fragmentos que tendrán una utilidad conocida, nuestros genes.
El resto, se denominó en un principio ADN basura, aunque se sospechaba que tendría alguna utilidad. ¿Quizás solo fuera estructural para sujetar esas secuencias válidas de los genes? Para esclarecer qué había dentro del 95% de ADN no codificante, surgió en 2005 el proyecto ENCODE.
ENCODE se mete en las sombras del ADN
Encode descubrió la finalidad de un gran número de elementos dentro del ADN basura. La mayoría con capacidad regulatoria sobre la expresión de genes.
Esto ha llevado a la conclusión de que, lejos de ser basura, este ADN es un panel de control de la genética. Actúa modulando la expresión de genes, activando o reprimiendo su lectura.
Aún queda mucho por desvelar del ADN basura pero, cuanto más se avanza en su conocimiento, mejores técnicas genéticas y biomédicas aparecen. Nuevas dianas terapeúticas en cáncer e infecciones víricas, como el sida, han surgido a raíz de conocer los secretos de esta materia oscura del ADN. También, las teorías del ADN de diseño con técnicas como la novedosa CRISPR.
Conocer el potencial del ADN basura nos puede abrir un gran número de puertas a la medicina predictiva. La medicina de la prevención que permita predecir con un sencillo estudio de secuenciación de ADN, qué enfermedades llevamos de serie desde el nacimiento.
ADN Basura, mutación y evolución
¡Alerta: mutación!
Algunos científicos hablan de que las especies perduran gracias a que existe este ADN basura. El concepto es sencillo:
Si ocurre una mutación letal o no beneficiosa para un organismo sobre un gen que es de vital importancia, ese ser vivo muere o enferma. Sin embargo, si hay muchas secuencias basura dentro del ADN, la probabilidad de que caiga en una de estas regiones «sin función aparente» es mayor. Si cae allí, la mutación se convierte en neutral o sin efecto si esta región es realmente basura.
Buena parte de la evolución, sin embargo, se ha dado gracias a la mutación aleatoria que ha beneficiado o perjudicado a los seres vivos, creando una competición por selección natural de aquellos con genética más válida.
Hasta que se esclarezcan la totalidad de las funciones del ADN basura, esta teoría puede tener su sentido. Sin embargo, una mutación en una zona del panel de control del ADN también puede ser catastrófica.
Copia de seguridad
Por otro lado, y con el mismo razonamiento a nivel evolutivo se ha comprobado que nuestro genoma presenta copias de seguridad. Aproximadamente un 10% de nuestros genes están duplicados en la doble hélice. En otras especies, este porcentaje es incluso mayor o duplicado al completo, como en muchas plantas. ¿Con qué sentido? Bueno, teniendo en cuenta que tenemos una copia, la evolución puede jugar a mutar una de ellas preservando la otra. Esto impulsaría la evolución pero sin arrojar tanto riesgo al azar.
Esta situación podría explicar la enorme longitud del ADN de las plantas, por cierto, que es a veces hasta 75 veces más largo que el nuestro.
ADN Basura y Salud
En los últimos años se están descubriendo secuencias dentro del ADN basura humano que podrían condicionar la salud y enfermedad de nuestra especie.
ADN saltarín
El ADN basura no deja de liberar sorpresas y esta tuvo que ser sorprendente. Nuestro concepto de ADN como molécula lineal hace aguas desde que se descubrieron los transposones. Los transposones son secuencias de ADN con capacidad de saltar de unos puntos a otros. Es decir, se cortan y se pegan en una nueva ubicación. Estos elementos transponibles han sido localizados en muchas especies de animales y plantas.
Se ha comprobado que la mayoría de los transposones se encuentran inactivos, pero que pueden llegar a activarse cambiando la expresión genética de algunos genes. En los últimos años, se ha establecido la relación entre algunas enfermedades y los transposones como la diabetes, la hemofilia, la esquizofrenia o el cáncer, en especial de hígado y colon. Las nuevas líneas de investigación con estos elementos saltarines incluyen estudios en enfermedades autoinmunes y neurodegenerativas.
ADN Basura promotor de la expresión de genes
Algunas secuencias del ADN basura sabemos que aumentan la expresión de determinados genes. Parece estar relacionado con las zonas de promotor del gen. Estas zonas, son secuencias donde se ligan proteínas que leen el ADN y traducen ese gen.
Estas zonas de basura no tienen nada. Son de las primeras que se descubrió su sentido al analizar el ADN basura y se vieron que eran vitales para regular la expresión de los genes.
Mutaciones en estas regiones pueden generar mayor o menor propensión a desencadenar ciertas enfermedades. Un ejemplo es la Corea de Hungtington, una enfermedad genética que produce alteraciones en la marcha del individuo. Se produce por una mutación en la proteína Hungtintina que la convierte en una proteína tóxica. Si ocurre una mutación además en la zona del promotor del gen, esta proteína se expresará mucho menos y la patología tarda más años en desarrollarse. Esta enfermedad suele aparecer a los 30-40 años de edad en condiciones normales.
CRISPR
Analizaremos en un futuro CRISPR en profundidad, pero a modo de introducción, es una herramienta que permite el rediseño del ADN. La tecnología CRISPR permite cortar secuencias de ADN no deseadas y cambiarlas por otras. Conocer las complicaciones del ADN basura junto con CRISPR podría alimentar el futuro biomédico. Te recomiendo la serie de Netflix «En pocas palabras» que analiza en su capítulo ADN de diseño, esta tecnología. Lo he usado en clase con alumnos y han surgido buenos debates de ciencia y valores.
Epigenética
En esta otra entrada puedes encontrar información más detallada, pero para abrir boca: epi significa por encima. El término indicaría que estudia algo por encima de la genética.
La epigenética es un concepto relativamente moderno que estudia modificaciones bioquímicas sobre la molécula de ADN. Estas modificaciones pueden marcar el ADN y cambiar sus funciones, como silenciar o activar zonas. Algo parecido a las regulaciones del ADN basura pero estas serían externas al propio ADN. Estudios sobre la epigenética también podrían dar luz al mecanismo de acción de algunas enfermedades.
Una epigenética artificial, si la consiguiéramos controlar, podría corregir mutaciones no deseadas en el ADN que están conduciendo a patologías.
Bibliografía
González-Burón, H. y Tardáguila-Sancho, M. (2017). El ADN basura. La materia oscura de nuestro genoma. National Geographic.
Carey, N. (2016). ADN Basura, un viaje por la materia oscura de nuestro ADN. Biblioteca Buridán.