El atlas de la diversidad genética: más de 167.000 variantes estructurales en el ADN humano

Un grupo internacional de investigadores logró identificar grandes cambios en el ADN como duplicaciones, inserciones, eliminaciones e inversiones gracias al uso de tecnología de secuenciación de lectura larga.
Varias mujeres. / Pixabay
Varias mujeres. / Pixabay

Un equipo internacional de científicos ha logrado un avance histórico en la comprensión de la variación genética humana, al identificar más de 167.000 nuevas variantes estructurales del genoma. El hallazgo, presentado en dos estudios consecutivos publicados en la prestigiosa revista Nature, supone la ampliación más completa y diversa del catálogo genético humano conocida hasta el momento y allana el camino hacia un pangenoma global de referencia, más inclusivo y representativo de la diversidad humana.

El primer estudio, liderado por el Laboratorio Europeo de Biología Molecular (EMBL), la Universidad Heinrich Heine de Düsseldorf (HHU) y el Centro de Regulación Genómica (CRG) de Barcelona, analizó los genomas de 1.019 personas pertenecientes a 26 poblaciones de los cinco continentes. c, conocidos como variantes estructurales, que afectan a miles de letras genéticas de una sola vez.

Estas variantes estructurales pueden tener un fuerte impacto en la salud humana. Algunas de ellas están implicadas en el desarrollo de enfermedades raras, tipos de cáncer y trastornos genéticos graves. El equipo encontró que, de media, cada persona portaba alrededor de 7.5 millones de letras de ADN afectadas por cambios estructurales, lo que pone de manifiesto la magnitud de la edición genética natural que ocurre constantemente en el ser humano.

Un dato especialmente revelador es que más de la mitad de las variantes detectadas eran completamente nuevas, incluyendo un 50,9 % de inserciones y un 14,5 % de deleciones que no figuraban en los catálogos genéticos previos. Esto evidencia la subrepresentación histórica de poblaciones no europeas en los estudios genómicos anteriores. “Estamos empezando a corregir un sesgo de larga data que ha favorecido el genoma europeo como estándar global”, afirma Bernardo Rodríguez Martín, coautor principal del estudio y líder del grupo de investigación en el CRG.

La diversidad se puede hallar en el “ADN basura”

Rodríguez Martín, que inició el proyecto en el laboratorio de Jan Korbel en el EMBL, desarrolló SVAN, un software que clasifica las alteraciones del ADN con etiquetas como “pieza duplicada” o “trozo eliminado”. Esta herramienta permitió un análisis más preciso de la variación estructural y facilitó la detección de patrones en regiones previamente consideradas inestables o sin valor funcional.

En particular, el equipo encontró que más de la mitad de la diversidad descubierta se localiza en regiones del genoma altamente repetitivas, tradicionalmente consideradas “ADN basura”. Estas zonas incluyen elementos móviles, conocidos como “genes saltarines”, capaces de copiarse y desplazarse por el genoma. El estudio identificó que unas pocas docenas de estos elementos altamente activos son responsables de la mayor parte de la actividad genética de la línea germinal.

Uno de los hallazgos más llamativos es el de un elemento LINE-1 hiperactivo que secuestra interruptores genéticos para replicarse en múltiples lugares del genoma. También se observó un comportamiento similar en los elementos SVA, lo que, según los autores, podría estar relacionado con procesos patológicos como el cáncer. “Nuestra investigación muestra cómo estas secuencias pueden manipular el genoma a gran escala, y abre nuevas líneas para el estudio de enfermedades genéticas”, añadió Rodríguez Martín.

El pangenoma humano de referencia

El segundo estudio, también dirigido por el EMBL y la Universidad de Düsseldorf, adoptó un enfoque complementario: en lugar de trabajar con una gran cohorte, analizó 65 genomas individuales con un altísimo nivel de detalle, logrando ensamblajes casi completos de cada cromosoma, incluyendo regiones altamente complejas como los centrómeros. Esta precisión permitió identificar variantes que no habían sido detectadas ni siquiera en el estudio anterior.

Ambos estudios están basados en la re-secuenciación de individuos del Proyecto 1.000 Genomas, una iniciativa pionera lanzada en 2015 para mapear la diversidad genética global, pero que se vio limitada por el uso de tecnologías de lectura corta, incapaces de detectar grandes alteraciones estructurales. El salto a la tecnología de lectura larga, que permite leer miles de letras genéticas de una sola vez, ha sido decisivo para alcanzar estos resultados.

Los autores proponen que la combinación de ambos enfoques —una amplia cohorte con secuenciación moderada y otra más pequeña con secuenciación exhaustiva— es la clave para construir un pangenoma humano de referencia, un nuevo estándar genético que represente con fidelidad la diversidad del planeta y que impulse la medicina personalizada. @mundiario

Comentarios