Ahora tenemos el ‘árbol genealógico’ humano más grande jamás visto, con 231 millones de linajes ancestrales

En junio de 2000, dos grupos rivales de investigadores apreton de manos en el éxito compartido de un hito en la biología: la entrega de un borrador del genoma humano.

Lo que comenzó con un mapa incompleto de nuestros cromosomas ha florecido desde entonces un vasto tesoro de secuencias individualizadas de todos los rincones del mundo y, en muchos casos, desde muy atrás en el tiempo.

En algún lugar de ese océano de ADN decodificado hay una historia de nuestra humanidad compartida.

Desafortunadamente, leerlo es más fácil decirlo que hacerlo. La gran cantidad de datos no solo es un problema, las sutiles diferencias en las muestras, los diversos formatos y las técnicas de análisis que priorizan diferentes tipos de errores presentan obstáculos para una interpretación unificada.

Ahora, los investigadores del Big Data Institute (BDI) de la Universidad de Oxford en el Reino Unido han dado un gran paso al fusionar un bosque de más de 3600 secuencias individuales de 215 poblaciones en un solo árbol enorme.

Las ramas del árbol forman parte de 231 millones de linajes ancestrales alucinantes. En su base hay una serie de raíces representadas por ocho antiguas secuencias del genoma humano altamente detalladas, con miles de fragmentos más pequeños utilizados para confirmar su lugar en lo profundo de nuestro pasado.

Entre ellos se encuentran tres genomas neandertales, un genoma de un denisovano y una pequeña familia que vivió en Siberia hace más de cuatro mil años.

“Esencialmente, estamos reconstruyendo los genomas de nuestros antepasados ​​y usándolos para formar una serie de árboles evolutivos vinculados que llamamos ‘secuencia de árboles'”. dice el genetista Anthony Wilder Wohns, quien dirigió el estudio mientras completaba su doctorado en el BDI.

“Entonces podemos estimar cuándo y dónde vivieron estos antepasados”.

Su método de secuencia de árboles hace uso de lo que se conoce como una estructura de datos sucinta, un concepto informático que tiene como objetivo representar los datos en una cantidad óptima de espacio que también limita la cantidad de tiempo necesario para probarlo todo con preguntas.

Podríamos aplicar un pensamiento similar al guardar archivos en nuestra propia computadora, encontrar un compromiso entre comprimir documentos y comprimirlos en largas listas de carpetas, o simplemente guardar todo en el escritorio.

En este caso específico, una secuencia de árbol encuentra correlaciones entre diferentes ramas de un árbol para ayudar a que los grandes grupos de información sean más fáciles de estudiar.

Al convertir los datos en gráficos con nodos que representan varios linajes y mapear mutaciones a lo largo de los bordes, las bases de datos genéticas masivas no solo se pueden comprimir en un espacio relativamente pequeño, sino que se puede acceder más fácilmente mediante algoritmos diseñados para buscar estadísticas interesantes.

“El poder de nuestro enfoque es que hace muy pocas suposiciones sobre los datos subyacentes y también puede incluir muestras de ADN modernas y antiguas”. dice Wohns, quien explica con más detalle su trabajo en el siguiente video.

La incorporación de etiquetas en las ubicaciones geográficas de las secuencias permitió al equipo estimar dónde podrían haber vivido ciertos ancestros comunes y cómo se movían.

Esto no solo revela eventos que ya sospechamos, como la forma en que las poblaciones humanas migraron de África, sino que sugiere cambios en las densidades de población dentro de los grupos ancestrales de los que todavía estamos aprendiendo, como los denisovanos.

Gracias a la eficiencia de este proceso, el ya impresionante árbol tiene mucho espacio para crecer a medida que haya más datos genéticos disponibles en el futuro.

Agregar millones de genomas más solo hará que los resultados adicionales sean más precisos, señalando exactamente dónde encaja una secuencia nueva en una genealogía que se extiende por todo el mundo.

“Esta genealogía nos permite ver cómo la secuencia genética de cada persona se relaciona entre sí, a lo largo de todos los puntos del genoma”. dice El genetista evolutivo de BDI, Yan Wong.

Pensando aún más, no hay razón para que el mismo enfoque no pueda aplicarse a otras especies, posiblemente algún día contribuyendo a un tapiz global de vida en la Tierra.

“Si bien los humanos son el foco de este estudio, el método es válido para la mayoría de los seres vivos, desde los orangutanes hasta las bacterias”. dice Residencial

“Podría ser particularmente beneficioso en la genética médica, al separar las verdaderas asociaciones entre las regiones genéticas y las enfermedades de las conexiones espurias que surgen de nuestra historia ancestral compartida”.

Esta investigación fue publicada en Ciencia.

Leave a Reply

Your email address will not be published. Required fields are marked *