Page 72 - Tequio 11
P. 72
70 Métodos de reconstrucción filogenética I/Duchen/69-79
Introducción
Introducción
a sistemática filogenética tiene como objetivo encontrar las relaciones evolutivas o de parentesco
La sistemática filogenética tiene como objetivo encontrar las relaciones evolutivas o de parentesco entre
entre diferentes especies o distintos taxones supraespecíficos. Dichas conexiones evolutivas se
diferentes especies o distintos taxones supraespecíficos. Dichas conexiones evolutivas se representan
Lrepresentan comúnmente en la forma de un árbol filogenético, donde organismos emparentados
comúnmente en la forma de un árbol filogenético, donde organismos emparentados están unidos por medio de
están unidos por medio de líneas que simbolizan las ramas del árbol, y donde los nodos significan ancestros
líneas que simbolizan las ramas del árbol, y donde los nodos significan ancestros comunes entre especies o
comunes entre especies o clados. Dada la relevancia biológica de conocer las relaciones evolutivas entre
clados. Dada la relevancia biológica de conocer las relaciones evolutivas entre distintas especies, inferir una
distintas especies, inferir una filogenia a partir de datos morfológicos o moleculares es una práctica muy
filogenia a partir de datos morfológicos o moleculares es una práctica muy efectuada en biología evolutiva y
efectuada en biología evolutiva y taxonomía. Por otro lado, las filogenias también se usan para reconstruir
taxonomía. Por otro lado, las filogenias también se usan para reconstruir caracteres ancestrales (Pagel, 1999),
caracteres ancestrales (Pagel, 1999), establecer relojes moleculares (Bronham & Penny, 2003), o para
establecer relojes moleculares (Bronham & Penny, 2003), o para estudiar la evolución de caracteres
estudiar la evolución de caracteres morfológicos (Duchen, Alfaro, Rolland, Salamin & Silvestro, 2020).
morfológicos (Duchen, Alfaro, Rolland, Salamin & Silvestro, 2020).
Existen varios métodos estadísticos para la inferencia o reconstrucción filogenética (Brocchieri, 2001); entre
ellos, la máxima verosimilitud (ML) y la inferencia bayesiana son probablemente los más usados en la actualidad.
A diferencia de procedimientos basados en distancias genéticas entre secuencias (como el neighbor joining o
el UPGMA), o basados en máxima parsimonia (Edwards & Cavalli-Sforza, 1963; Peña, 2011), ML y el bayesiano
utilizan las verosimilitudes de cada posición (o columna) en un alineamiento de secuencias de ADN para inferir
una filogenia. En este trabajo se van a desarrollar primero los pasos necesarios para calcular una filogenia
basada en ML y en el siguiente artículo se plantearán los pasos para realizar una inferencia bayesiana. Se
comenzará con el algoritmo necesario para calcular la verosimilitud de un alineamiento (dada una filogenia
particular); luego se describirán dos ejemplos de modelos de mutación de ADN, los cuales son usados en el
cálculo de verosimilitudes; se concluye con un ejemplo simple de inferencia filogenética, mencionando además
el software usado para alineamientos más grandes.
Cálculo de la verosimilitud de una topología
Es importante comenzar por definir nuestros datos y parámetros a estimar. Dado un alineamiento D de
secuencias de ADN para un número n de especies, el objetivo es encontrar la filogenia, árbol o topología T que
mejor describa dicho alineamiento. A lo largo de este documento se usarán los vocablos filogenia y árbol
indistintamente para referirse a T, al igual que los términos alineamiento o datos para referirse a D.
Dado un alineamiento D y asumiendo que la evolución en cada posición de D y cada rama de T es
independiente, la verosimilitud está determinada por:
.
(+) ,- ,
(|) = ) *
(1)
+/0
(k)
Donde D corresponde al alineamiento en la posición k (con un total de m posiciones). Esto significa que si
podemos calcular la verosimilitud en cada posición del alineamiento separadamente, la verosimilitud total será
simplemente el producto de todas las posiciones de alineamiento. Para fines prácticos y evitar problemas
numéricos es mejor utilizar la versión logarítmica de dicha ecuación:
.
log (|) = 5 log * (+) ,- .
Tequio, enero-abril 2021, vol. 4, no. 11 (2)
+/0