Page 76 - Tequio 11
P. 76
74 Métodos de reconstrucción filogenética I/Duchen/69-79
cualquier otro. Para el caso de una transversión (por ejemplo de C a A) la tasa instantánea de cambio es
simplemente βπA. De acuerdo con estos ejemplos, es sencillo escribir las tasas de cambio para el resto de
nucleótidos.
Para calcular la probabilidad de un evento de sustitución a lo largo de una rama de longitud t también se
utilizará la distribución de Poisson. Si se comienza con una purina, la probabilidad de que no haya ningún evento
de transición a lo largo de t es Xf g [ , la probabilidad de transversiones es (1 − Xh[ ), la de transiciones pero no
transversiones es (1 − Xf g [ ) Xh[ , la de que no ocurra ningún evento es X(f g ah)[ , etcétera. Estos mismos
criterios para cálculo de probabilidades aplican para las pirimidinas. Ahora sí, la probabilidad de sustitución total
entre e.g. A y G a lo largo de t es:
i
(|, ) = Xh[ (1 − Xf g [ ) + *1 − Xh[ - i .
+
e i
En otras palabras, para obtener una G a partir de una A existen dos posibilidades: 1) no puede haber ninguna
transversión ( Xh[ ) y tiene que haber una transición (1 − Xf g [ ) que resulte en una G, o 2) pueden existir
transversiones (1 − Xh[ ) siempre y cuando la última resulte en una G. De esta misma manera pueden escribirse
expresiones para las otras sustituciones entre los distintos pares de nucleótidos.
Se finaliza esta sección mencionando los modelos F84 (Felsenstein & Churchill, 1996), HKY (Hasegawa,
Kishino & Yano, 1985) y el modelo General time reversible (GTR) (Lanave, Preparata, Sacone & Serio, 1984;
Tavaré, 1986). En el modelo F84 αR = αY . Por otro lado, si f g = _ ` a_ k entonces obtenemos el modelo HKY.
f j _ b a_ l
Finalmente, el modelo GTR generaliza los modelos vistos anteriormente, ya que incluye seis tasas de sustitución
(una para cada par de nucleótidos). Si bien no es necesaria su descripción a detalle en la presente revisión, este
modelo está implementado en los programas clásicos de inferencia filogenética (ver sección “Software para
inferencia filogenética con ML”).
Ejemplo de algoritmo para inferencia por ML
Ahora se va a desarrollar un ejemplo muy sencillo para inferir una filogenia usando ML. Se utilizará el
alineamiento del ejemplo 1.1.1 del artículo "Modelo de estimación de pesos de árbol filogenético para un
cuartet, aplicando conjugación de Hadamard" (publicado también en este número de la revista). Dicho
alineamiento contiene cuatro especies y 16 posiciones; se convierte a formato FASTA y se guarda en un archivo
denominado “alineamiento.fas”:
>E1
CCATCAAACGTGTGAC
>E2
ACAGCAATGTTATCTC
>E3
CCATTGAAGATGCGTT
>E4
ACAGTAGTGTTACCAG
Tequio, enero-abril 2021, vol. 4, no. 11