Page 76 - Tequio 11
P. 76

74    Métodos de reconstrucción filogenética I/Duchen/69-79






                cualquier otro. Para el caso de una transversión (por ejemplo de C a A) la tasa instantánea de cambio es
                simplemente  βπA. De acuerdo con estos ejemplos, es sencillo escribir las tasas de cambio para el resto de
                nucleótidos.
                     Para calcular la probabilidad de un evento de sustitución a lo largo de una rama de longitud t también se
                utilizará la distribución de Poisson. Si se comienza con una purina, la probabilidad de que no haya ningún evento

                de transición a lo largo de t es   Xf g [ , la probabilidad de transversiones es (1 −   Xh[ ), la de transiciones pero no
                transversiones es (1 −  Xf g [ ) Xh[ , la de que no ocurra ningún evento es   X(f g ah)[ , etcétera. Estos mismos
                criterios para cálculo de probabilidades aplican para las pirimidinas. Ahora sí, la probabilidad de sustitución total
                entre e.g. A y G a lo largo de t es:

                                                                   i
                                         (|, ) =   Xh[ (1 −  Xf g [ )  + *1 −   Xh[ - i .
                                                                 + 
                                                                 e   i

                En otras palabras, para obtener una G a partir de una A existen dos posibilidades: 1) no puede haber ninguna
                transversión ( Xh[ )  y tiene que haber una transición  (1 −   Xf g [ ) que resulte en una G, o 2) pueden existir
                transversiones (1 −  Xh[ ) siempre y cuando la última resulte en una G. De esta misma manera pueden escribirse
                expresiones para las otras sustituciones entre los distintos pares de nucleótidos.
                     Se finaliza esta sección mencionando los modelos F84 (Felsenstein & Churchill, 1996), HKY (Hasegawa,
                Kishino & Yano, 1985) y el modelo General time reversible (GTR) (Lanave, Preparata, Sacone & Serio, 1984;
                Tavaré, 1986). En el modelo F84 αR   = αY .  Por otro lado, si   f g  =  _ ` a_ k  entonces obtenemos el modelo HKY.
                                                                   f j  _ b a_ l
                Finalmente, el modelo GTR generaliza los modelos vistos anteriormente, ya que incluye seis tasas de sustitución
                (una para cada par de nucleótidos). Si bien no es necesaria su descripción a detalle en la presente revisión, este
                modelo está implementado en los programas clásicos de inferencia filogenética (ver sección “Software para
                inferencia filogenética con ML”).

                Ejemplo de algoritmo para inferencia por ML
                Ahora  se va  a desarrollar un ejemplo muy sencillo para inferir una filogenia usando  ML.  Se utilizará  el
                alineamiento  del ejemplo 1.1.1  del artículo  "Modelo de estimación de pesos de árbol filogenético  para un
                cuartet, aplicando conjugación de Hadamard"  (publicado también en este número de la revista). Dicho
                alineamiento contiene cuatro especies y 16 posiciones; se convierte a formato FASTA y se guarda en un archivo
                denominado “alineamiento.fas”:

                >E1
                CCATCAAACGTGTGAC
                >E2
                ACAGCAATGTTATCTC
                >E3
                CCATTGAAGATGCGTT
                >E4
                ACAGTAGTGTTACCAG







                                                 Tequio, enero-abril 2021, vol. 4, no. 11
   71   72   73   74   75   76   77   78   79   80   81