Page 75 - Tequio 11
P. 75

Métodos de reconstrucción filogenética I/Duchen/69-79  73






                cinco especies tienen 105 topologías, y si hablamos de un alineamiento de 50 especies (muy común en estudios
                                           76
                biológicos) tendríamos 2,75×10 topologías posibles. Por tanto, computacionalmente no es realista calcular la
                verosimilitud de tal cantidad de árboles. Para solucionar esto, existen algoritmos que hacen una búsqueda de
                topologías solamente entre aquellas con mayor verosimilitud (Stamatakis, 2014).


                Modelos de mutación de ADN
                Se continúa  ahora con la descripción de modelos de mutación de ADN, los cuales  se usan para calcular
                verosimilitudes. Existen distintos modelos para estimar la probabilidad de cambiar de un nucleótido a otro a lo
                largo de una rama. La complejidad de dichos modelos radica en la reversibilidad de la sustitución de nucleótidos,
                o en la inclusión de eventos denominados “transiciones” y “transversiones”. Desde el punto de vista genético-
                molecular, una transición es una sustitución entre purinas (nucleótidos A y G) o pirimidinas (C y T), mientras que
                una transversión es un cambio de una purina a una pirimidina, o viceversa.

                Jukes-Cantor
                El modelo más simple es el de Jukes-Cantor (Jukes & Cantor, 1969), donde se asume que la probabilidad de que
                un nucleótido modifique a los otros tres es la misma. Partiendo de que la tasa instantánea de cambio de un
                nucleótido específico es μ/3, y que la frecuencia de cada nucleótido es 1/4 (πA   = πC   = πG   = πT   = ¼), entonces la
                tasa de sustitución total de un nucleótido cualquiera es μ/3 + μ/3 + μ/3 + μ/3 = 4μ/3.
                     Para calcular la probabilidad de un evento de sustitución a lo largo de una rama de longitud t se emplea la
                distribución de Poisson. En este caso, la probabilidad de una “no” sustitución es e -4μt/3 , donde 4μ/3 corresponde
                a la tasa de sustitución calculada en el párrafo anterior y la probabilidad de al menos un evento de sustitución
                es 1-e -4μt/3 . Por tanto, la probabilidad de cambio de un nucleótido s a otro x a lo largo de una rama de longitud t
                viene dada por:
                                                              1       Y
                                                   (|, , ) =  V1 −  D \,
                                                                     X Z[
                                                              4
                donde el factor 1/4 indica la probabilidad de que el último evento de sustitución resulte en el nucleótido x.
                     El modelo de Kimura (1980) también asume que las frecuencias nucleotídicas  πX  (X  ∈  {A,C,G,T})  son las
                mismas. Sin embargo, a diferencia del modelo de Jukes-Cantor, el de Kimura distingue entre transiciones y
                transversiones. No se desarrollará aquí este modelo, pero se presentará uno más general que incluye al de
                Kimura, además de otros como casos especiales.

                Tamura-Nei

                Este modelo descrito originalmente por  Tamura  & Nei (1993) hace diferencia entre transiciones y
                transversiones, y también permite que las frecuencias nucleotídicas πX sean distintas entre sí. Para tomar en
                cuenta transiciones y transversiones –y siguiendo la notación en Felsenstein (2004)– se definirá como α R a la
                probabilidad de escoger una purina a partir una purina, y α Y a la probabilidad de escoger una pirimidina a partir
                de una pirimidina. Además, se definirá como β a la probabilidad de elegir un nucleótido cualquiera a partir de las
                cuatro bases A, C, G y T.
                                                                                                       _ `
                   Con base en estas definiciones la tasa instantánea de cambio entre las purinas e.g. G a A sería  ^  +
                                                                                                      _ ` a_ b
                 e . Aquí, el primer término representa la probabilidad de escoger otra purina (A) dado que se parte de una
                purina (G), mientras que el segundo término representa la probabilidad de escoger al nucleótido A a partir de



                                                 Tequio, enero-abril 2021, vol. 4, no. 11
   70   71   72   73   74   75   76   77   78   79   80