Page 47 - Tequio 11
P. 47

Modelo de estimación de pesos de árbol filogenético para un cuartet/Álvarez-González/41-52  45




























                  Proponemos la distribución de probabilidades uniforme sobre la raíz del árbol:  ( ,   L ,   L ,   L ).
                                                                                               L
                                                                                               M  M  M  M

                  La probabilidad de observar dicha distribución de nucleótidos sobre los vértices del cuartet es:

                                               1
                                       (OPQQ|OS) =  L (|) U (|) LU (|) LUM (|) M (|) =
                                               4
                                          1
                                            (0.7)(0.1)(0.15)(0.15)(0.15) = 5.90625 × 10 ZU[
                                          4

                  Observe que todas las probabilidades involucradas en el cálculo anterior son condicionadas.

                  2.1 Función de verosimilitud
                  El problema de filogenética que se formula en el presente documento es el siguiente: se propone un árbol
                  filogenético para un conjunto finito de linajes, cada uno identificado por su secuencia de nucleótidos. Se
                  propone un modelo de evolución molecular especificado por las matrices de transición sobre sus ramas. Las
                  entradas de estas matrices son parámetros del modelo. Se propone una distribución de probabilidad uniforme
                  sobre su raíz (si es que tiene) o bien sobre el vértice que se determine, a partir del cual se consideran caminos
                  convergentes en las hojas. La distribución de probabilidad de los patrones de carácter para el árbol se plantea
                  como en el ejemplo 2.0.1. Si dicho árbol tiene  n  hojas, los patrones de carácter (que en esta sección se
                  identifican por secuencias de nucleótidos  L ,  U ,  \ , ⋯  ] ) también son n-dimensionales. Se define una función
                  de verosimilitud () como sigue:
                                                                             (1)
                                                                 d e ` ,e a ,e b ,⋯e c ,
                                                   = _  ) ` ,) a ,) b ,⋯) c
                                                      f g


                  donde  indica el número de linajes,  = {, , , },  ) ` ,) a ,) b ,⋯) c   se calcula como en el ejemplo 2.0.1 y  ) ` ,) a ,) b ,⋯) c
                  es la frecuencia relativa observada del mismo patrón de carácter.
                       Más adelante, en la sección 3.4, se formulará una función de verosimilitud cuyos parámetros sean los valores
                  esperados de sustitución (también llamados pesos) de cada rama del árbol filogenético, en lugar de las entradas









                                                 Tequio, enero-abril 2021, vol. 4, no. 11
   42   43   44   45   46   47   48   49   50   51   52