Page 47 - Tequio 11
P. 47
Modelo de estimación de pesos de árbol filogenético para un cuartet/Álvarez-González/41-52 45
Proponemos la distribución de probabilidades uniforme sobre la raíz del árbol: ( , L , L , L ).
L
M M M M
La probabilidad de observar dicha distribución de nucleótidos sobre los vértices del cuartet es:
1
(OPQQ|OS) = L (|) U (|) LU (|) LUM (|) M (|) =
4
1
(0.7)(0.1)(0.15)(0.15)(0.15) = 5.90625 × 10 ZU[
4
Observe que todas las probabilidades involucradas en el cálculo anterior son condicionadas.
2.1 Función de verosimilitud
El problema de filogenética que se formula en el presente documento es el siguiente: se propone un árbol
filogenético para un conjunto finito de linajes, cada uno identificado por su secuencia de nucleótidos. Se
propone un modelo de evolución molecular especificado por las matrices de transición sobre sus ramas. Las
entradas de estas matrices son parámetros del modelo. Se propone una distribución de probabilidad uniforme
sobre su raíz (si es que tiene) o bien sobre el vértice que se determine, a partir del cual se consideran caminos
convergentes en las hojas. La distribución de probabilidad de los patrones de carácter para el árbol se plantea
como en el ejemplo 2.0.1. Si dicho árbol tiene n hojas, los patrones de carácter (que en esta sección se
identifican por secuencias de nucleótidos L , U , \ , ⋯ ] ) también son n-dimensionales. Se define una función
de verosimilitud () como sigue:
(1)
d e ` ,e a ,e b ,⋯e c ,
= _ ) ` ,) a ,) b ,⋯) c
f g
donde indica el número de linajes, = {, , , }, ) ` ,) a ,) b ,⋯) c se calcula como en el ejemplo 2.0.1 y ) ` ,) a ,) b ,⋯) c
es la frecuencia relativa observada del mismo patrón de carácter.
Más adelante, en la sección 3.4, se formulará una función de verosimilitud cuyos parámetros sean los valores
esperados de sustitución (también llamados pesos) de cada rama del árbol filogenético, en lugar de las entradas
Tequio, enero-abril 2021, vol. 4, no. 11