Page 46 - Tequio 11

P. 46

44 Modelo de estimación de pesos de árbol filogenético para un cuartet/Álvarez-González/41-52

• []\( ∪ ): conjunto de linajes que comparten el mismo carácter que el linaje de referencia.

Ejemplo 1.1.2. De la Tabla 2 del ejemplo 1.1.2, se fijó el linaje 2. Con respecto a éste, los patrones de sustitución
en los sitios 8 y 16 tienen la siguiente representación alternativa, respectivamente:

Sitio 8 Los caracteres en los linajes 1 y 3 se obtienen del carácter en el linaje 2 a partir de una transversión
tipo I: (∅, {1,3});
Sitio 16 El carácter en el linaje 3 se obtiene del carácter en el linaje 2 mediante una transición; el carácter en
el linaje 4 se obtiene del carácter del linaje 2 a través de una transversión tipo I: ({3}, {4}).

Esta última notación para los patrones de sustitución servirán en las siguientes secciones para identificar tanto
los renglones como las columnas de las matrices espectrales asociadas al teorema 3.3.1.

2. Distribución de probabilidad sobre un árbol filogenético

Casanellas (2018) explica que la reconstrucción de un árbol filogenético que da lugar a las especies actuales
recurre a la modelación de su evolución con procesos de Markov de sustitución de nucleótidos. De acuerdo con
el modelo de Kimura 3-Parámetros, hay tres sustituciones de nucleótidos, lo que implica la existencia de una
matriz de transición 4 × 4 que identifica las probabilidades de las diferentes sustituciones que se pueden
observar, dependiendo de los nucleótidos presentes en los vértices asociados. Ya sea que se parta desde una
raíz del árbol filogenético o desde algún otro vértice suyo, se puede construir una distribución de probabilidad
para los caracteres que se observan en sus hojas, tomando en cuenta a las matrices de transición.
Aclaremos con un ejemplo muy sencillo cómo se puede construir una distribución de probabilidad sobre el
árbol filogenético de la Figura 1.

Ejemplo 2.0.1. Consideremos la siguiente distribución de caracteres sobre los vértices del árbol filogenético de
la Figura 2: H (1) = I (5) = , H (2) = , H (3) = H (4) = y I (6) = . La letra griega se reserva en este
ejemplo para denotar una función que va del conjunto de los vértices del cuartet de la Figura 1 al conjunto de
nucleótidos. El número entre paréntesis hace referencia al vértice. El subíndice identifica si el vértice es
“observado” o “Escondido” (en el contexto de la teoría filogenética, sólo las hojas son observadas). En resumen:
los vértices 1 y 5 muestran adenina, el vértice 2 muestra timina, los vertices 3 y 4 muestran citocina y el vértice
6 muestra guanina.
Proponemos las siguientes matrices de transición tipo Kimura 3-Parámetros (observe su simetría) sobre las
ramas del árbol filogenético de la Figura 2:

Tequio, enero-abril 2021, vol. 4, no. 11

41 42 43 44 45 46 47 48 49 50 51