Page 44 - Tequio 11
P. 44
42 Modelo de estimación de pesos de árbol filogenético para un cuartet/Álvarez-González/41-52
Charleston, 1993, p. 232). En el caso de modelos binarios de evolución de caracteres, donde sólo hay dos estados
observables, existen metodologías que permiten determinar en la última etapa el mejor árbol filogenético que
explica la información existente (Hendy, 1989, pp. 317-318). Dichas metodologías son viables, ya que hay
modelos de evolución para estos caracteres que proporcionan relaciones invertibles entre los valores esperados
de cambios de estado sobre los diferentes caminos del árbol filogenético y la distribución de probabilidad de
ambos caracteres sobre sus hojas (Hendy, 1989, p. 315). En el caso de modelos de evolución molecular, como el de
Kimura 3-Parámetros, la conjugación de Hadamard proporciona una relación entre los valores esperados de tres
tipos de sustitución molecular (transiciones, transversiones tipo I y transversiones tipo II) sobre los diferentes
caminos del árbol filogenético y la distribución de probabilidad de los patrones de sustitución observables en sus
hojas (Hendy & Snir, 2005, p. 15). Dicha relación no es invertible, por lo que la metodología de reconstrucción
filogenética, en lugar de terminar con un árbol filogenético que explique mejor los datos observados, fija a uno
de éstos desde el principio y toma como parámetros suyos dichas ternas de valores esperados (Chor, Hendy
& Snir, 2006, p. 628). En consecuencia, el objetivo es determinar los valores óptimos para estas ternas que
maximizan la probabilidad de que el árbol filogenético propuesto al inicio explique mejor los datos observados.
La construcción de una función de verosimilitud es una opción adecuada para lograr dicha maximización (Chor,
Kethan & Snir, 2003, p.78). En el contexto de la reconstrucción filogenética estas funciones son polinomios,
cuyos valores extremos demandan metodologías de programación no lineal y de teorías algebraicas de resolución
de sistemas de ecuaciones (Casanellas & Fernández-Sánchez, 2010, p. 1023).
El objetivo de este artículo es dar a conocer la herramienta de conjugación de Hadamard y ejemplificar su
aplicación en el contexto de la reconstrucción filognética para el caso del cuartet de la Figura 2 como modelo
de especiación del alineamiento de la Tabla 1, enfatizando cómo proponer la función de verosimilitud L(T)
que maximice la probabilidad de que dicho cuartet describa mejor los datos observados en la Tabla 1. Esta
metodología que concluye con la construcción de la función de verosimilitud L(T) es la que los autores del
presente manuscrito definen como “Modelo de estimación de pesos de árbol filogenético”.
Chor, Hendy & Snir (2006) propusieron este Modelo de estimación de pesos de árbol filogenético por primera
vez dentro del contexto de un peine con tres hojas, bajo la restricción del modelo de evolución molecular tipo
Jukes-Cantor, sujeto a la condición de reloj molecular, abriendo la posibilidad de aplicarlo al caso que se plantea
en el presente manuscrito.
Las técnicas de optimización no lineal y de resolución de los sistemas de ecuaciones polinomiales que
surgen para maximizar la función de verosimilitud, resultado de la aplicación del modelo, no se contemplan en
este documento.
1.1 Definiciones
Definición 1.1.1. Un alineamiento de linajes es una identificación de nucleótidos entre las secuencias
asociadas a éstos. El alineamiento puede representarse mediante una tabla, donde cada renglón está
relacionado con una especie distinta y donde los nucleótidos pertenecientes a la misma columna provienen del
mismo nucleótido del ancestro que comparten. Estas columnas pueden enumerarse en sitio 1, sitio 2,
etcétera. Un alineamiento puede originar carácteres vacíos, llamados gaps, lo que sugiere que los linajes
que las contienen pudieron haber perdido nucleótidos durante el proceso evolutivo (o bien los linajes que
no los contienen pudieron haber ganado nucleótidos durante el proceso evolutivo). Cada columna de
nucleótidos se conoce como un patrón de carácteres.
Tequio, enero-abril 2021, vol. 4, no. 11