Page 44 - Tequio 11
P. 44

42    Modelo de estimación de pesos de árbol filogenético para un cuartet/Álvarez-González/41-52






                  Charleston, 1993, p. 232). En el caso de modelos binarios de evolución de caracteres, donde sólo hay dos estados

                observables, existen metodologías que permiten determinar en la última etapa el mejor árbol filogenético que

                explica la información existente (Hendy, 1989, pp. 317-318). Dichas metodologías son viables, ya que hay

                modelos de evolución para estos caracteres que proporcionan relaciones invertibles entre los valores esperados

                de cambios de estado sobre los diferentes caminos del árbol filogenético y la distribución de probabilidad de

                ambos caracteres sobre sus hojas (Hendy, 1989, p. 315). En el caso de modelos de evolución molecular, como el de

                Kimura 3-Parámetros, la conjugación de Hadamard proporciona una relación entre los valores esperados de tres

                tipos de sustitución molecular (transiciones, transversiones tipo I y transversiones tipo II) sobre los diferentes

                caminos del árbol filogenético y la distribución de probabilidad de los patrones de sustitución observables en sus

                hojas (Hendy & Snir, 2005, p. 15). Dicha relación no es invertible, por lo que la metodología de reconstrucción

                filogenética, en lugar de terminar con un árbol filogenético que explique mejor los datos observados, fija a uno

                de éstos desde el principio y toma como parámetros suyos dichas ternas de valores esperados (Chor, Hendy

                & Snir, 2006, p. 628). En consecuencia, el objetivo es determinar los valores óptimos para estas ternas que

                maximizan la probabilidad de que el árbol filogenético propuesto al inicio explique mejor los datos observados.

                La construcción de una función de verosimilitud es una opción adecuada para lograr dicha maximización (Chor,

                Kethan & Snir, 2003, p.78). En el contexto de la reconstrucción filogenética estas funciones son polinomios,

                cuyos valores extremos demandan metodologías de programación no lineal y de teorías algebraicas de resolución

                de sistemas de ecuaciones (Casanellas & Fernández-Sánchez, 2010, p. 1023).

                    El objetivo de este artículo es dar a conocer la herramienta de conjugación de Hadamard y ejemplificar su

                aplicación en el contexto de la reconstrucción filognética para el caso del cuartet de la Figura 2 como modelo

                de especiación del alineamiento de la Tabla 1, enfatizando cómo proponer la función de verosimilitud L(T)

                que maximice la probabilidad de que dicho cuartet describa mejor los datos observados en la Tabla 1. Esta

                metodología que concluye con la construcción de la función de verosimilitud L(T) es la que los autores del

                presente manuscrito definen como “Modelo de estimación de pesos de árbol filogenético”.

                     Chor, Hendy & Snir (2006) propusieron este Modelo de estimación de pesos de árbol filogenético por primera
                  vez dentro del contexto de un peine con tres hojas, bajo la restricción del modelo de evolución molecular tipo
                  Jukes-Cantor, sujeto a la condición de reloj molecular, abriendo la posibilidad de aplicarlo al caso que se plantea
                  en el presente manuscrito.
                    Las técnicas de optimización no lineal y de resolución de los sistemas de ecuaciones polinomiales que
                  surgen para maximizar la función de verosimilitud, resultado de la aplicación del modelo, no se contemplan en
                  este documento.

                1.1 Definiciones
                Definición  1.1.1. Un alineamiento de    linajes es una identificación de nucleótidos entre las secuencias
                asociadas a éstos. El alineamiento puede representarse mediante una tabla, donde cada renglón está
                relacionado con una especie distinta y donde los nucleótidos pertenecientes a la misma columna provienen del
                mismo nucleótido del ancestro que comparten. Estas columnas pueden enumerarse en sitio 1, sitio 2,
                etcétera. Un alineamiento puede originar carácteres vacíos, llamados gaps, lo que sugiere que los linajes
                que las contienen pudieron haber perdido nucleótidos durante el proceso evolutivo (o bien los linajes que
                no los  contienen pudieron haber ganado nucleótidos durante el proceso evolutivo). Cada columna de
                nucleótidos se conoce como un patrón de carácteres.




                                                 Tequio, enero-abril 2021, vol. 4, no. 11
   39   40   41   42   43   44   45   46   47   48   49