Page 17 - Tequio 11
P. 17

Filogenia: conceptos y generalidades/Leopardi-Verde & Escobedo-Sarti/7-25  15






                media aritmética (UPGMA); este boceto es empleado para ir añadiendo una a una las secuencias a ser alineadas.
                Por conveniencia, los algoritmos alinean las secuencias por pares. Por ello, cuando se utiliza un alineamiento
                progresivo, es de extrema importancia que las dos primeras secuencias se alineen correctamente, ya que su
                resultado afecta al resto del proceso (Mount, 2001). En los alineamientos progresivos, una vez que se coloca un
                gap, en esa posición siempre habrá un gap (Mount, 2001); ClustalW es un método que funciona de esta manera.
                Los gaps también se conocen como indels y son llamados así porque representan una inserción o una deleción
                en el genoma, reciben este nombre porque no es posible a priori saber de qué se trata.
                   Los métodos iterativos se diferencian de los progresivos en que repiten tantas veces como sea necesario
                el alineamiento de las secuencias, presentando al final una secuencia de consenso. En la actualidad, es común
                el uso de algoritmos que combinan ambas aproximaciones (son globales e iterativos), como MUSCLE y T-Cofee
                (Pivorano & Heringa, 2008).
                   Recurrir a uno u otro tipo de algoritmos es una decisión multifactorial. Edgar & Batzoglou (2006) hacen una
                serie de recomendaciones al respecto, por ejemplo, si se es muy tradicional, la opción lógica es ClustalW que da
                resultados bastante buenos, aunque es un algoritmo lento y menos preciso que los métodos más modernos. Si
                se manejan 500-1000 secuencias en la matriz que será alineada, MUSCLE es más eficiente que ClustalW en el
                uso del tiempo y su carácter iterativo disminuye sustancialmente los errores de identidad que pueden ocurrir en
                los alineamientos de ClustalW. Otra opción muy buena cuando se tienen más de 500 secuencias o secuencias
                con patrones muy complejos es MAFFT. T-Coffee produce alineamientos muy buenos, pero es lento, demanda
                amplios recursos del sistema y no puede ser utilizado con más de 50 secuencias a la vez.
                   Para  hacer  los  alineamientos  hay  muchas  alternativas,  desde  utilizar  los  ejecutables  de  los  algoritmos
                directamente, hasta emplear programas que los integran, como MEGA, Seaview, Geneious, entre otros. Otra
                opción es recurrir a servidores dedicados a alineamientos. En el sitio web del libro de Lemey, Salemi & Vandamme
                (2009)   existe una lista de algoritmos disponibles e indica dónde pueden ser utilizados o descargados. Adicional
                      4
                a esto, el servidor del Laboratorio Europeo de Biología Molecular (EMBL-EBI) pone a disposición del público, libre
                y gratuitamente, algunos de los algoritmos más populares.
                                                                 5
                   Selección del modelo de evolución. Para reconstruir una hipótesis de relaciones filogenéticas es indispensable
                contar con un modelo que describa cómo las secuencias de ADN o proteínas evolucionan a través de mutaciones,
                deriva génica, selección, recombinación, etcétera (Huson et al., 2010). En palabras más formales, un modelo de
                evolución es un conjunto de parámetros que se utilizan para describir el patrón de sustituciones que caracterizan
                a una matriz de secuencias de ADN o proteínas (Strimmer & von Haeseler, 2009). En este sentido, cuando se
                trabaja con secuencias, la selección del modelo es un paso crítico, pues tanto la subparametrización como la
                sobreparametrización pueden alterar los resultados del análisis (Lemmon & Moriarty, 2004).
                   Actualmente existen más de 88 modelos que reflejan distintos grados de complejidad en la evolución del ADN
                (Posada, 2008); entre ellos, los más importantes en orden de complejidad son Jukes y Cantor (JC), Felsenstein 81
                (F81), Kimura dos parámetros (K2P), Hasegawa-Kishino-Yano (HKY), Kimura tres parámetros (K3P), Tamura-Nei
                (TrN), Simétrico (SYM) y el modelo general de tiempo reversible (GTR, por “general time reversible”). La diferencia
                entre cada uno de estos modelos es el número y tipo de parámetros usados; por ejemplo, JC sólo considera la tasa
                de sustitución, mientras que F81 añade a esto la proporción en la que están las bases y así se van incrementando
                los parámetros hasta llegar al más complejo, el GTR, que toma en cuenta todos los parámetros posibles como



                4  https://www.kuleuven.be/aidslab/phylogenybook/Table3.1.html
                5  https://www.ebi.ac.uk/Tools/msa/


                                                 Tequio, enero-abril 2021, vol. 4, no. 11
   12   13   14   15   16   17   18   19   20   21   22