Page 17 - Tequio 11
P. 17
Filogenia: conceptos y generalidades/Leopardi-Verde & Escobedo-Sarti/7-25 15
media aritmética (UPGMA); este boceto es empleado para ir añadiendo una a una las secuencias a ser alineadas.
Por conveniencia, los algoritmos alinean las secuencias por pares. Por ello, cuando se utiliza un alineamiento
progresivo, es de extrema importancia que las dos primeras secuencias se alineen correctamente, ya que su
resultado afecta al resto del proceso (Mount, 2001). En los alineamientos progresivos, una vez que se coloca un
gap, en esa posición siempre habrá un gap (Mount, 2001); ClustalW es un método que funciona de esta manera.
Los gaps también se conocen como indels y son llamados así porque representan una inserción o una deleción
en el genoma, reciben este nombre porque no es posible a priori saber de qué se trata.
Los métodos iterativos se diferencian de los progresivos en que repiten tantas veces como sea necesario
el alineamiento de las secuencias, presentando al final una secuencia de consenso. En la actualidad, es común
el uso de algoritmos que combinan ambas aproximaciones (son globales e iterativos), como MUSCLE y T-Cofee
(Pivorano & Heringa, 2008).
Recurrir a uno u otro tipo de algoritmos es una decisión multifactorial. Edgar & Batzoglou (2006) hacen una
serie de recomendaciones al respecto, por ejemplo, si se es muy tradicional, la opción lógica es ClustalW que da
resultados bastante buenos, aunque es un algoritmo lento y menos preciso que los métodos más modernos. Si
se manejan 500-1000 secuencias en la matriz que será alineada, MUSCLE es más eficiente que ClustalW en el
uso del tiempo y su carácter iterativo disminuye sustancialmente los errores de identidad que pueden ocurrir en
los alineamientos de ClustalW. Otra opción muy buena cuando se tienen más de 500 secuencias o secuencias
con patrones muy complejos es MAFFT. T-Coffee produce alineamientos muy buenos, pero es lento, demanda
amplios recursos del sistema y no puede ser utilizado con más de 50 secuencias a la vez.
Para hacer los alineamientos hay muchas alternativas, desde utilizar los ejecutables de los algoritmos
directamente, hasta emplear programas que los integran, como MEGA, Seaview, Geneious, entre otros. Otra
opción es recurrir a servidores dedicados a alineamientos. En el sitio web del libro de Lemey, Salemi & Vandamme
(2009) existe una lista de algoritmos disponibles e indica dónde pueden ser utilizados o descargados. Adicional
4
a esto, el servidor del Laboratorio Europeo de Biología Molecular (EMBL-EBI) pone a disposición del público, libre
y gratuitamente, algunos de los algoritmos más populares.
5
Selección del modelo de evolución. Para reconstruir una hipótesis de relaciones filogenéticas es indispensable
contar con un modelo que describa cómo las secuencias de ADN o proteínas evolucionan a través de mutaciones,
deriva génica, selección, recombinación, etcétera (Huson et al., 2010). En palabras más formales, un modelo de
evolución es un conjunto de parámetros que se utilizan para describir el patrón de sustituciones que caracterizan
a una matriz de secuencias de ADN o proteínas (Strimmer & von Haeseler, 2009). En este sentido, cuando se
trabaja con secuencias, la selección del modelo es un paso crítico, pues tanto la subparametrización como la
sobreparametrización pueden alterar los resultados del análisis (Lemmon & Moriarty, 2004).
Actualmente existen más de 88 modelos que reflejan distintos grados de complejidad en la evolución del ADN
(Posada, 2008); entre ellos, los más importantes en orden de complejidad son Jukes y Cantor (JC), Felsenstein 81
(F81), Kimura dos parámetros (K2P), Hasegawa-Kishino-Yano (HKY), Kimura tres parámetros (K3P), Tamura-Nei
(TrN), Simétrico (SYM) y el modelo general de tiempo reversible (GTR, por “general time reversible”). La diferencia
entre cada uno de estos modelos es el número y tipo de parámetros usados; por ejemplo, JC sólo considera la tasa
de sustitución, mientras que F81 añade a esto la proporción en la que están las bases y así se van incrementando
los parámetros hasta llegar al más complejo, el GTR, que toma en cuenta todos los parámetros posibles como
4 https://www.kuleuven.be/aidslab/phylogenybook/Table3.1.html
5 https://www.ebi.ac.uk/Tools/msa/
Tequio, enero-abril 2021, vol. 4, no. 11