Le logiciel PhyML
Fondamental :
Sur la base de cet algorithme, les chercheurs ont développé un logiciel baptisé PhyML. Il est en accès libre sur Internet, comme c'est l'usage dans le domaine.
Méthode :
Les chercheurs du monde entier profitent de sa simplicité d'utilisation : ils n'ont plus qu'à entrer leurs données et à attendre que les huit processeurs de l'ordinateur du Lirmm s'en occupent.
Ils reçoivent les résultats par e-mail quelques heures ou minutes plus tard. « Le serveur tourne à plein régime : il y a trois ou quatre utilisateurs en permanence.
Fondamental :
Le principe de base de l'algorithme est celui du maximum de vraisemblance, concept majeur en statistique. Il consiste ici à définir un modèle hypothétique qui décrive à la fois le degré de parenté entre les espèces étudiées et les mutations qui ont pu se produire à partir de la séquence originale postulée.
Ensuite, il calcule la probabilité que les données correspondent à l'hypothèse de départ. Le processus est réitéré, modèle après modèle, jusqu'à ce que cette probabilité soit maximale. Le modèle correspondant constitue la réponse de l'algorithme.
Ce tâtonnement demandait des temps de calculs colossaux jusqu'à l'arrivée de PhyML, qui est en fait une approximation plus que satisfaisante de ce principe. C'est ainsi qu'on voit les espèces former un arbre où chaque noeud correspond à un ancêtre commun et où la longueur des branches représente le temps pendant lequel les espèces ont évolué.

Remarque :
Grâce à PhyML, on a pu reconstruire l'arbre phylogénétique des primates à partir de séquences d'ADN représentant plus de 900 000 paires de bases.[1] Chaque nœud correspond à un ancêtre commun, et la longueur des branches, au temps d'évolution.