Bannière Faculté des sciences DIC
 
Description
Title : SOUTENANCE DE THÈSE: Nouveaux algorithmes pour l’inférence de réseaux phylogénétiques
Tutor : Matthieu Willems
Number : 29/18
Status : Not exceeded
Begin : Tuesday, 12 June, 2018 à 13:30PM
Location : PK-2265, Pavillon Président-Kennedy (PK)
Bookable : 12

** Thèse présentée dans le cadre du doctorat en informatique, UQAM **

Résumé :

La théorie de l’évolution de Darwin, puis la découverte de l’ADN (acide désoxyribonucléique) dans les années 1950 ont donné naissance à la phylogénie moléculaire, dont le but principal est de construire des arbres d’espèces à partir de données moléculaires (essentiellement de l’ADN ou des protéines). De nombreux algorithmes ont été développés dans ce contexte. Les méthodes de distances sont les plus rapides, tandis que les méthodes basées sur les caractères donnent généralement de meilleurs résultats mais nécessitent des temps de calcul beaucoup plus importants.

Par ailleurs, plusieurs phénomènes évolutifs fondamentaux, comme l’hybridation, ne peuvent pas être représentés par un arbre phylogénétique. Il faut alors considérer des réseaux phylogénétiques. Plusieurs méthodes d’inférence de tels réseaux ont été introduites depuis une vingtaine d’années. La plupart d’entre elles produisent des réseaux implicites, qui peuvent s’avérer très difficiles à interpréter. Notre premier projet a ainsi consisté à développer un algorithme pour inférer un réseau d’hybridation explicite à partir d’une matrice de distances entre un certain nombre d’espèces. Des simulations et des tests sur des données réelles nous ont permis de mettre en lumière l’efficacité de notre nouvel algorithme. Notre programme est disponible gratuitement pour l’ensemble de la communauté scientifique.

Dans un deuxième temps, nous avons appliqué notre nouvelle méthodologie dans le cadre de la biolinguistique. L’évolution des langues peut en effet être représentée sous la forme d’un arbre ou d’un réseau, et plusieurs études ont démontré la pertinence d’appliquer des méthodes d’inférence phylogénétique à des données linguistiques. Nous avons ainsi reconstruit un réseau d’hybridation explicite représentant l’histoire de 84 langues indo-européennes, et nous avons comparé ce réseau à ceux obtenus à partir d’autres méthodes.

Enfin, dans notre troisième projet, nous avons développé une méthode d’inférence de réseaux phylogénétiques basée sur les caractères. Notre algorithme prend en entrée une séquence binaire (correspondant, par exemple, à la présence ou l’absence de certains gènes) pour chaque espèce considérée, et reconstruit un réseau phylogénétique explicite, dont les feuilles sont en correspondance avec les espèces considérées. Plusieurs simulations ont montré que cet algorithme donne de meilleurs résultats que notre méthode de distances, même si les temps de calculssont généralement plus longs.

Mots clés : Réseaux phylogénétiques, hybridation, neighbor-joining, maximum de vraisemblance, biolinguistique.

Jury :

M. Mohamed Bouguessa (président du jury)

M. Petko Valtchev (évaluateur interne)

M. Philippe Gambette (évaluateur externe)

M. Vladimir Makarenkov (directeur de recherche)