Ngoc Tan LE – 30 septembre 2021
Titre : IA et EDI - le cas du TAL pour la préservation et revitalisation des langues autochtones
Résumé:
L’IA présente plusieurs défis et enjeux dont l’inclusivité, l’explicabilité, la responsabilité, les biais et la discrimination ainsi que la disponibilité et qualité des données. Les langues autochtones souffrent du manque de données et de ressources linguistiques, ce qui les rend très menacées de disparition. Ces langues autochtones sont reconnues comme étant des langues polysynthétiques à faibles ressources mais aussi ayant une complexité morphologique et des variations dialectales. Cette présentation porte sur nos travaux de recherche courants concernant un groupe de langues autochtones, l'inuktitut et l'inuinnaqtun - deux langues inuites. Nous proposons une segmentation morphologique non supervisée basée sur l'approche Adapter Grammars et une étude empirique de la segmentation morphologique à des fins de la traduction automatique neuronale pour langues très peu dotées.
Bio:
Ngoc-Tan Le est actuellement stagiaire post-doctoral à l’UQAM. Il a obtenu un doctorat en informatique cognitive en 2019. Ses intérêts en recherche incluent le traitement automatique des langues naturelles (TALN) et l’intelligence artificielle, notamment pour le développement d’applications et outils d’intelligence artificielle pour les langues et domaines peu dotés ou pauvres en données, dont les langues autochtones et leurs enjeux et réalités.