Séminaire DIC-ISC-CRIA - 24 octobre 2024 par Guy LAPALME

Guy LAPALME - 24 octobre 2024 à 10h30 au local PK-5115

TITRE : Génération bilingue de textes à partir de données

RÉSUMÉ :

Après avoir rappelé ce qu'est la génération de texte, nous présenterons une méthode pour créer un texte en anglais et un autre en français à partir d'une unique source de données.  Les étapes cruciales telles que la sélection des informations pertinentes et l'organisation du texte sont effectuées conjointement, tandis que le choix des termes et la structuration des phrases varient selon la langue. Les deux textes transmettront donc le même message. Cette approche s'appuie sur pyrealb, un réalisateur de phrases bilingue anglais-français. Son utilisation sera illustrée par quelques applications, p.ex. bulletins météo ou descriptions de matches sportifs. Nous terminerons en comparant ces résultats avec ceux obtenus avec un "grand modèle de langue"

BIOGRAPHIE :

Guy LAPALME est professeur à l’Université de Montréal, spécialisé en traitement automatique du langage naturel (TALN). Ses recherches portent sur la génération de texte, la traduction automatique et l’interaction homme-machine dans les technologies linguistiques. Il a contribué au développement de systèmes de TALN et est reconnu pour son travail sur les outils facilitant la communication entre humains et ordinateurs.

RÉFÉRENCES:

Lapalme, G. (2023). Data-to-Text Bilingual GenerationarXiv preprint arXiv:2311.14808.


Lapalme, G. (2020). The jsRealB Text Realizer: Organization and Use Cases--Revised versionarXiv preprint arXiv:2012.15425.

Suivez-nous