Auteur : Dagenais, Mylène

Séminaire DIC-ISC-CRIA - 23 janvier 2025 par Marco LOPES et Nicolas GOULET

Marco LOPES et Nicolas GOULET - 23 janvier 2025 à 10h30 au PK-5115 (201, ave President-Kennedy, 5e étage)

TITRE : Le Dictionnaire : Un Petit Modèle de Langue pour le Lexique Mental

RÉSUMÉ 

Lorsque nous lisons ou entendons un mot dont le sens nous échappe, nous pouvons chercher sa définition dans un dictionnaire. Si dans la définition nous lisons un autre mot au sens inconnu, nous pouvons chercher sa propre définition, répétant le processus autant que nécessaire. Cependant, une langue ne peut être apprise en utilisant que la recherche de définitions dans un dictionnaire : le sens de certains mots doit être acquis au préalable. Combien de mots doivent alors être connus pour pouvoir apprendre tous les autres? Trouver le plus petit ensemble de tels mots - un ensemble d’ancrage minimal - est formellement équivalent à l'identification d’un transversal de circuits de cardinalité minimale d’un graphe de dictionnaire. Quels sont les mots retrouvés dans ces ensembles, et comment et quand apprenons-nous leurs sens?

BIOGRAPHIE

Marco LOPES Professeur de linguistique, Université de São Paulo, est spécialisé en syntaxe, sémantique et linguistique informatique. Ses recherches portent sur les cadres grammaticaux formels, le traitement du langage naturel et l’interface entre la théorie linguistique et l’IA. Lopes contribue activement à faire progresser notre compréhension de la structure du langage et de l'intégration du langage machine.

Nicolas GOULET complète sa maîtrise en informatique à l'UQÀM. Ses recherches portent sur l'analyse théorique des graphes des dictionnaires numériques.

RÉFÉRENCES:

Abdenbi, M., Massé, A. B., Goupil, A., Lapointe, M., & Lavoie, M. (2024). Enumerating Minimum Feedback Vertex Sets in directed graphs with union-cat trees. RAIRO-Theoretical Informatics and Applications58, 18.

Abdenbi, M., Massé, A. B., Goupil, A., & Marcotte, O. (2024). On the Confluence of Directed Graph Reductions Preserving Feedback Vertex Set MinimalityarXiv preprint arXiv:2406.16390.

Fernandes, R., & Lopes, M. (2024, September). Open-source LLMs vs. NMT Systems: Translating Spatial Language in EN-PT-br Subtitles. In Proceedings of the 16th Conference of the Association for Machine Translation in the Americas (Volume 2: User Track) (pp. 152-153).

Rodrigues, E. J., Santos, P. E., Lopes, M., Bennett, B., & Oppenheimer, P. E. (2020). Standpoint semantics for polysemy in spatial prepositionsJournal of Logic and Computation30(2), 635-661.

Vidéo du séminaire à venir.

Séminaire DIC-ISC-CRIA - 28 novembre 2024 par Grégoire BORST

Grégoire BORST - 28 novembre 2024 à 10h30 au PK-5115

TITRE : L’influence de l’IA sur le développement de la cognition

RÉSUMÉ

L'IA est de plus en plus présente dans nos quotidiens. Si elle force nos cerveaux adultes à s'adapter, elle soulève des questions quant à ses effets potentiels sur les cerveaux des enfants et des adolescents en plein développement. L'enjeu de cette conférence est de présenter les mécanismes du développement neurocognitif de l'enfant et de l'adolescent et d'interroger comment l'IA peut affecter ces mécanismes

BIOGRAPHIE

Grégoire BORST est professeur de psychologie du développement et de neurosciences cognitives de l’éducation à l’Université Paris Cité. Ses recherches portent sur les fonctions cognitives de haut niveau telles que la métacognition, la régulation émotionnelle et le contrôle cognitif. Il a reçu le Prix Dagnan-Bouveret de l’Académie des Sciences Morales et Politiques pour ses recherches en psychologie cognitive et éducation.

RÉFÉRENCE

Borst, G. (2023). La Neuroéducation–LaPsyDÉ (UMR CNRS 8240). L'Année psychologique, (2), 387-392.

Séminaire DIC-ISC-CRIA - 21 novembre 2024 par Shahab BAKHTIARI

Shahab BAKHTIARI - 21 novembre 2024 à 10h30 au PK-5115

TITRE : La généralisation en apprentissage perceptif visuel

RÉSUMÉ 

L’Apprentissage Perceptif Visuel (APV) améliore la sensibilité visuelle grâce à la pratique, mais il se généralise rarement à de nouvelles conditions de test, un phénomène semblable au surapprentissage en apprentissage automatique. Le degré de généralisation de l’APV varie selon les tâches, limitant son application pratique en rééducation visuelle et formation d’experts (radiologues, etc.). Je discuterai des théories expliquant cette généralisation et présenterai les recherches de mon laboratoire sur la NeuroIA, un modèle computationnel visant à prédire et améliorer la généralisation de l’APV.

BIOGRAPHIE

Shahab BAKHTIARI est professeur adjoint au département de psychologie de l’Université de Montréal et membre associé de l’Institut d’intelligence artificielle Mila Québec. Ses recherches portent sur les réseaux neuronaux et leur rôle dans l’apprentissage perceptif humain, en explorant les liens entre l’intelligence artificielle et les mécanismes cérébraux. Bakhtiari détient un doctorat en neurosciences de l’Université McGill, avec une expertise en perception visuelle, apprentissage profond et apprentissage de représentation dans les systèmes neuronaux.

RÉFÉRENCE

Bakhtiari, S., Mineault, P., Lillicrap, T., Pack, C., & Richards, B. (2021). The functional specialization of visual cortex emerges from training parallel pathways with self-supervised predictive learningAdvances in Neural Information Processing Systems34, 25164-25178.

Zador, A., Escola, S., Richards, B., Ölveczky, B., Bengio, Y., Boahen, K., Botvinick, M., Chklovskii, D., Churchland, A., Clopath, C. and DiCarlo, J., (2023). Catalyzing next-generation artificial intelligence through NeuroAINature communications14(1), p.1597.

Bakhtiari, S. (2024). Representational asymmetries in neural networks: why should we care?

Séminaire DIC-ISC-CRIA - 14 novembre 2024 par Philippe BEAUDOIN

Philippe Beaudoin - 14 novembre 2024 à 10h30 au PK-5115

TITRE : La programmation pilotée par des prompts : Vers une approche raisonnée

RÉSUMÉ

Il n’y a pas si longtemps, la communauté scientifique considérait l’ingénierie des prompts comme une forme de “bidouillage”. La véritable science se situait au niveau des modèles. Deux ans après le lancement de ChatGPT, il semble toutefois que les modèles de langage deviennent une commodité, tandis que les prompts se transforment en une nouvelle couche logicielle. Pourtant, la programmation pilotée par des prompts en est encore à ses débuts. Concevoir des logiciels à grande échelle, robustes et maintenables sur la base de prompts est une tâche ardue, même pour des applications tolérantes aux erreurs, comme les chatbots. Cette nouvelle couche logicielle nécessite de toute urgence une approche rigoureuse, semblable à celle que nous avons appliquée au reste de la pile de développement grâce à l’ingénierie logicielle. Dans cette présentation, nous aborderons l’approche interne de numeno.ai pour une programmation pilotée par des prompts de haute qualité. Nous parlerons de la couche intermédiaire de primitives fonctionnelles basées sur des prompts que nous avons développée, ce qui nous a permis de multiplier par 10 la vitesse de mise en production, de test et de maintenance de notre logiciel. Nous présenterons également certains des outils que nous utilisons quotidiennement et en quoi ils diffèrent de leurs équivalents dans la pile d’ingénierie logicielle traditionnelle.

BIOGRAPHIE

Philippe BEAUDOIN est cofondateur de numeno, une plateforme basée à Montréal utilisant l'IA pour aider les utilisateurs à personnaliser leur contenu. Ancien chercheur chez Google DeepMind, il se concentre sur l'utilisation de l'IA pour un engagement plus significatif, donnant aux utilisateurs plus de contrôle sur leur expérience numérique. Son travail à numeno met l'accent sur la curation basée sur des principes éthiques comme la transparence et l'autonomie. Beaudoin s'intéresse également aux implications éthiques de l'IA, cherchant à concevoir des systèmes qui favorisent le bien-être humain plutôt que des algorithmes d'optimisation axés sur le profit.

RÉFÉRENCE

Roy N, Posner I, Barfoot T, Beaudoin P, Bengio Y, Bohg J, Brock O, Depatie I, Fox D, Koditschek D, Lozano-Perez T. (2021). From machine learning to robotics: Challenges and opportunities for embodied intelligencearXiv preprint arXiv:2110.15245.

Séminaire DIC-ISC-CRIA - 7 novembre 2024 par Guillaume LAJOIE

Guillaume LAJOIE - 7 novembre 2024 à 10h30 au PK-5115

TITRE: Beyond parameters: Learning in-context without plasticity in neural networks

RÉSUMÉ

Les réseaux neuronaux peuvent approximer un large éventail de fonctions si une attribution de crédit appropriée est mise en place. Les théories de l’apprentissage se sont concentrées sur l’ajustement des paramètres d’un réseau, tels que les poids de connectivité, afin de minimiser les erreurs sur des tâches spécifiques. Dans le cerveau, ces modifications sont facilitées par des mécanismes de plasticité synaptique, tandis que les réseaux profonds utilisent la descente de gradient directe. Certains processus d’apprentissage dans le cerveau ne reposent pas uniquement sur ces mises à jour paramétriques. Ils exploitent des mécanismes d’attribution de crédit basés sur l’activité pour réaliser un apprentissage rapide, induit par les entrées, de manière non paramétrique. En IA, les grands modèles de fondation pré-entraînés sur des objectifs prédictifs simples montrent une expressivité remarquable dans l’apprentissage en contexte, en utilisant uniquement les activations évoquées par les entrées. Je présenterai des résultats démêlant les rôles de l’apprentissage paramétrique et non paramétrique. J’explorerai l’expressivité des réseaux neuronaux qui apprennent uniquement à partir des entrées et j’examinerai l’impact des objectifs de méta-formation paramétrique sur cette expressivité. Cette recherche vise à fournir des outils pour mieux comprendre l’apprentissage induit par les entrées dans le cerveau et l’apprentissage en contexte dans les grands systèmes d’IA pré-entraînés.

 

BIOGRAPHIE

Guillaume LAJOIE est professeur associé à l’Université de Montréal et chercheur au Mila (Institut québécois d’intelligence artificielle). Ses travaux se situent à l’intersection des neurosciences et de l’apprentissage automatique, en particulier sur la compréhension des dynamiques neuronales et comment les modèles inspirés du cerveau peuvent améliorer les systèmes d’IA.

RÉFÉRENCES

Ezekiel Williams, Avery Hee-Woon Ryoo, Thomas Jiralerspong, Alexandre Payeur, Matthew G. Perich, Luca Mazzucato, Guillaume Lajoie (2024) Expressivity of Neural Networks with Random Weights and Learned Biases.  arXiv preprint arXiv:2407.00957.

Séminaire DIC-ISC-CRIA - 23 octobre 2024 par Emily BENDER

TITRE: Sense-making with artificial interlocutors and risks of language technology

RÉSUMÉ

Les humains donnent du sens au langage en contexte, en s’appuyant sur leur propre compréhension du monde, y compris leur propre modèle de la compréhension du monde de leur interlocuteur. Dans cette présentation, j’examinerai divers risques potentiels qui surviennent lorsque les humains appliquent cette capacité de construction de sens aux interactions avec les interlocuteurs artificiels. Que se passe-t-il dans les conversations où un des interlocuteurs n’a pas accès (ou a un accès extrêmement limité) au sens, et toute la tache interprétative repose sur l’autre interlocuteur ? J’explorerai brièvement les implications que cela peut avoir pour la conception des technologies linguistiques.

BIOGRAPHIE

Emily M. BENDER est professeure de linguistique et professeure associée à l’École d’informatique et à l’École d’information de l’Université de Washington. Ses recherches portent sur l’ingénierie grammaticale multilingue, la sémantique computationnelle et les impacts sociétaux des technologies linguistiques. En 2022, elle a été élue Fellow de l’Association américaine pour l’avancement des sciences (AAAS).

RÉFÉRENCES

Bender, E. M. (2024). Resisting Dehumanization in the Age of “AI”Current Directions in Psychological Science, 33(2), 114-120.

Bender, E. M., Gebru, T., McMillan-Major, A., & Shmitchell, S. (2021). On the dangers of stochastic parrots: Can language models be too big?🦜. In Proceedings of the 2021 ACM conference on fairness, accountability, and transparency (pp. 610-623).

Bender, E. M., & Koller, A. (2020). Climbing towards NLU: On meaning, form, and understanding in the age of data. In Proceedings of the 58th annual meeting of the association for computational linguistics (pp. 5185-5198).

Lien vidéo

Séminaire DIC-ISC-CRIA - 31 octobre 2024 par Tommaso TOSATO

Tommaso TOSATO - 31 octobre 2024 à 10h30 au local PK-5115

TITRE : Algorithmic Gap Between LMs and the Brain

RÉSUMÉ :

Les récents progrès des grands modèles linguistiques (LLM) ont amélioré leurs performances, mais ils diffèrent de la cognition humaine. Les comparaisons actuelles se concentrent souvent sur le comportement d’entrée-sortie ou les représentations intermédiaires, sans examiner les processus internes. Des concepts inspirés des neurosciences, comme la connectivité clairsemée et l’apprentissage incarné, pourraient rendre les LLM plus biologiquement plausibles. Les évaluations psychométriques montrent une grande variabilité des réponses, remettant en question la stabilité de la « personnalité » des LLM. Nous analyserons aussi comment la taille du modèle influence cette variabilité et la stabilité des traits de personnalité.

                        Abstract: Large language models (LLMs) produce impressive performance on linguistic tasks but diverges from human cognition in how they do it. Comparisons of LLMs and the brain often focus only on input-output behavior or intermediate representations. Beyond surface-level behavior are the internal processes driving transformations between these representations. Neuroscience-inspired features like sparse connectivity, modularity, internal states, and embodied and interactive learning lead to biologically more plausible language models. Human psychometric assessment of LLMs reveals substantial variability in LLM responses because of question order shuffling or paraphrasing. This challenges the notion of a stable LLM "personality". Personality trait scores are influenced by different persona prompts. We will describe the relationship between model size and personality trait stability.

BIOGRAPHIE :

Tommaso TOSATO est chercheur postdoctoral à l’Université de Montréal, au sein du Laboratoire de psychiatrie de précision et de physiologie sociale. Ses recherches portent sur l’intersection des neurosciences, de l’intelligence artificielle et de la modélisation computationnelle. Il a co-rédigé des études sur la relation algorithmique entre les modèles de langage et le fonctionnement cérébral.

RÉFÉRENCES:

Tosato, Tommaso, et al. (2024) "Lost in Translation: The Algorithmic Gap Between LMs and the Brain." arXiv preprint arXiv:2407.04680 (2024).

Séminaire DIC-ISC-CRIA - 24 octobre 2024 par Guy LAPALME

Guy LAPALME - 24 octobre 2024 à 10h30 au local PK-5115

TITRE : Génération bilingue de textes à partir de données

RÉSUMÉ :

Après avoir rappelé ce qu'est la génération de texte, nous présenterons une méthode pour créer un texte en anglais et un autre en français à partir d'une unique source de données.  Les étapes cruciales telles que la sélection des informations pertinentes et l'organisation du texte sont effectuées conjointement, tandis que le choix des termes et la structuration des phrases varient selon la langue. Les deux textes transmettront donc le même message. Cette approche s'appuie sur pyrealb, un réalisateur de phrases bilingue anglais-français. Son utilisation sera illustrée par quelques applications, p.ex. bulletins météo ou descriptions de matches sportifs. Nous terminerons en comparant ces résultats avec ceux obtenus avec un "grand modèle de langue"

BIOGRAPHIE :

Guy LAPALME est professeur à l’Université de Montréal, spécialisé en traitement automatique du langage naturel (TALN). Ses recherches portent sur la génération de texte, la traduction automatique et l’interaction homme-machine dans les technologies linguistiques. Il a contribué au développement de systèmes de TALN et est reconnu pour son travail sur les outils facilitant la communication entre humains et ordinateurs.

RÉFÉRENCES:

Lapalme, G. (2023). Data-to-Text Bilingual GenerationarXiv preprint arXiv:2311.14808.


Lapalme, G. (2020). The jsRealB Text Realizer: Organization and Use Cases--Revised versionarXiv preprint arXiv:2012.15425.

Séminaire DIC-ISC-CRIA – 17 octobre 2024 par Olaf SPORNS

Olaf SPORNS - 17 octobre 2024 à 10h30 au local PK-5115

TITRE: Le Connectome et l'IA [The Connectome and AI]

RÉSUMÉ:

Une nouvelle perspective domine en neurosciences : les cerveaux sont des réseaux complexes, et la structure de leur connectivité (le connectome) est cruciale pour leur fonctionnement. Comprendre l’organisation des graphes cérébraux (réseaux), leur architecture multi-échelle et leurs communautés, ainsi que la topologie temporellement variable de la connectivité fonctionnelle, est devenu un objectif de recherche clé en connectomique et en neurosciences des réseaux. Dans cette présentation, je passerai en revue quelques thèmes actuels et les orientations futures. Ceux-ci incluent la connectomique comparative entre les espèces, les relations structure/fonction révélées par les données de neuroimagerie, l’utilisation croissante de modèles computationnels pour cartographier les flux d’information et les dynamiques de communication, ainsi qu’une nouvelle approche centrée sur les arêtes pour suivre la connectivité fonctionnelle dynamique. Je relierai ces découvertes aux défis auxquels fait face l’IA moderne et j’identifierai certains enjeux clés autour de trois dimensions principals : les réseaux, les dynamiques et l’information.

          Summary: A new perspective has taken hold in neuroscience – brains are complex networks, and the structure of their connectivity (the connectome) is critical for how they function. Understanding the organization of brain graphs (networks), their multiscale architecture and communities, as well as the time-varying topology of functional connectivity have become key research objectives in connectomics and network neuroscience. In this presentation I will review a few current themes and future directions. These include comparative connectomics across species, structure/function relationships as disclosed in neuroimaging data, the growing use of computational models to map information flow and communication dynamics, and a novel edge-centric approach to track dynamic functional connectivity. I will connect to challenges facing modern AI and identify some key issues along three main dimensions: networks, dynamics, and information.

BIOGRAPHIE:

Olaf SPORNS est professeur distingué à l’Université de l’Indiana, connu pour ses travaux en neurosciences, en particulier dans le domaine de la connectomique—l’étude de la connectivité cérébrale. Il a contribué de manière significative à la cartographie du connectome cérébral, en soulignant son rôle dans la cognition et le comportement. Sporns est l’auteur de Networks of the Brain et cofondateur du Human Connectome Project.

           Olaf Sporns: Distinguished Professor at Indiana University, known for his work in neuroscience, particularly in connectomics—the study of brain connectivity. He has contributed significantly to mapping the brain’s connectome, emphasizing its role in cognition and behavior. Sporns authored Networks of the Brain and co-founded the Human Connectome Project.

RÉFÉRENCES:

Sporns, O. (2022). The complex brain: connectivity, dynamics, information. Trends in Cognitive Sciences, 26(12), 1066-1067.

Faskowitz, J., Betzel, R. F., & Sporns, O. (2022). Edges in brain networks: Contributions to models of structure and function. Network Neuroscience, 6(1), 1-28.

Séminaire DIC-ISC-CRIA - 10 octobre 2024 par Gulnara SHAYDULLINA

Gulnara SHAYDULLINA - 10 octobre 2024 à 10h30 au local PK-5115 (Le séminaire sera en anglais)

TITRE :   Plateforme d'apprentissage collaboratif avec les chatbots-étudiants

              [Collaborative learning platform with student-chatbots]

RÉSUMÉ

Malgré les avancées majeures réalisées dans le domaine des chatbots et des assistants virtuels, l’utilisation des chatbots dans l’éducation reste encore peu répandue. Dans mon exposé, basé sur ma thèse, je me pencherai sur le potentiel sous-exploité de la technologie des chatbots dans l’éducation : quels sont les avantages et les limites des chatbots éducatifs ? Quelles approches pédagogiques mettent en valeur leurs capacités et aident à surmonter leurs lacunes ? Quels sont les meilleurs scénarios pour leur intégration dans une plateforme éducative numérique ? Pour répondre à ces questions, je présenterai un prototype de plateforme d’apprentissage participatif avec des chatbots intégrés entre pairs qui a le potentiel de contribuer à un processus éducatif plus réussi.           

                          Summary: Despite major breakthroughs in chatbot and virtual assistant technology, the use of chatbots   in education is still insubstantial. In my talk, based on my thesis, I will delve into chatbot technology’s under-explored potential in education: What are educational chatbots’ advantages and limitations? What pedagogical approaches emphasize their capabilities and help overcome their shortcomings? What are the best scenarios for their integration into a digital educational platform? To explore answers to these questions, I will present a prototype of a crowd-learning platform with integrated peer-chatbots that has a potential to contribute to a more successful educational process.

BIOGRAPHIE

Gulnara SHAYDULLINA vient de soutenir sa thèse de doctorat au Département d’informatique cognitive de l’UQAM. Elle est diplômée de l’Université d’État de Bachkirie (aujourd’hui l’Université des sciences et technologies d’Oufa) avec des diplômes d’études supérieures en traduction, en enseignement de l’anglais langue seconde et en philologie et de l’Université McGill avec un diplôme d’études supérieures en traduction. Elle a obtenu sa maîtrise à l’UdeM, où sa thèse était une étude de cas sur le crowdsourcing en traduction. Ses intérêts actuels comprennent les méthodes d’enseignement innovantes, l’apprentissage collaboratif avec les chatbots et les nouvelles technologies en éducation.           

                          Gulnara SHAYDULLINA has recently defended her PhD thesis at the Department of Cognitive Informatics at UQAM. She graduated from Bashkir State University (nowadays Ufa University of Science and Technology) with Graduate Diplomas in Translation, ESL Teaching, and Philology and from McGill University with a Graduate Diploma in Translation. She obtained her Master’s degree at UdeM, where her thesis was a case study of crowdsourcing in translation. Her current interests include innovative methods of teaching, collaborative learning with chatbots, and new technologies in education.

RÉFÉRENCES

Kuhail, M. A., Alturki, N., Alramlawi, S., & Alhejori, K. (2023). Interacting with educational chatbots: A systematic review. Education and Information Technologies, 28(1), 973-1018 

Suivez-nous