Webinaire 13 | Traitement automatique du langage naturel et langues autochtones : enjeux et défis
Conférenciers
Tan Ngoc Le, membre chercheur associé du Centre de Recherche en Intelligence Artificielle (UQÀM)
Tan Ngoc Le est présentement membre chercheur associé du Centre de Recherche en Intelligence Artificielle – UQÀM (CRIA). Il a obtenu un doctorat en informatique cognitive à l'UQÀM en 2019. Son domaine de recherche est lié au traitement automatique des langues naturelles (TALN), notamment la reconnaissance des entités nommées bilingues, la translittération des entités nommées bilingues, les relations linguistiques entre les langues français, anglais et vietnamien. Il s'intéresse aux techniques d'intelligence artificielle pour l'extraction d'information, l'analyse de textes, l'apprentissage machine et la traduction automatique.
Sous la supervision de:
Fatiha Sadat, professeure au département d'informatique de l'UQÀM
Fatiha Sadat a été chercheuse au Conseil national de recherches du Canada de 2004 à 2006. Elle a reçu son doctorat et sa maîtrise au Nara Institute of Science and Technology (NAIST) à Nara au Japon. Sa recherche est soutenue par plusieurs subventions de CRSNG, FRQNT, MITACS et QNRF. Ses intérêts de recherche inclus l'intelligence artificielle, le traitement automatique du langage naturel, l’apprentissage machine et les humanités numériques. Présentement, elle s’intéresse particulièrement à la recherche interdisciplinaire et à l’inclusion des langues et enjeux autochtones dans le développement de solutions en intelligence numérique, plus particulièrement en intelligence artificielle et en humanités numériques.
Format : Webinaire (plateforme Zoom) de 30 à 45 minutes suivi d'une période de questions d'une quinzaine de minutes. La présentation sera en français.
Résumé de la présentation : Les données sont devenues le carburant principal des algorithmes d’apprentissage automatique, notamment les réseaux de neurones artificiels profonds, dont les prouesses font les manchettes depuis plusieurs années. Cependant, plusieurs domaines, dont ceux liés aux langues et aux enjeux autochtones, ont souvent peu ou pas de données ou d’exemples probants pour un entraînement efficace et ainsi une conception de logiciels efficaces et performants qui aideraient à faire avancer la recherche interdisciplinaire.
Cette présentation fait un survol du problème des domaines et langues pauvres en données d’apprentissage ou pas suffisamment représentatifs, pour la conception de logiciels d'intelligence artificielle, appliquée aux langues autochtones du Canada, tels un traducteur automatique, un système tutoriel intelligent ou un agent conversationnel. Ainsi, un projet intégrateur et riche en recherche interdisciplinaire et intersectorielle, en formation et en transfert de connaissances vers les communautés des Premières Nations du Canada, est présenté.