À propos
La Chaire de recherche du Canada en exploration de données multimodales s’engage à établir un nouveau cadre mathématique novateur, jetant les bases robustes pour des applications aux répercussions sociales potentiellement majeures.
Les données sont générées et collectées à un rythme sans précédent grâce au déploiement généralisé de réseaux hétérogènes. Ces données, également appelées « données massives », présentent des propriétés telles que le volume, la variété, la vitesse et la véracité.
Ces ensembles de données massives, qui comprennent des données structurées, semi-structurées et non structurées, sont également multimodaux. Chaque modalité de source, de type et de distribution contient des informations spécifiques à la modalité. Cela crée des défis majeurs pour le traitement et l’analyse de ces données afin d’extraire des informations pertinentes pour l’analyse prédictive.
L’exploration de données multimodales implique l’analyse de plusieurs types de données hétérogènes simultanément, dans le but de révéler des connaissances insoupçonnées pour une meilleure prise de décision. Cette avancée technologique prometteuse s’étend à une multitude de domaines : psychologie, éducation, soins de santé et bien d’autres encore.
Le professeur Belkacem Chikhaoui, accompagné de son équipe de recherche, se consacre au traitement des données multimodales massives. Les réalisations qui en ressortent peuvent s’appliquer ensuite dans la prévision de comportements violents, la projection des taux d’abandon scolaire et la détection précoce de l’incontinence urinaire chez les personnes résidant en établissements de soins de longue durée.
La Chaire de recherche du Canada en exploration des données multimodales se décline en trois axes de recherche.
Axe 1 : Fusion des données multimodales hétérogènes
Axe 2 : Découverte des connaissances et relations causales à partir des données multimodales
Axe 3 : Applications importantes à fort impact social
- 15,14 milliards d’appareils Il y a environ 15,14 milliards d'appareils IoT en 2023 et il y en aura plus de 41,6 milliards en 2025, capables de générer 79,4 zettaoctets (Zo) de données multimodales, selon l'International Data Corporation (IDC).
- 99 000 recherches par secondes Selon Oberlo, Google traite plus de 99 000 recherches par seconde et plus de 8,5 milliards par jour.
- 100 milliards de dollars Selon Statista, l'analytique des données massives devrait atteindre une valeur de 100 milliards de dollars d'ici 2027 et plus de 353,9 milliards de dollars en 2030 (GlobeNewswire).
Le titulaire
Belkacem Chikhaoui, Ph. D., Université TÉLUQ
Belkacem Chikhaoui détient un doctorat en informatique de l’Université de Sherbrooke et a été membre des laboratoires en domotique et en informatique mobile (DOMUS) et en prospection des données (ProspectUS) de cette université. Par la suite, il se joint au laboratoire Intelligent Assistive Technology and Systems Lab (IATSL) de l’Université de Toronto en tant que chercheur postdoctoral. Avant de rejoindre l’Université TÉLUQ, Belkacem Chikhaoui a travaillé comme chercheur en science des données au Centre de recherche informatique de Montréal (CRIM). Il est actuellement professeur au Département Science et Technologie de l’Univeristé TÉLUQ et chercheur au sein du groupe de recherche de l’Institut d’intelligence artificielle appliquée. Il est également professeur associé au Département d’informatique de l’Université de Sherbrooke.
Ses intérêts de recherche portent sur l’intelligence artificielle, le forage de données, l’apprentissage automatique, les systèmes de recommandation, l’analyse des réseaux sociaux, l’Internet des objets et l’informatique médicale.
Axes de recherche
Axe 1 : Fusion des données multimodales hétérogènes
Dans cet axe de recherche, nous allons développer de nouvelles approches de fusion de données multimodales massives. Nous allons explorer des approches d'apprentissage multitâches et d'apprentissage profond pour la sélection de caractéristiques à partir de différentes modalités, l'extraction des connaissances sémantiques qui ajoutent de la valeur et de l'interprétabilité au modèle, et l'identification des relations intermodales. Les connaissances sémantiques permettent d'extraire des graphes de connaissances à partir de données non structurées et de transférer des connaissances entre différents domaines, ce qui permet de mieux comprendre et d'interpréter des relations complexes entre les données multimodales. Il s'agit d'un sujet important qui est moins exploré dans l'analyse des données multimodales.
Axe 2 : Découverte des connaissances et relations causales à partir des données multimodales
Dans cet axe de recherche, nous allons créer de nouveaux algorithmes de découverte de la causalité qui combinent et intègrent des modèles d'apprentissage profond et des théories de la causalité dans le même processus. De cette manière, nous tirerons parti des modèles d'apprentissage profond pour extraire automatiquement des caractéristiques significatives de manière non supervisée et intégrer les théories de la causalité dans une nouvelle approche unifiée. Le potentiel d'une telle approche intégrée est la capacité 1) de comprendre et d'interpréter les résultats produits par les modèles d'apprentissage par l'analyse de la causalité, et 2) d'améliorer la précision de la prédiction en utilisant des modèles de causalité comme caractéristiques discriminantes.
Axe 3 : Applications importantes à fort impact social
Dans cet axe de recherche, nous allons mettre en pratique les approches et les algorithmes développés dans le cadre de cette chaire de recherche. Ce programme de recherche débouchera sur des applications concrètes dans plusieurs domaines tels que les soins de santé (développement d'un système de détection de l'incontinence urinaire), l'éducation (développement d'un système de prédiction de l'abandon des étudiantes et étudiants dans l'apprentissage en ligne) et les ressources humaines (développement d'une nouvelle plateforme intelligente pour la gestion des compétences, l'acquisition de talents et les recommandations d'apprentissage). Ces trois exemples d'applications, chacune liée à un ou plusieurs des objectifs décrits ci-dessus, seront ciblés en priorité.
Données multimodales?
Réseaux sociaux
Les réseaux sociaux comme Facebook, Twitter, Instagram et LinkedIn génèrent une importante quantité de données multimodales incluant du texte, des images et des vidéos.
Internet des objets
Les objets connectés représentent une source importante des données multimodales, à savoir les montres intelligentes, les accéléromètres, les gyroscopes, les caméras de vidéosurveillance, etc.
Santé
Le domaine de la santé est caractérisé par des quantités abondantes de données multimodales incluant des données textuelles, à savoir des prescriptions et des diagnostics, des images de scan, à savoir des images IRM, et des données liées aux dossiers électroniques de patients et patientes.
Réseaux
Le professeur Chikhaoui travaille en étroite collaboration avec plusieurs centres de recherche et universités canadiennes, à savoir le centre de recherche de l’Institut universitaire de gériatrie de Montréal de l’Université de Montréal, le laboratoire Prospectus de l’Université de Sherbrooke et le laboratoire Intelligent Assistive Technology and Systems Laboratory de l’Université de Toronto.
L’Université TÉLUQ
Créée en 1972 pour rendre le savoir accessible, la TÉLUQ est la seule université francophone en Amérique du Nord à offrir tous ses programmes à distance. Chaque année, près de 20 000 personnes choisissent la flexibilité de l’Université TÉLUQ pour y faire leurs études universitaires, du premier au troisième cycle.