Les systèmes d’information des entreprises actuelles sont de plus en plus " submergés " par des données distribuées, connectées et de tous types (structurées, semi-structurées et non structurées). Cette croissance et « Big Data », ont transformé́ tous les aspects de l’entreprise et de la société́ actuelle, et ont créé de nouveaux défis pour les entreprises et pour la communauté scientifique, parmi lesquels comment comprendre et analyser de telles masses de données afin d’en extraire des connaissances sémantiquement riches.

L’extraction de connaissances consiste à donner un sens aux grandes quantités de données, d’un certain domaine, capturées et stockées massivement par les entreprises d’aujourd’hui. En effet, la vraie valeur n’est pas dans l’acquisition et le stockage des données, mais plutôt dans notre capacité d’en extraire des rapports utiles et de trouver des tendances et des corrélations intéressantes pour appuyer les décisions faites par les décideurs d’entreprises et par les scientifiques. Cette extraction fait appel à une panoplie de techniques, méthodes, algorithmes et outils d’origines statistiques, intelligence artificielle, bases de données, etc. Certes, une application aveugle de ces méthodes sur les données en main peut mener à la découverte de connaissances incompréhensibles voire même inutiles pour l’utilisateur final. C’est dans ce contexte que nos travaux de recherche se concentrent sur (i) l’ intégration et l’ interopérabilité des données distribuées, connectées et fortement hétérogènes afin de mieux extraire et modéliser les données pertinentes et (ii) la représentation et l’exploration des données pertinentes par l’exploitation des relations entre ces dernières et les connaissances en se basant sur la connaissance du domaine afin de mieux représenter des connaissances compréhensibles

par l’utilisateur final et mieux explorer les connaissances générées.