• Financement : Artois
  • Année de début de thèse :
  • 2021

La fouille de données englobe de nombreuses techniques dont le but est l’extraction de connaissances pertinentes possédant des formes multiples, et cela à partir de grands volumes de données. Ces techniques ont un champ d’application très large de par leur utilité dans l’analyse de données, surtout à une époque où nous assistons à une évolution importante des capacités liées à la collecte d’informations. En effet, l’émergence continuelle de nouvelles applications et de nouveaux services, comme les développements remarquables des techniques utilisées, font de la fouille de données un domaine central en informatique.

Le raisonnement qualitatif est un domaine de l’intelligence artificielle (IA) ayant différents champs d’applications comme, entre autres, la planification et les systèmes d’information géographiques. L’objet principal de ce sujet de thèse est l’intégration du raisonnement qualitatif pour le temps et l’espace [6,7] au sein d’approches de fouille de données. Cette intégration est notamment envisagée dans l’optique de simplifier la compréhension des connaissances issues de données complexes, particulièrement en raison de la proximité du raisonnement qualitatif avec celui humain en lien avec divers types d’entités. En cela, ce sujet s’intègre parfaitement dans le cadre du projet du CRIL qui est centré sur la construction de systèmes d’intelligence artificielle explicables. En effet, les méthodes d’extraction de connaissances visées dans ce sujet peuvent intervenir à différents niveaux dans l’analyse de comportements de systèmes d’IA afin de produire des explications pouvant être aisément appréhendées.

Plus concrètement, il s’agit dans ce sujet de thèse, d’une part, de définir des modèles de représentation de données suffisamment expressifs et, d’autre part, de développer des algorithmes d’extraction de connaissances efficaces. Les langages des modèles proposés pourront être construits à partir de contraintes issues de formalismes qualitatifs pour le temps et l’espace existants [6] ou à définir au cours de cette thèse. Des langages hybrides associant des aspects numériques et qualitatifs pourront être également considérés et étudiés. Les modèles et les algorithmes proposés devront prendre en compte à la fois la dimension temporelle et la dimension spatiale des sources de données considérées. Ils devront être suffisamment expressifs et génériques afin de pouvoir traiter des données spatio-temporelles dans un large contexte applicatif. Il sera également question dans ce contexte du développement de mesures sophistiquées afin de représenter la qualité des connaissances extraites [1,4]. Les applications visées concernent des entités dont la composante spatiale évolue au cours du temps pour lesquelles l’analyse des trajectoires est nécessaire. À titre d’illustration, elles peuvent par exemple concerner l’évolution de terres cultivables dans le domaine de l’agriculture ou bien encore, dans un tout autre domaine, l’analyse des comportements de joueurs dans un contexte sportif. Il convient de noter que des résultats préliminaires afférents à l’intégration du raisonnement qualitatif en fouille de données ont été obtenus par un membre de l’équipe d’encadrement dans [3].

[1] Jean-François Condotta, Badran Raddaoui, Yakoub Salhi : Quantifying Conflicts for Spatial and Temporal Information. KR 2016 : 443-452.

[2] Yoann Pitarch, Dino Ienco, Elodie Vintrou, Agnès Bégué, Anne Laurent, Pascal Poncelet, Michel Sala, Maguelonne Teisseire : Spatio-temporal data classification through multidimensional sequential patterns : Ap- plication to crop mapping in complex landscape. Eng. Appl. Artif. Intell. 37 : 91-102 (2015).

[3] Yakoub Salhi : Qualitative Reasoning and Data Mining. The 26th International Symposium on Temporal Representation and Reasoning, TIME 2019. 9 :1-9 :15.

[4] Yakoub Salhi : Inconsistency Measurement for Improving Logical Formula Clustering. IJCAI 2020 : 1891- 1897.

[5] Michael Sioutis, Anastasia Paparrizou, Jean-François Condotta : Collective singleton-based consistency for qualitative constraint networks : Theory and practice. Theor. Comput. Sci. 797 : 17-41 (2019).

[6] Frank Dylla, Jae Hee Lee, Till Mossakowski, Thomas Schneider, André van Delden, Jasper van de Ven, Diedrich Wolter : A Survey of Qualitative Spatial and Temporal Calculi : Algebraic and Computational Proper- ties. ACM Comput. Surv. 50(1) : 7 :1-7 :39 (2017).

[7] Gérard Ligozat : Qualitative Spatial and Temporal Reasoning. ISTE/Wiley, ISBN 978-1-84821-252-7, 2011.