• Financement : Artois
  • Année de début de thèse :
  • 2023

Description

Le sujet proposé s’inscrit dans la mouvance actuelle de l’IA hybride, où l’on s’efforce de développer des systèmes d’IA s’appuyant à la fois sur des données et des connaissances. Dans cette thèse, les tâches principales des systèmes considérés sont le classement (prédire l’appartenance d’une instance à une classe, prise parmi un ensemble de classes prédéfinies) et l’explication du classement réalisé. Il s’agit d’extraire des connaissances à partir de données pour compléter les connaissances disponibles et d’exploiter ces connaissances pour tenter de mieux classer / prédire mais aussi de mieux expliquer les classements / prédictions réalisé(e)s. Plusieurs approches à base de connaissances peuvent être considérées pour mieux prédire. Par exemple, quand les connaissances traduisent des liens logiques entre ensembles d’attributs, on peut tenter de les exploiter pour nettoyer les données avant d’apprendre un prédicteur (en supprimant les instances qui sont en conflit ou en les corrigeant quand c’est possible), de façon à améliorer la précision du prédicteur. Quand les connaissances extraites sont des dépendances fonctionnelles entre attributs, on peut supprimer les attributs dépendants avant d’apprendre. Quand les connaissances extraites sont des règles de classement jugées fiables et que le prédicteur utilisé est à base d’arbres de décision, on peut rectifier ce prédicteur pour qu’il devienne conforme aux règles. Selon les approches, le prédicteur initial va être transformé via un nouvel apprentissage ou alors par la mise en œuvre d’une méthode relevant plutôt du changement de croyances, sans induction supplémentaire.

Un des objectifs visés par cette thèse est de comparer les approches et de déterminer dans quelle situation il est intéressant d’utiliser une approche plutôt qu’une autre pour améliorer la précision du prédicteur obtenu.

Un autre volet de la thèse portera sur l’exploitation des connaissances pour mieux expliquer les classements réalisés. Les connaissances extraites peuvent, en effet, être utilisées pour simplifier les explications abductives des classements réalisés (celles qui expliquent pourquoi l’instance considérée a été associée à une certaine classe par le prédicteur) mais aussi pour éviter de considérer des contre-exemples impossibles lors du calcul d’explications contrastives (celles qui expliquent pourquoi l’instance considérée n’a pas été associée à une autre classe que la sienne par le prédicteur).