Thèse
Découverte de motifs n-aires utilisant la programmation par contraintes.
Résumé
La fouille de données et la Programmation Par Contraintes (PPC) sont
deux domaines de l'informatique qui ont eu, jusqu'à très récemment, des
destins séparés. Cette thèse est l'une des toutes premières à
s'intéresser aux liens entre la fouille de données et la PPC, et
notamment aux apports de cette dernière à l'extraction de motifs sous
contraintes.
Différentes méthodes génériques pour la découverte de motifs locaux ont
été proposées. Mais, ces méthodes ne prennent pas en considération le
fait que l'intérêt d'un motif dépend souvent d'autres motifs. Un tel
motif est appelé motif n-aire. Très peu de travaux concernant
l'extraction de motifs n-aires ont été menés et les méthodes
développées sont toutes ad hoc. Cette thèse propose un cadre unifié
pour modéliser et résoudre les contraintes n-aires en fouille de
données.
Tout d'abord, l'extraction de motifs n-aires est modélisée sous forme
de problème de satisfaction de contraintes (CSP). Puis, un langage de
requêtes à base de contraintes de haut niveau est proposé. Ce langage
permet d'exprimer une large panoplie de contraintes n-aires. Plusieurs
méthodes de résolution sont développées et comparées.
Les apports principaux de ce cadre sont sa déclarativité et sa
généricité. Il s'agit du premier cadre générique et flexible permettant
la modélisation et la résolution de contraintes n-aires en fouille de
données.