CArdinality Constraints Based Extreme Multi-Label Classification

Le projet CACEM a pour but de prendre en compte les corrélations entre labels dans le cadre de l’apprentissage multi-label extrême. L’objectif est d’exploiter des contraintes plus génériques dans le processus d’apprentissage. Les méthodes d’apprentissage classiques se restreignent généralement à quelques contraintes simples de type must-link et cannot-link. Notre but est de prendre en compte des contraintes d’inclusion ou d’exclusion génériques (par exemple, l’instance x ne peut être que dans maximum deux labels parmi n > 2). Ces contraintes exprimées sous forme de contraintes de cardinalité permettent d’apprendre de manière itérative un espace de représentation des données afin de favoriser leur satisfaction par les algorithmes de classification. Les nouvelles contraintes doivent être correctement intégrées dans le processus de classification pour améliorer ses performances. Le but est donc d’obtenir une bonne qualité prédictive pour des problèmes de classification multi-label extrême. L’autre objectif du projet est d’exploiter la corrélation locale/globale entre labels pour accélérer le processus d’apprentissage multi-labels extrême. L’idée consiste à construire un graphe de corrélation qui sera exploité comme une information à priori pour l’entraînement du modèle. En particulier, nous envisageons de reformuler cette tâche sous forme d’un problème de détection de communautés dans les graphes pour extraire les différentes corrélations entre les labels.


Responsable scientifique pour le CRIL :
Participants :
Durée :
2021