Groupes de travail pluridisciplinaires

La liste des sous-groupes de travail est susceptible d'évoluer au cours du projet:

 

GT1 - Qualité des données migratoires, réparation et normalisation

Participants: Lakhdar Sais, Said Jabbour, Abdelhamid Boudane (CRIL - CNRS), Salima Benbernou, Mourad Ouziri (LIPADE, Paris Descartes), Nelly Robin (SHS/CEPED-MIGRINTER), Cyril Roussel (MIGRINTER), Allel Hadj Ali, Brice Chardin, Stéphane Jean, Mickael Baron (LIAS)

Les données mobilisées dans le cadre du projet QDoSSI sont hétérogènes et n'ont jamais été traitées comme éléments de la même matrice : bases de données structurées, documents textuels (récits de vies, biographies migratoires), documents (corpus juridiques). Avec des temporalités et des représentativités variables, elles renseignent sur des phénomènes migratoires observés sur des espaces géographiques différents. Enfin, elles présentent diverses imperfections, comme la présence de données manquantes, de données mal orthographiées ou encore de données entachées d’incertitudes et d'imprécisions. Ceci pose le problème de la mesure, de l’intégration et de l’évaluation de l’impact de la qualité des données sur les résultats d’analyses dans un contexte spatio-temporel évolutif.

L’objectif de ce groupe de travail est de quantifier plus précisément la qualité des différentes bases de données cibles. Les techniques mises en œuvre doivent prendre en considération cette dimension depuis l’étape de prétraitement jusqu'à l’interprétation et la validation des résultats. Ceci passe par la définition de mesures de la qualité des données avant et après prétraitement, mais aussi des résultats en donnant des indicateurs de qualité/erreurs. Le challenge est d’y associer un modèle interactif et cyclique (prétraitement, analyse, et validation). Ces indicateurs conjugués aux attributs impliqués dans chaque traitement envisagé seront exploités pour mieux cibler les réparations. Nous envisageons de développer un modèle à base de contraintes où les incohérences représentent les violations du modèle.

Stage Master 2 - 2017-2018 : Analyse et évaluation de la qualité des données migratoires

Données : l'ensemble des bases de données mobilisées dans le cadre de QDoSSI

Encadrants:  Lakhdar Sais, Said Jabour (CRIL), Salima Benbernou, Mourad Ouziri (LIPADE), Nelly Robin, Cyril Roussel (Migrinter)

Description du stage : (ici)

GT2 - Analyse et fouille de textes pour l'extraction de parcours migratoires

Participants: Nelly Robin (SHS/CEPED-MIGRINTER), Cyril Roussel, Lucile Bacon (SHS/MIGRINTER),Lakhdar Sais, Fabien Delorme (CRIL), Pierre-Yves Louis,Slaoui Yousri Abir El Haj(LMA - CNRS)

Ce sous-groupe de travail rentre dans le cadre d'un axe majeur du projet à savoir l'extraction de parcours migratoires à partir des données dont l'objet est d’extraire des connaissances complexes à partir de données hétérogènes et imparfaites. L'objectif du GT1 est d’extraire une cartographie enrichie sémantiquement (un graphe attribué) de l’ensemble des parcours des migrants a partir de données textuelles (récits de vies, corpus juridiques et jurisprudences) en mobilisant des approches à base de fouille de texte. Ce graphe attribué sera obtenu par agrégation de graphes correspondant à des parcours individuels extraits par des techniques de fouille de textes sur les données complexes mobilisées. Le GT Fouille de texte a pour but d'extraire des informations spatio-temporelles et thématiques à partir des données, la construction des graphes dynamiques attribués associés et leurs visualisation interactive.

Les parcours migratoires extraits et modélisés sous forme de graphes attribués feront ultérieurement l'objet d'autres traitements et analyses dans le cadre du projet.

Données : récits migratoires d'Afrique de l'ouest et subsaharienne et autres données mobilisables : Kurdistan Irakien et Blakans, ...

Thèse - Lucie Bacon :La ou les routes des Balkans ? Parcours et représentations des personnes en situation de migration ", Ecole doctorale " Société et organisation ", Université de Poitiers

 

GT3 - Extraction de connaissances à partir des données migratoires

Participants: Brice Chardin, Allel Hadjali, Stéphane Jean, Micakel Baron (LIAS), Nelly Robin (SHS/CEPED-MIGRINTER), Cyril Roussel, Lucie Bacon (MIGRINTER), Lakhdar Sais, Said Jabbour, Karim Tabia, Yakoub Salhi et Abdelhamid Boudane (CRIL)

Les données issues des sciences sociales posent un réel défi en termes de connaissances à extraire (profils communs, nouveaux types de relations et de motifs). Cela suppose de trouver de nouvelles formulations de ces connaissances en terme de motifs, de nouveaux prédicats et de règles dépendances pour juger de leurs intérêts et de nouvelles techniques d’inférence ou d’extraction. Ceci induit de nouveaux problèmes sur le plan de la représentation, du calcul et de la complexité algorithmique.

En plaçant l’analyste ou le chercheur en sciences humaines et sociales au cœur de l'exploration, l’objectif général de ce GT est de co-construire le processus de découverte de connaissances nouvelles pour aider le chercheur ou l’expert à valider ses hypothèses de travail, et à mieux s’orienter dans la conduite de ses investigations de terrain. Au-delà de la mobilisation des techniques classiques de fouille de données pour découvrir des motifs/dépendances, de clustering ou de classification, ce GT portera également son analyse sur la fouille de graphes attribués (objet du GT1), l’extraction ou l’identification de réseaux de traites et leurs implication dans la structuration des parcours migratoires.

D’autres part la complexité des usages et des connaissances que nous souhaitons inférer pose la question de la définition de nouveaux modèles de représentation des données, capables d’offrir plus de flexibilité pour la mise en oeuvre d’outils de raisonnement et d’inférence efficace. Récemment, on a vu l’émergence d’approches déclaratives issues de l’IA, capable de modéliser et de résoudre de nombreux problèmes de fouille de données via la logique et la programmation par contraintes . Cette nouvelle voie ouvre des perspectives pour ce groupe de travail afin de proposer de nouveaux modèles intégrant à la fois les données et contraintes et offrant plus de flexibilité pour raisonner et inférer des connaissances plus complexes que celles offertes par les approches d’extraction de connaissances classiques.

Stage Master 2 -2017-2018 : Découverte et exploitation de dépendances des données  liées aux déplacements de populations

Données : Base de données judiciares (Afrique de l'Ouest) et des réfugiés (Syrie)

Encadrants:  Brice Chardin, Allel Hadjali (LIAS) et Cyril Roussel (MIGRINTER)

Description du stage : (ici)