Intertextualité et Causalités : vers une analyse sémantique des discours
- Doctorant:
- Toadoum Sari Sakayo
- Co-directeurs de thèse :
- Lakhdar Saïs
- Saïd Jabbour
- Co-encadrants de thèse :
- Fabien Delorme
- Nelly Robin
- Financement : Artois
- Année de début de thèse :
- 2025
De nombreux corpus textuels rapportent des discours sur divers sujets de société, comme les migrations, la santé, la politique, et le climat. Ces discours impliquent souvent une diversité d’acteurs. On peut par exemple relever que pour les migrations, ils impliquent des acteurs divers qui vont des migrants eux-mêmes aux médias en passant par les politiques et la société civile. Explorer les opinions de ces différents acteurs en rendant compte de l’intertextualité de ces discours et expliquer leurs convergences et/ou leurs divergences.
Un second type de corpus textuel, rapporté par un seul acteur, concerne par exemple les récits biographiques. Souvent ces récits relatent une succession d’événements. Découvrir ces événements et extraire le réseau de causalités qui les relie est un pas vers la compréhension de phénomènes complexes sous-jacents.
C’est dans ce contexte que s’inscrit cette thèse. Elle s’appuie sur deux types de corpus textuels, les discours sur les migrations et les parcours biographiques des mineurs en conflit avec la loi. L’approche méthodologique s’articulera autour de l’analyse intertextuelle et la découverte de réseaux de causalités.
Elle impose le développement préalable de notre propre modèle de langage (LLM) et s’appuiera sur divers thématiques de l’intelligence artificielle comme le traitement automatique du langage naturel, l’apprentissage automatique, la fouille de de données, la représentation des connaissances et l’analyse visuelle.