• Doctorant:
  • Gökhan Tahil
  • Financement : Artois
  • Thèse soutenue le :
  • 17 déc. 2024

L’apprentissage automatique est utilisé dans un nombre croissant de domaines. Dans cette thèse, nous nous intéressons à une tâche particulière en chimie, à savoir prédire la constante d’association entre une cyclodextrine et un invité. Pour ce faire, nous avons d’abord collecté les données disponibles dans la littérature et les avons traitées. L’un des défis consistait à représenter les molécules d’une manière unique et non ambiguë : nous avons utilisé des SMILES isomériques kekulisés à cette fin. Le jeu de données résultant, OpenCycloDB, a été mis à la disposition de la communauté scientifique. Nous avons remarqué que certains stéréoisomères pouvaient partager les mêmes plongements de molécules en utilisant les approches habituelles. C’est pourquoi nous avons proposé une famille de plongements de molécules appelée Stereo2vec pour garantir que des molécules différentes sont associées à des plongements de molécules différents. Les approches proposées ont été évaluées sur notre tâche de prédiction cible.