Conception de modèles génératifs à base de diffusion pour la découverte de nouvelles structures cristallographiques
- Doctorant:
- Elohan Veillon
- Co-directeurs de thèse :
- Zied Bouraoui
- Adlane Sayede (UCCS)
- Financement : Artois
- Année de début de thèse :
- 2023
La découverte de nouveaux matériaux innovants dans le domaine de l’énergie est primordiale pour des raisons économiques et sociétales. Les stratégies essais-erreurs habituellement utilisées pour identifier de nouveaux matériaux sont, néanmoins, longues et fastidieuses puisque de minimes modifications des conditions expérimentales peuvent engendrer des effets drastiques sur leurs propriétés. L’association des innovations technologiques récentes en informatique aux approches actuelles en chimie (synthèse, modélisation et caractérisation des matériaux) représente une opportunité pour révolutionner et accélérer la recherche et le développement de nouveaux matériaux. Cette nouvelle approche qui intègre différents outils tels que le criblage à haut débit et des algorithmes d’apprentissage automatique (Machine Learning - ML) permettra à terme de réduire le coût associé à la découverte du matériau et réduira par conséquent le prix des produits finis (par exemple, les panneaux solaires, les batteries …). En effet, l’utilisation des techniques ML dans le domaine des sciences des matériaux peut aider à améliorer la prédiction et l’optimisation des propriétés des matériaux, et à mieux comprendre les relations entre leur structure et leurs propriétés [1-6]. Par exemple, ces techniques sont utilisées pour prédire la résistance à la corrosion d’un matériau, ou pour optimiser les propriétés mécaniques d’un alliage. Elles peuvent également être utilisées pour prédire la conductivité électrique d’un matériau en fonction de sa composition chimique.
Il existe de nombreux modèles génératifs (VAE, normalizing flow, GAN, etc.) pour prédire les structures de systèmes moléculaires, mais il y a peu de modèles pour les systèmes cristallins et leur efficacité est très limitée. Cela est dû au fait que, en plus de la composition chimique, il faut tenir compte de la périodicité et de l’équivalence géométrique du système cristallin dans le modèle génératif. Une architecture de débruitage (denoising) a récemment été proposée pour aborder cet aspect, mais aucune génération n’a encore été effectuée avec cette approche [7-8]. Nous proposons dans ce sujet de développer un algorithme génératif basé sur cette architecture.
Récemment, les modèles de diffusion ont gagné en popularité. Par exemple, les modèles de diffusion en imagerie tels que DALL-E ont montré des résultats remarquables à comparer aux modèles classiques tels que les GAN [9]. Les modèles de diffusion sont des modèles génératifs utilisés pour créer des données similaires aux données sur lesquelles elles sont formées. Ces modèles s’efforcent de capturer la dynamique de propagation de certaines caractéristiques dans un réseau en ajoutant du bruit aux données d’entrée. Le bruit est souvent ajouté de manière aléatoire pour “abîmer” les données d’apprentissage. L’inversion du processus de bruitage pour récupérer les données d’origines, en minimisant les erreurs, sert à entraîner un modèle de diffusion. Ce dernier peut être utilisé, par la suite, pour générer des données en passant simplement un bruit échantillonné de manière aléatoire à travers le processus de débruitage appris.
Références
- Ward, L., et al. “Accelerating the discovery of new materials with machine learning.” Nature 585 (2020): 773-778.
- Raccuglia, P., et al. “Machine learning predictions of crystalline structures and their stability.” Physical review letters 122 (2019): 105502.
- Choudhary, A., et al. “Machine learning for crystal structure prediction.” The Journal of Chemical Physics 149 (2018): 241722.
- Zhang, Y., et al. “Crystal structure prediction using machine learning.” Nature communications 8 (2017): 13915.
- De, S., et al. “Crystal structure prediction using a data-driven approach.” Scientific reports 6 (2016): 23607.
- Risi, C., Ramprasad, R., & Chen, W. (2020). Machine learning in materials science. Materials Today, 33, 6-17.
- Klipfel, A., Bouraoui Z., Frégier, U. & Sayede, A.Equivariant Graph Neural Network for Crystalline Materials. STRL@IJCAI 2022.
- Klipfel, A., Peltre O., Frégier, Y., Sayede, A. & Bouraoui Z. Equivariant Message Passing Neural Network for Crystal Material Discovery. AAAI 2023.
- Dhariwal P, Nichol A. Diffusion Models Beat GANs on Image Synthesis. Neurips 2021.