Master Recherche 2e année
<<Systèmes Intelligents et Applications>>

Titre :  Prédiction de promoteurs dans les séquences d'ADN par boosting/bagging

Encadrant :  Mephu Nguifo Engelbert <http://www.cril.univ-artois.fr/%7Emephu>

Description:

L'annotation des génomes est une étape primordiale de la compréhension des fonctions biologiques. C'est pourquoi depuis l'essor pris par le séquençage des génomes complets, l'élaboration d'algorithmes de prédiction d'éléments génomiques fiables et robustes représente une composante dynamique de la bioinformatique.

Si plusieurs travaux ont été consacrées à la prédiction des promoteurs, il n'en reste pas moins que dans les applications pratiques, le nombre élévé de faux positifs (faux promoteurs) reste parfois très élevé, et par conséquent le problème reste ouvert.

L'application des techniques d'apprentissage par aggrégation de décision de plusieurs experts (systèmes) peut être aussi  une alternative pour réduire le nombre considérable de faux positifs prédits. Ces techniques seront explorées dans le cadre de ce travail.

Mots clés :  Apprentissage Automatique, Boosting, Bagging, Séquences d'ADN,

Références :

Cornuejols et Miclet, 2002, Apprentissage Artificiel: méthodologie et applications, Eyrolles.
Hubans C., Hot D., Lemoine Y., Mephu Nguifo E., Plate de prédiction de structures opéroniques, JOBIM 2004.
Baldi and Brunak, Bioinformatics: A machine learning approach, MIT Press
Mitchell, 1997, Machine Learning, McGraw Hill.