Proposition de thèse dans le cadre du projet régional BIL

De
Publié par

Proposition de thèse dans le cadre du projet régional BILApprentissage supervisé pour la prédiction de la localisati onsubcellulaire des protéinesDirection de thèse : Jin-Kao Hao, LERIA, Université d’Angers, 2 Bouleva rdLavoisier, 49045 Angers Cedex 01, tél: 02 41 73 50 76, email : jin-kao.hao@univ-angers.frCo-encadrement : Dominique Tessier, Unité BIA, INRA, rue de la géraudière , BP71627, 44316 Nantes Cedex, tél: 02 40 67 51 76 tessier@nantes.inra.frDébut de thèse souhaité : Septembre 2008Contexte ScientifiqueLes cellules eucaryotes font l’objet d’une compartimentation poussée . Lesdifférents organites sont séparés du reste de la cellule par des membranes, et certainsorganites comme les plastes ou la mitochondrie comportent eux-mêmes plus ieurscompartiments internes. A l’exception des protéines synthétisées in-situ à pa rtir deleurs génomes spécifiques, les protéines codées par le noyau doivent être d irigéesvers leur compartiment spécifique au moyen de signaux d’adressage. Pl usieurslogiciels mettant en œuvre principalement des méthodes d’apprentissage supe rvisésont disponibles pour prédire la localisation subcellulaire des protéines. C eux-ciexploitent principalement des biais de composition en acides aminés, la détecti on designaux en partie N-terminale, C-terminale ou internes à la protéine, ou utilis ent desinformations d’homologie - deux protéines homologues tendent à être adressé es aumême compartiment subcellulaire. Les performances de ...
Publié le : samedi 24 septembre 2011
Lecture(s) : 35
Nombre de pages : 2
Voir plus Voir moins
Proposition de thèse dans le cadre du projet régional BIL
Apprentissage supervisé pour la prédiction de la localisation
subcellulaire des protéines
Direction de thèse
: Jin-Kao Hao, LERIA, Université d’Angers, 2 Boulevard
Lavoisier, 49045 Angers Cedex 01, tél: 02 41 73 50 76, email : jin-kao.hao@univ-
angers.fr
Co-encadrement
: Dominique Tessier, Unité BIA, INRA, rue de la géraudière, BP
71627, 44316 Nantes Cedex, tél: 02 40 67 51 76 tessier@nantes.inra.fr
Début de thèse souhaité
: Septembre 2008
Contexte Scientifique
Les cellules eucaryotes font l’objet d’une compartimentation poussée. Les
différents organites sont séparés du reste de la cellule par des membranes, et certains
organites comme les plastes ou la mitochondrie comportent eux-mêmes plusieurs
compartiments internes. A l’exception des protéines synthétisées in-situ à partir de
leurs génomes spécifiques, les protéines codées par le noyau doivent être dirigées
vers leur compartiment spécifique au moyen de signaux d’adressage. Plusieurs
logiciels mettant en œuvre principalement des méthodes d’apprentissage supervisé
sont disponibles pour prédire la localisation subcellulaire des protéines. Ceux-ci
exploitent principalement des biais de composition en acides aminés, la détection de
signaux en partie N-terminale, C-terminale ou internes à la protéine, ou utilisent des
informations d’homologie - deux protéines homologues tendent à être adressées au
même compartiment subcellulaire. Les performances de ces logiciels ne sont pas
satisfaisantes dans le cas des protéines végétales.
La détermination de plusieurs localisations intéressent particulièrement l’unité
BIA de l’INRA : la membrane du golgi (recherche de glycosyl-transferases impliquées
dans la biosynthèse des parois), les vacuoles de stockage (stockage des protéines de
réserve), les amyloplastes (lieu de synthèse de l’amidon). La prédiction précise de la
localisation subcellulaire permet une meilleure identification de gènes ou de protéines
candidat(e)s pour des démarches de génétique inverse. Ainsi la problématique de
cette thèse est de nature très générale.
Déroulement de la thèse et objectif à atteindre
L’objectif principal du travail sera la conception et le développement
d’algorithmes innovants pour la prédiction de la localisation subcellulaire. Le protocole
d'apprentissage développé devra garantir de solides performances tout en fournissant
aux biologistes une interprétation aisée des résultats. On s'appuiera pour cela sur les
travaux en « soft computing » (algorithmes génétiques, réseaux neuronaux, ...) et en
apprentissage (SVM, Modèles de Markov, ...), en étudiant comment un ensemble de
critères explicatifs pertinents peuvent être extraits de ces classifieurs statistiques.
Un autre aspect important de ce travail sera de permettre l'intégration de
connaissances dans le protocole proposé afin de garantir que les dernières avancées
sur la compréhension des mécanismes biologiques puissent être pris en compte par le
système. En développant cette possibilité, le travail réalisé dans cette thèse visera des
résultats généraux applicables à une large classe de problèmes de localisation.
Un répertoire à jour des protéines identifiées expérimentalement dans les
plastes - à la fois les chloroplastes et les amyloplastes - devra être constitué à partir
des données expérimentales du laboratoire et des données de bibliographie récentes.
Une recherche bibliographique devrait également permettre de retrouver un ensemble
de protéines avec une double localisation pour essayer de les caractériser. La base de
données ainsi constituée permettra l'évaluation de la méthode de prédiction proposée.
Financement et Candidature
Cette thèse est entièrement financée par le projet «
Bioinformatique Ligérienne – BIL
»
sous forme d’une Allocation de Recherche Régionale (montant identique à une AR
ministérielle) d’une durée de trois ans.
Les candidatures sont à envoyer au plus tôt avant le 30 juin 2008 à :
jin-
kao.hao@univ-angers.fr
(LERIA, Université d’Angers) et
tessier@nantes.inra.fr
(BIA,
INRA Nantes) avec 1) CV détaillé indiquant le classement et la mention, 2) relevé des
notes du Master, 3) lettre de motivation, 4) nom d’un référant, et 5) éventuelles
recommandations.
Soyez le premier à déposer un commentaire !

17/1000 caractères maximum.