Thèse présentée pour obtenir le grade de Docteur de l'Université de Strasbourg

De
Publié par

Niveau: Supérieur, Doctorat, Bac+8
Thèse présentée pour obtenir le grade de Docteur de l'Université de Strasbourg Discipline : Sciences du vivant Spécialité : Bioinformatique par Nicolas GAGNIÈRE Institut de Génétique et de Biologie Moléculaire et Cellulaire Département de Biologie et de Génomique Structurale Laboratoire de Bioinformatique et de Génomique Intégratives Soutenue publiquement le 13 octobre 2009 Membres du jury Directeur : LECOMPTE Odile, Maître de Conférences UDS Co-directeur : POCH Olivier, Directeur de Recherche CNRS Rapporteur interne : CAVARELLI Jean, Professeur UDS Rapporteur externe : MÉDIGUE Claudine, Directeur de Recherche CNRS Rapporteur externe : ROBINSON-RECHAVI Marc, Professeur à l'Université de Lausanne Examinateur : MOSZER Ivan, Chargé de Recherche à l'Institut Pasteur Membre invité : JOLLIVET Didier, Chargé de Recherche CNRS Développement d'une suite logicielle pour l'analyse et l'annotation intégrative automatiques de transcrits et de protéines. Application aux banques d'ADNc de l'annélide polychète Alvinella pompejana

  • conférences uds

  • uds rapporteur externe

  • application aux banques d'adnc de l'annélide polychète

  • département de biologie et de génomique structurale

  • rapporteur interne


Publié le : jeudi 1 octobre 2009
Lecture(s) : 94
Source : scd-theses.u-strasbg.fr
Nombre de pages : 346
Voir plus Voir moins
Institut de Génétique et de Biologie Moléculaire et Cellulaire
Département de Biologie et de Génomique Structurale
Laboratoire de Bioinformatique et de Génomique Intégratives
Thèse présentée pour obtenir le grade de Docteuƌ de l͛UŶiǀeƌsitĠ de Strasbourg Discipline : Sciences du vivant Spécialité : Bioinformatique par Nicolas GAGNIÈRE
DĠǀeloppeŵeŶt d͛uŶe suite logiĐielle pouƌ l͛aŶalLJse et l͛aŶŶotatioŶ iŶtĠgƌatiǀe autoŵatiƋues de tƌaŶsĐƌits et de pƌotĠiŶes. áppliĐatioŶ audž ďaŶƋues d͛áDNĐ de l͛aŶŶĠlide polychèteAlvinella pompejana
Soutenue publiquement le 13 octobre 2009 Membres du jury Directeur :LECOMPTE Odile, Maître de Conférences UDS Co-directeur :POCH Olivier, Directeur de Recherche CNRS Rapporteur interne :CAVARELLI Jean, Professeur UDS Rapporteur externe :MÉDIGUE Claudine, Directeur de Recherche CNRS Rapporteur externe :ROBINSON-RECHAVI Marc, Professeur à l͛UŶiǀeƌsitĠ de Lausanne Examinateur :MOSZER Ivan, Chargé de Rechercheă l͛IŶstitut PasteuƌMembre invité :JOLLIVET Didier, Chargé de Recherche CNRS
FiŶiƌ sa thğse, Đ͛est comme essayer d͛atteiŶdƌe la ǀitesse de la luŵiğƌe. Plus oŶ s͛eŶ ƌappƌoĐhe, plus Đela Ŷous deŵaŶde de l͛ĠŶeƌgie…un nain connu très fatigué
Remerciements
REMERCIEMENTS
Tout d͛aďoƌd, je tieŶs ă edžpƌiŵeƌ ŵa pƌofoŶde ƌeĐoŶŶaissaŶĐe ă JeaŶ Caǀaƌelli, ClaudiŶe Médigue, Marc Robinson-Rechavi et Ivan Moszer pour avoir accepté de juger ce travail de thèse. Merci aussi à Didier Jollivet pour avoir accepté de venir assister à mon show, mais surtout ŵeƌĐi d͛ġtƌe paƌti ă l͛aǀeŶtuƌe pouƌ alleƌ pġĐheƌ Đes petites ďġtes Ƌui oŶt oĐĐupĠ ŵes jouƌs (et hanté mes nuits ?). Je remercie également Dino Moras et Jean-Claude ThieƌƌLJ de ŵ͛aǀoiƌ aĐĐeptĠ au seiŶ du Département de Biologie et de Génomique Structurale au cours de mes nombreux stages et de ces trois dernières années. Un immense merci à mes deux co-diƌeĐteuƌs pƌĠfĠƌĠs, Odile et Oliǀieƌ, Ƌui ŵ͛oŶt poƌtĠ, suppoƌtĠ, souteŶu et ƌeteŶu peŶdaŶt Đette poigŶĠe d͛aŶŶĠes, mais surtout qui ont réussi à me motiver et à me faire prendre confiance en moi à chaque moment difficile. Odile, une bonne partie de ce que je sais maintenant je te le dois, et je Ŷ͛auƌais jaŵais pu aƌƌiǀeƌ au bout sans ton aide. Merci beaucoup pour ta gentillesse et ta disponibilité pour avoir corrigé ŵes iŶŶoŵďƌaďles diǀagatioŶs. Je suis iŵpatieŶt Ƌu͛oŶ se desĐeŶde ƋuelƋues petits mojitos en terrasse afin de souffler un peu après ce long marathon (ou des whiskies, je ne suis pas sectaire). Olivier, tes capacités de projection dans les bois et de quasi-oŵŶisĐieŶĐe ŵ͛oŶt toujours sidéré. En les combinant à ton énergie intarissable et à tes qualités humaines, tu arrives à maintenir une équipe soudée où il fait bon vivre (et travailler un peu tout de même). Rien que pour ça, merci. BoŶ, et ŵaiŶteŶaŶt oŶ se ĐoŶĐeŶtƌe, il Ŷe s͛agit pas d͛ouďlieƌ de ƌeŵeƌĐieƌ ƋuelƋu͛uŶ paƌŵi notre grande famille.
Tout d͛aďoƌd, ŵeƌĐi audž doLJeŶs du laďoƌatoiƌe. ‘aLJŵoŶd, le gƌaŶd ŵaitƌe de GsĐope, toujours disponible, dont lesŶoŵďƌeuses disĐussioŶs ŵ͛oŶt ďeauĐoup appƌis, et Ƌue j͛ai finalement réussi à convertir à Ubuntu. Luc, toujours le mot pour rire et de bonne humeur, ça a ĠtĠ uŶ plaisiƌ de t͛astiĐoteƌ suƌ le TCL dğs Ƌue l͛oĐĐasioŶ se pƌĠseŶtait. Julie, fidğle au poste dès le lever du jour, souvent la première personne avec qui je débute ma petite touƌŶĠe des popotes ŵatiŶale Ƌue j͛affeĐtioŶŶe tout paƌtiĐuliğƌeŵeŶt. Et eŶfiŶ FƌĠdĠƌiĐ, l͛iŶĐaƌŶatioŶ zeŶ de la ĐeƌtifiĐatioŶ I“OϵϬϬϭ, et ĠŵiŶeŶt Đollğgue de thĠ et de ƌestau U.
i
Remerciements
Viennent ensuite les habitants du couloir. Laetitia P, qui a toujours le sourire, surtout quand elle arrive pour me piquer des chewing-guŵs. MaŶu, s͛il Ŷ͛LJ aǀait Ƌu͛uŶe Đhose ă ƌeteŶiƌ, Đe seƌait le ĐoŶgƌğs ă VieŶŶe où l͛oŶ a ǀƌaiŵeŶt ďieŶ dĠliƌĠ.
On continue la ǀisite aǀeĐ ‘adǁeŶ, alias J‘. MeƌĐi ďeauĐoup ă toi et ă ‘LJŵ de ŵ͛aǀoiƌ ĐoŶǀiĠ en Tunisie pour votre mariage. Courage pour finir ta thèse en beauté (et en anglais, la Đlasse…Ϳ. BoŶ Đouƌage aussi ă ÉŵeliŶe et Dao Ƌui oŶt eŶtaŵĠ la leuƌ il LJ a peu de temps. Valentin, bonne chance pour la suite.
Il y a aussi Laetitia G, toujours prête à faire signer nos papiers aux plus hautes autorités, mais surtout une véritable touriste globetrotteuse qui vient nous faire déprimer avec sa peau toute bronzée, en plus de nous spammer à longueur de temps. Alors, pas trop de fautes dans ces remerciements ?
Arrive maintenant Sophie, la magicienne de la plate-forme, qui parvient on ne sait trop comment,ă faiƌe soƌtiƌ des NullPoiŶteƌEdžĐeptioŶ lă où l͛oŶ s͛LJ atteŶd le ŵoiŶs. Laurent, le gƌaŶd sage… du “áGE. VĠƌoŶiƋue, toujouƌs la pġĐhe, jouƌ apƌğs jouƌ. “tĠphaŶie, où la fille Ƌui murmurait aux oreilles du Solexa.
Bien entendu, il y a aussi les résidents du grand labo. Anne, qui nous quitte pour ses champignons. Ta bonne humeur et ta tasse qui traine au coin café vont me manquer. Yann, saŶs doute eŶĐoƌe plus taƋuiŶ Ƌue ŵoi, toujouƌs eŶ Ƌuġte du Đƌistal ultiŵe ;et s͛il diffƌaĐte Đ͛est eŶĐoƌe ŵieudžͿ. HoaŶ, Ŷotƌe data-manager haut-dĠďit faǀoƌi, ŵeƌĐi de t͛ġtƌe souǀeŶt iŶƋuiĠtĠ de l͛aǀaŶĐeŵeŶt de ŵa thğse… et de ŵoŶ apƌğs thğse. Gioia, dƌôle de phLJsiĐieŶŶe qui fait de la bio-info, conversion réussie. Nicolas, féru de culture asiatique, souvent une aŶeĐdote ŵaƌƌaŶte ă ƌaĐoŶteƌ. FloƌeŶĐe, uŶ peu tġte eŶ l͛aiƌ, ça ŵ͛a fait ďizaƌƌe de passer Đette thğse aǀeĐ uŶ aŶĐieŶ pƌofesseuƌ de lLJĐĠe, ŵais oŶ s͛LJ haďitue. WolfgaŶg, Ƌui teŶte taŶt ďieŶ Ƌue ŵal de ŵettƌe de l͛oƌdƌe daŶs Ŷos doŶŶĠes, aloƌs Ƌu͛oŶ Ŷe sait pas ĐlaiƌeŵeŶt Đe Ƌue l͛oŶ ĐheƌĐhe. NiĐodğŵe, uŶ ƌiƌe iŶiŵitaďle et iƌƌĠsistiďleŵeŶt Đommunicatif.
Et puis il ne faut certainement pas oublier Serge et Guillaume, nos ingénieurs système et ƌĠseau, Ƌui ŵ͛oŶt, hĠlas pouƌ eudž, souǀeŶt ǀu poiŶteƌ le ďout du Ŷez dğs Ƌu͛il LJ aǀait uŶ pƌoďlğŵe. Et álaiŶ, MĐGLJǀeƌ eŶ ĠleĐtƌoŶiƋue, Ƌui Ŷ͛ouďlie jaŵais de passer faire un petit « Saaaalut » à notre bureau.
Et finalement, notre bureau, connu sous les noms de « bureau des djeunz » (qui ne le sont plus trop finalement) ou le « bureau des glands», Đ͛est seloŶ ;Ŷ͛est Đe pas Oliǀieƌ?). Tout d͛aďoƌd Guillauŵe, parti depuis déjà quelques mois, souvent dans le même trip qui ĐoŶsistait ă soƌtiƌ le plus d͛iŵďĠĐilitĠs geekieŶŶes ă la ŵiŶute, des tas de ĐoŶǀeƌsatioŶs stimulantes et quelquefois sérieuses. Que la force du zombie mutant Maya soit avec toi. David, ou plutôt Daǀe, paƌĐe Ƌue DáVID Đ͛est de la ŵ… Toujouƌs pƌġt ă aideƌ les autƌes, et d͛uŶ poiŶt de ǀue edžtĠƌieuƌ, iŵpeƌtuƌďaďleŵeŶt Đalŵe et posĠ ;ŵais je suppose Ƌue le Ϯ de
ii
Remerciements
tension,ça aideͿ. BoŶ Đouƌage pouƌ la fiŶ, Đ͛est la deƌŶiğƌe ligŶe dƌoite. LauƌeŶt-Philippe, l͛iŶteƌŵitteŶt du ďuƌeau. ViǀeŵeŶt Ƌu͛oŶ soit ŵoiŶs oĐĐupĠs pouƌ ƌepƌeŶdƌe Ŷos paƌties de MagiĐ… et pouƌƋuoi pas uŶ petit sĠjouƌ au LiďaŶ? Et enfin Yannick-Noël, testeur et dealer officiel de séries US, promotologue à ses heures perdues (ou proctologue, j͛ai Đoŵŵe uŶ tƌou de ŵĠŵoiƌeͿ, ŵais suƌtout edžpeƌt eŶ Weď Ϯ.Ϭ, d͛uŶ poiŶt de ǀue ĠĐƌĠŵage faĐeďookieŶ et adopteunmecquien.
Et puis il y a aussi tout les « anciens» Ƌue j͛ai ĐƌoisĠs peŶdaŶt uŶe duƌĠe plus ou ŵoiŶs longue. Merci à Adeline, Frédéric, Aurélie, Jean (ah ben tiens non, il revient, bon retour paƌŵi ŶousͿ, áŶŶaïĐk, ‘aǀi, Odile, et FƌaŶĐisĐo pouƌ tout Đe Ƌue ǀous aǀez pu ŵ͛appoƌteƌ.
Que serait le labo sans sa ribambelle de stagiaires qui y ont séjourné, avec par ordre d͛appaƌitioŶ: Fabrice, Xavier, Yahya, Laurent, Louise, Éveline, Némo, Léa, Bénédicte, Julien, Sophie, Benjamin, Jonathan, Tao, Ali, François, Seydou, et Enzo. Spéciale dédicace à Fabrice pouƌ ŵ͛aǀoiƌ fait dĠĐouǀƌiƌ X-wars, Yahya et son délicieux thé à la menthe, Némo pour ses dĠliƌes jeudž ǀidĠotesƋues et pouƌ ŵ͛aǀoiƌ fait ĐƌaƋueƌ pouƌ uŶe P“ϯ, è-veuh, Louise et Sophie pouƌ aǀoiƌ fait ƌeŵoŶteƌ le Ŷiǀeau d͛œstƌogğŶes Ƌui aǀait atteiŶt le seuil ĐƌitiƋue daŶs Ŷotƌe ďuƌeau, et EŶzo, Ƌue je Ŷ͛ai pas ďeauĐoup ĐƌoisĠ, ŵais doŶt je Ŷe désespère pas de pouvoir écraser un jour aux Magic. Et enfin bon courage à Benjamin et Jonathan qui vont débuter leuƌ thğse d͛iĐi Đette aŶŶĠe ;je ǀous auƌai pouƌtaŶt pƌĠǀeŶus!). Je souhaite aussi ƌeŵeƌĐieƌ toute l͛ĠƋuipe de la plate-forme de Biologie et Génomique structurales, et plus particulièrement Didier Busso, Loubna, Matthieu, Pierre et Édouard avec Ƌui j͛ai passĠ deudž seŵaiŶes passioŶŶaŶtes ă ƌĠpliƋueƌ Đes sataŶĠs ĐloŶes d͛álǀiŶella.Je remercie aussi les équipes de la station biologique de Roscoff pour leur implication dans ce projet, et tout particulièrement Didier Jollivet, Arnaud Tanguy et Jean Mary. Je ƌeŵeƌĐie ĠgaleŵeŶt toute l͛ĠƋuipe de Đouƌeuƌs de l͛IGBMC Ƌui ŵ͛oŶt aĐĐoŵpagŶĠ, ou plutôt Ƌue j͛ai teŶtĠ de suiǀƌe, peŶdaŶt Ƌue je ŵe ǀidais uŶ peu l͛espƌit: Raymond, Alain, Dave, Nicolas, Isabelle, Nathalie, Bruno, Jean-Paul, Jean-Maƌie…Je remercie tout particulièrement mes amis proches : Guillaume, Dave, Yannick, Laurent-P, Agathi, Benjamin Schwarz, Nathanaël Weill, Pierre « Pierretta » Hassenboehler, Claude Schenck et Christophe Huault. Il y aurait trop de choses à dire ici, mais merci beaucoup pour ǀotƌe aŵitiĠ et pouƌ ŵ͛aǀoiƌ souteŶu ă uŶ ŵoŵeŶt ou uŶ autƌe. J͛espğƌe pouǀoiƌ ǀous rendre un jour la pareille.
iii
Remerciements
Merci à toute ma famille, surtout à ceux qui ont dû supporter mon sale caractère de ces derniers mois. Je pense bien sûr à ma Meuhman adorée, qui va fêter son demi-siècle pendant la semaine de ma soutenance. Le week end va être sacrément arrosé !! Sans oublier de remercier le couple infernal Mamie et Tonton boissons. Et aussi mon frangin, qui a eu le bon goût de jouer à la PS3 dans la même pièce que moi, pendant ma rédaction. Et bien ĐƌoLJez le ou ŶoŶ… ça ŵotiǀe ă eŶ fiŶiƌ au plus ǀite.Pour terminer,je ƌeŵeƌĐie TƌiĐia pouƌ ŵ͛aǀoiƌ faitpasser de tellement bons moments pendant nos soirées télé, et bien entendu le club havane, mon sponsor (dés)hydratant officiel.
UŶ gƌaŶd ŵeƌĐi ă ǀous tous…
iv
Liste des abréviations
LISTE DES ABRÉVIATIONS
ADN ADNc AJAX ARN ARNm ARNr ARNt BIPS BIRD BIRD-QL BLAST BMRB BNL CDS CGI CRUD CSS DAG DAO DAS DAS DAVID DDBJ ddNTP dNTP DPC EBI EC EGPM EMBL EST Gio GO GSC GSS HMM HSP HTC HTGS HTML HTTP IGBMC ILP IPA iSCSI
Acide désoxyribonucléique ADN complémentaire Asynchronous JavaScript and XML Acide ribonucléique ARN messager ARN ribosomique ARN de transfert BioInformatics Platform of Strasbourg Biological Integration and Retrieval Data BIRD Query language Basic Local Alignment Search Tool Biological Magnetic Resonance Data BankBrookhaven National LaboratoryCoding sequence Common Gateway InterfaceCreate, Retrieve, Update, DeleteCascading Style Sheets Directed Acyclic GraphData Access Object Distributed Annotation SystemDistributed Annotation System Database for Annotation, Visualization and Integrated DiscoveryDNA Data Bank of Japandi-désoxyribonucléotide triphosphate désoxyribonucléotide triphosphate Density of Points Clustering European Bioinformatics InstituteEnzyme CommissionÉvolution et Génétique des Populations Marines European Molecular Biology LaboratoryExpressed Sequence Taggibi octet (giga binaire) Gene OntologyGenomic Standards Consortium Genome Survey SequenceHidden Markov Model High-scoring Segment Pairs High Throughput cDNA sequencingHigh Throughput Genomic SequencingHypertext Markup LanguageHypertext Transfer Protocol Institut de Génétique et de Biologie Moléculaire et Cellulaire Inductive logic programming Ingenuity Pathways AnalysisInternet Small Computer System Interface
v
Soyez le premier à déposer un commentaire !

17/1000 caractères maximum.