lundi mars Pascal Hingamp biologie univ mrs fr

De
Publié par

lundi 20 mars Pascal Hingamp / biologie.univ-mrs.fr BLAST Recherche de domaines protéiques prise en main de l'Annotathon (TD)

  • séquences dans genbank

  • prise en main de l'annotathon

  • banque de donnée hsp

  • fréquence d'occurence par la chance

  • séquence


Publié le : lundi 18 juin 2012
Lecture(s) : 30
Tags :
Source : biologie.univ-mrs.fr
Nombre de pages : 42
Voir plus Voir moins
lundi 20 mars Pascal Hingamp / biologie.univ-mrs.fr
BLAST
Recherche de domaines protéiques
prise en main de l'Annotathon (TD)
BLAST
La “pipette de la bioinformatique”...
Objectif:
Rechercher parsimilarité de séquencedes homologuesà une séquence (requête) dans une banque de séquences (cibles)
Jargon
Exemples
Fonctionnement de BLAST
BLAST: jargon
BLAST=Basic Local Alignement Tool
Query= séquence requête
Subjects= séquences cibles de la banque de donnée
HSP= High Scoring Pairs
E-Value= Expect value (fréquence d'occurence par la chance)
Exemples
Here are some BLAST examples I prepared earlier...
Rapport BLAST:
-entête
-synopsis
-alignements
-paramètres
BLAST: comment ça marche?
Programmation dynamique x N séquences dans GENBANK: intractable!
Heuristique: Méthode approchée non garantie de trouver les meilleurs similitudes (mais s'en approche souvent!)
E-value = Expect value
E: fréquence d'occurence par la chance
E = K.m.N.e
S: score
-ℷ.S
E [0,+]!
m: longueur de la séquence requête
N: dimension de la banque (nb nucléotides)
K &: constantes Karlin-Altschul
Valeurs empiriques de K & Lambda
Matrice de substitution
BLAST: famille de programmes
blastp compares protein sequence sequence against a an amino acid query database;
 blastn compares nucleotide a nucleotide query sequence against a sequence database;
 blastx of a translation products compares the six-frame conceptual nucleotide query sequence (both strands) against a protein sequence database;
 tblastn nucleotide a compares a protein query sequence against sequence database dynamically translated in all six reading frames (both strands).
 tblastx compares the six-frame translations of a nucleotide query sequence against the six-frame translations of a nucleotide sequence database.
blastn blastp blastx tblastn tblastx
Requête Banque cibles
Comparaison
Applications
Applications des ALN multiples
Détermination de signatures/motifs fonctionnels
=Certains Acides Aminés sont plus égaux que les autres...
Motifs, patrons & signatures
Lesk A.M. (In) Computational Molecular Biology, Lesk A.M., Ed., pp17-26, Oxford University Press, Oxford (1988).
 protein which is too distantly related to any protein of known structure to detect its affinity by overall sequence alignment may be identified by its possession of a particular cluster of residues types classified as a motifs. The motifs, or templates, or fingerprints, arise because of particular requirements of binding sites that impose very tight constraint on the evolution of portions of a protein sequence."
son  cme"I etsurtcsase ,htfunctionure and  nwonknu na fo 
Soyez le premier à déposer un commentaire !

17/1000 caractères maximum.