Tutoriel BLAST 2
Lire les résultats
NCBI BLAST section 1
NCBI BLAST section 2
NCBI BLAST section 3
NCBI BLAST section 4
NCBI BLAST sans le filtre
BLAST Vecteur
Un chercheur de votre équipe a cloné la séquence suivante :
TCGAGGTCGACGGTATCGATAAGCTTGATATCGAATCTCGCGGCCGCTTAAAGAGTTTCTCGTCGAGTCGT
GTGCTTTTGTGCTTCATTCGGTTCCTCTCGTAACCCACTGCTCCTGGTC
ATGCAGAGGTCGCCTCTGGAAAAGGCCAGCGTTGTCTCCAAACTTTTTTTCAGCTGGACCAGACCAATTT
TGAGGAAAGGATACAGACAGCGCCTGGAATTGTCAGACATATACCAAATCCCTTCTGTTGATTCTGCTGA
CAATCTATCTGAAAAATTGGAAAGAGAATGGGATAGAGAGCTGGCTTCAAAGAAAAATCCTAAACTCATT
AATGCCCTTCGGCGATGTTTTTTCTGGAGATTTATGTTCTATGGAATCTTTTTATATTTAGGGGAAGTCA
CCAAAGCAGTACAGCCTCTCTTACTGGGAAGAATCATAGCTTCCTATGACCCGGATAACAAGGAGGAACG
CTCTATCGCGATTTATCTAGGCATAGGCTTATGCCTTCTCTTTATTGTGAGGACACTGCTCCTACACCCA
GCCATTTTTGGCCTTCATCACATTGGAATGCAGATGAGAATAGCTATGTTTAGTTTGATTTATAAGAAGA
CTTTAAAGCTGTCAAGCCGTGTAGATAAAATAAGTATTGGACAACTTGTTAGTCTCCTTTCCAACAA
CCTGAACAAATTTGATGAAGGACTTGCATTGGCACATTTCGTGTGGATCGCTCCTTTGCAAGTGGCACTC
CTCATGGGGCTAATCTGGGAGTTGTTACAGGCGTCTGCCTTCTGTGGACTTGGTTTCCTGATAGTCCTTG
CCCTTTTTCAGGCTGGGCTAGGGAGAATGATGATGAAGTACAGAGATCAGAGAGCTGGGAAGATCAGTGA
AAGACTTGTGATTACCTCAGAAATGATTGAAAATATCCAATCTGTTAAGGCATACTGCTGGGAAGAAGCA
ATGGAAAAAATGATTGAAAACTTAAGACAAACAGAACTGAAACTGACTCGGAAGGCAGCCTATGTGAGAT
ACTTCAATAGCTCAGCCTTCTTCTTCTCAGGGTTCTTTGTGGTGTTTTTATCTGTGCTTCCCTATGCACT
AATCAAAGGAATCATCCTCCGGAAAATATTCACCACCATCTCATTCTGCATTGTTCTGCGCATGGCGGTC
ACTCGGCAATTTCCCTGGGCTGTACAAACATGGTATGACTCTCTTGGAGCAATAAACAAAATACAGGATT
TCTTACAAAAGCAAGAATATAAGACATTGGAATATAACTTAACGACTACAGAAGTAGTGATGGAGAATGT
AACAGCCTTCTGGGAGGAGGGATTTGGGGAATTATTTGAGAAAGCAAAACAAAACAATAACAATAGAAAA
ACTTCTAATGGTGATGACAGCCTCTTCTTCAGTAATTTCTCACTTCTTGGTACTCCTGTCCTGAAAGATA
TTAATTTCAAGATAGAAAGAGGACAGTTGTTGGCGGTTGCTGGATCCACTGGAGCAGGCAAGACTTCACT
TCTAATGATGATTATGGGAGAACTGGAGCCTTCAGAGGGTAAAATTAAGCACAGTGGAAGAATTTCATTC
TTTCTTCATCCCTGTACCTTTCTGTATACCCGTGACCCTGGTGAAGTGAGCTTTTGTAAGGAGGCAAACTG
CCGAATGATAAAATTTACTCTCCTCCAGTTTGGACAAAAAAAAAGCGGCCGCGAATTCCTGCAGCCCGGGG
GATCCACTAGTTCTAGA
Il vous demande ce que vous pouvez lui fournir comme informations sur le gène correspondant ?
On lane un blast au NCBIsur la base nucléotides
La réponse est obtenue:
haut/top
La première section de la réponse

Elle indique
- la version de blast : 2.2.9
- les références à citer
- le numéro de la tache sur le serveur RID...
- la longueur de la séquence envoyée : 1746 nuc
- la référence et la composition de la base de séquences blastées
haut/top
La deuxième section de la réponse

Elle indique sous forme d'un tableau de synthèse les résultats
- La ligne rouge avec les numéros de nucléotide est la séquence query
- les lignes plus fines montrent les réponses obtenus
- Leurs couleurs indiquent le % de similarité codées comme indiqué en haut de la figure
- on constate que toutes les premières réponses sont très similaires
- mais que il manque les parties 5' et 3' de la séquence !
haut/top
La troisième section de la réponse
Cette section souvent
référencée sous le terme "Score" est une vision
simplifiée des résultats
Elle indique :
- Les références des séquences trouvées, avec les numéros d'accession (NM_000492)
- Le début de la description (Homo sapiens cystis fibrosis...)
- Le Score : 2849
- La Probabilité ou E value : 0.0
- Des liens internes dans NCBI (ici L = LocusLink)
On notera que toutes les premières réponses sont de la
"Homo sapiens cystis fibrosis", donc on a presque certainement une
séquence de ce gène.
Vérifions dans la suite.
haut/top
La quatrième section de la réponse

L'en tête porte des indications précises sur chaque HSP trouvée :
- Un rappel du score et de la E value
- Le nombre d'identités 1462/1472 donc 99% de similarité
- Existence de 3 délétions
- On a retrouvé la séquence sur le brin sens
....

Dans la suite on voit bien l'existence de trois délétions
successive vers la position 650 de la séquence. Il va donc
manquer un AA dans la protéine...
...

Enfin on trouve la fin de l'unique HSP et le début de la seconde séquence la plus similaire trouvée
haut/top
En conclusion :
- On n'a pas trouvé les régions 1-119 & 1588-1746 de notre séquence !
- Bien que la séquence Query ne comporte pas de N, on en
trouve dans la séquence query affichée (par exemple vers
la position 165) !
Pour avoir les idées plus claires, relançons le blast mais sans filtre :
Les résultats sont maintenant :

- Globalement identiques
- On n'a toujours pas les parties 5' et 3' de la query
- Les "n" ont disparus
- Ils correspondent bien à des zones de faible complexité, par exemple : ttttttttt
Les parties manquantes
La séquence nous est fournie sous l'appellation : cDNA
cloné. Suppossons que des parties du vecteur de clonage aient
été séquencées par inadvertance.
Nous allons tester cette hypothèse
- Lançons un blast à EBI
- Choisir la base de séquence EVEC (Vectors)
- Sans filtre
haut/top
Résultats :


On trouve deux HSP
- La première couvre les positins 1587-1746
- La seconde les positions 1-120
On a donc bien des séquences du vecteur de clonage au deux
extrémités. Au vu de la parfaite similarité, il
s'agit de : "Cloning vector pBluescript"
haut/top