Biodiversité - Outils disponibles


Récupérer les séquences    Aligner    Phylogénie   Biodiversité   Litterature   Liens Utiles
Related web pages:  list of tree visualisers  

Une fois qu'on a un jeu de séquences (soit PCR & clonage, soit isolation de plein de souches) , le travail du bioinforaticien peut commencer. Les étapes suivantes sont généralement accomplies les unes après les autres.

1/ Récupérer les séquences.

C'est bien beau d'avoir son jeu de données. Mais généralement, on veut également savoir si d'autres séquences similaires (ou identiques) n'ont pas été également retrouvées dans d'autres circonstances. Heureusement maintenant nous disposons de bases de données publiques de séquences, car pour pouvoir publier un article, le chercheur doit déposer ses séquences et obtenir un numéro d'accession pour chaque séquence (voir mon cours à ce sujet).
En fait on peut récupérer des jeux de séquences, soit  par similarité, soit par mots clés.

Par similarité.

C'est la méthode la plus utilisée. Généralement on le fait en utilisant le logiciel BLAST qui permet en partant d'une séquence donnée (séquence Query) de trouver les séquences similaires présentes dans un jeu de donnée (séquences Subject, dans une base de données).  Voir la page FAQ au NCBI avant toute chose !!! Voir également mes tutoriel1 et tutoriel2
Pour ce faire on dispose de trois moyens.

Utilisation d'un serveur web.                                                             top

Utilisation d'un service sur un serveur.                                             top

Utilisation en local.                                                          top

Ce qu'il reste maintenant à faire.                                                   top

Vous avez récupéré une liste de numéros d'accessions de séquences similaires. Il faut maintenant récupérer ces séquences, les aligner avec les votres, etc.
Or la récupération de séquences, même si elle est facilitée par l'existence de liens vers les fichiers de séquences peut vite devenir fastidieuse...
On voudra donc récupérer ces séquences par mots clés

Par mots clés.                                                          top

L'outil BLAST est un formidable outil, mais il n'est pas toujours adapté à la récupération de séquences :
Pour résoudre ces problèmes, on procède alors à une récupération de séquences par mots clés. Ces mots clés peuvent être :
Pour ce faire nous avons à notre disposition plusieurs outils :
 top

2/ Aligner les séquences.

Il va falloir maintenant aligner toutes ces séquences avant de procéder aux post-traitement ad hoc.

Programmes d'alignements multiples.

Ici encore on a le choix entre outils en ligne, sur des serveurs par telnet ou en local. Je détaillerais ici la liste des logiciels librement téléchargeables.

 top

Visualisation et modifications manuelles.

On ne peut jamais prendre tel quel le résultat d'un alignement multiple et faire des post-traitement (et encore moins prendre l'arbre guide de Clustal pour un arbre phylogénétique : JAMAIS, JAMAIS, JAMAIS !!!). Il faut :
Pour ce faire on dispose de très très nombreux logiciels:
top

3/ Phylogénie.

Après avoir aligné les séquences, et avoir extrait les domaines bien alignés, sans trop d'homoplasies apparentes et positions apparemment orthologues, on désire faire une phylogénie pour analyser et représenter l'état de la diversité.
Normalement pour obtenir une phylogénie fiable, il est conseillé de :
Souvent les analyses de diversité se font sur des séquences assez courtes, et seules les parentés approchées importent (on ne cherche pas à résoudre des branches profondes). On pourra alors n'utiliser par exemple que la méthode nj et un boostrap.

Les séquences chimères.

Si les séquences résultent d'une PCR & clonage, il est possible que certaines séquences soit des chimères. Si les séquences obtenues sont trop courtes, on ne pourra pas les détecter. Sinon, on pourra soit :
  1. Utiliser l'outil ad hoc, Chimera Check, à la Ribosomal Database 
  2. Utiliser Bellopheron : doc, server.
  3. Télécharger et installer Chimera and Cross-Over Detection and Evaluation, (pdf)
  4. Essayer de couper les séquences en deux parties 5' et 3', blaster chaque partie et comparer les résultats (si vous devez vérifier beaucoup de séquences).
top

Programmes de phylogénie.

Les paquetages de programmes pour faires des phylogénies.
Les tout en un.
Ils combinent plusieurs outils (et souvent un programme d'alignement) au sein d'une interface graphique simple d'emploi.
NOTE : j'ai développé mon propre "tout en un" qui combine les outils de recherche (BLAST et mots clés) , d'alignements, de phylogénie et une série d'algos permettant de faire tout ce dont j'ai besoin. Mais "ya pa de doc"!
top

Visualiser les arbres.

Ici encore, foison de logiciels. Je n'en citerais que quelques uns :

4/ Biodiversité : mesures, estimateurs et indices.

Introduction

La mesure de la biodiversité n'est pas chose aisée. Il s'agit de traduire des observations complexes, avec changements d'échelles en des graphes lisibles et des nombres permettant de comparer deux niches écologiques ou la variation d'une niche au cours du temps. La traduction de données complexes ne peut pas se faire sans perte d'informations.
Par ailleurs, comme il est impossible de recencer la totalité des espèces présentes, on procède à un échantillonage et il faut ensuite interpoler. Cette interpolation est souvent hasardeuse, car elle repose sur des modèles d'abondance, de répartition de "patchiness" a priori, puisque ce sont ces valeurs qu'on cherche à estimer.
Les principales mesures qu'on veut sont :
Pour visualiser et comprendre la diversité et ses changements, on calculera :
top

Articles

Sites.

top

Logiciels

Les logiciels suivants sont librement téléchargeables et très utilisés. R contient également des fonctions dans ce sens. Enfin certains sites proposent des outils en lignes, mais pas aussi puissants.

5/ Litterature : études de biodiversité des micro-organismes.

En construction ...
top

6/ Liens utiles.


Richard Christen. Avril 2006