Corail rouge

Bienvenue sur
PhyloGraphe !

par Damien Aubert Pennequin

Exercices de phylogénétique

Choisissez un exercice. Vous gagnez une étoile pour un exercice lorsque vous le terminez sans aucune erreur. Chaque exercice se présente sous trois niveaux de difficulté : novice, apprenti, expert. Vous pouvez donc gagner jusqu'à trois étoiles par exercice.

Vous pouvez générer un bilan de vos compétences à la fin de votre séance d'exercices (n'oubliez pas d'ajouter votre prénom et votre nom avant de l'imprimer) :

Les relations de parenté :

La disposition des arbres :

La distribution des caractères :

Difficulté :

Identifier le dernier ancêtre commun

Le dernier ancêtre commun (ou ancêtre commun le plus récent) est l'ancêtre le plus récent que deux espèces ont en commun dans l'arbre de l'évolution. Cliquez sur le dernier ancêtre commun de et de .

Difficulté :

Déterminer l'espèce la plus proche

La proximité historique est une mesure de la récence du dernier ancêtre commun entre deux espèces. Plus cet ancêtre est récent, plus les espèces sont considérées comme historiquement proches. Qui de ou de est historiquement le plus proche de  ?

Difficulté :

Trouver l'intrus parmi plusieurs arbres

Dans un arbre phylogénétique l'ordre de lequel les branches partant d'un même ancêtre sont dessinées n'a pas d'importance, cela ne change pas les relations de parenté entre les espèces. Parmi les quatre arbres ci-dessous, trois représentent exactement les mêmes relations de parenté, et un seul représente des relations de parenté différentes. Où se trouve cet intrus ?

Difficulté :

Comparer les enracinements des arbres

Si on déplace la position de la racine dans un arbre phylogénétique alors il ne représente plus les mêmes relations de parenté entre les espèces. Cependant la structure de l'arbre reste identique. La racine a été déplacée dans les quatre arbres ci-dessous. Trois de ces arbres n'ont pas subi d'autres modifications et conservent donc la même structure, tandis qu'un seul a subi une modification supplémentaire, présentant ainsi une structure différente. Comparez les structures de ces arbres et retrouvez celui qui ne possède pas la même structure que les autres.

Difficulté :

Situer les transformations évolutives

Utilisez la distribution du caractère dans la matrice ci-dessous pour déduire sur quelle branche de cet arbre phylogénétique il s'est transformé (apparition ou disparition). Faites un clic gauche sur une branche pour placer la transformation.

Légende :

Absent
Présent
Difficulté :

Associer un arbre à la matrice

Étant donné une matrice de caractères, certains arbres requièrent moins de transformations de ces caractères pour expliquer la distribution observée. C'est le principe de parcimonie : l'explication la plus simple est la meilleure. Comparez la matrice ci-dessous aux quatre propositions d'arbres et sélectionnez le plus parcimonieux.

Légende :

Absent
Présent
  • 1/ Matrice de caractères
  • 2/ Matrice de compatibilité
  • 3/ Graphe de compatibilité
  • 4/ Arbre phylogénétique
  • 5/ Classification des espèces

Étape 1 : Conception de la matrice de caractères

Nom de la collection :

Instructions :

  1. Assignez un état (inconnu, présent, absent, inapplicable) à chaque caractère de chaque espèce en vous aidant des infobulles ou bien des documents fournis par votre professeur.
  2. Les caractères logiquement inapplicables à une espèce ne doivent pas être codés comme absents (par exemple le caractère "yeux" pour une espèce n'ayant pas de tête).
  3. Lorsque la matrice est complétée, décochez les caractères non informatifs (un caractère informatif doit avoir au moins deux états "présent" et au moins deux états "absent").
  4. Verrouillez la matrice pour passer à l'étape suivante, un avertissement s'affichera s'il y a des erreurs de codage (disponible seulement pour les "collections partagées") ou des erreurs d'informativité.

Commandes :

  • Vous pouvez ouvrir une collection contenant une matrice de caractères déjà entièrement ou partiellement complétée.
  • Si vous avez ouvert une collection des infobulles s'affichent lorsque vous survolez les cases de la matrice.
  • Avec un appareil tactile gardez le doigt appuyé sur l'écran pour afficher l'infobulle.
  • Cliquez sur les cases de la matrice pour changer les états des caractères.
Informatif ? →
Caractères →
↓ Espèces

Légende :

❤️ Espèce vivante
💀 Espèce fossile
⚓ Extragroupe
🌿 Intragroupe
Inconnu
Absent
Présent
Inapplicable

Étiquettes des caractères :

Étape 2 : Détermination des paires de caractères compatibles

Instructions :

  1. L'objectif de cette étape est d'identifier les caractères les moins fiables afin de les écarter.
  2. Comparez les états de toutes les paires possibles de caractères informatifs pour déterminer quels caractères sont compatibles entre eux.
  3. Lorsque l'analyse est terminée verrouillez le résultat pour passer à l'étape suivante.

Commandes :

  • L'autocomplétion n'est disponible que pour les très grandes matrices (au moins 12 caractères informatifs).

Compatibilité des paires :

Légende :

Inconnu
Incompatible
Compatible

Analyse de la paire sélectionnée :

Deux caractères binaires sont incompatibles si les quatre combinaisons possibles de leurs deux états sont présentes dans la collection d'espèces (0/0, 0/1, 1/1, 1/0). Sinon ils sont compatibles. Les lignes sont triées automatiquement pour faciliter la lecture de ces quatre combinaisons. Ignorez les lignes contenant des états inconnus ou inapplicables.
Les deux caractères de cette paire sont-ils compatibles ?

Étape 3 : Identification de la clique maximum

Instructions :

  1. Le graphe de compatibilité ci-dessous est automatiquement construit à l'aide de la matrice de compatibilité établie précédemment.
  2. Chaque sommet représente un caractère informatif. Les caractères compatibles sont reliés entre eux par des arêtes.
  3. Vous devez chercher la clique maximum, c'est-à-dire le plus grand ensemble de sommets qui sont tous reliés deux à deux.
  4. Si plusieurs cliques maximums existent, vous devez sélectionner l'intersection de ces cliques maximums, c'est-à-dire l'ensemble des sommets communs à toutes les cliques maximums.
  5. Les sommets sont initialement disposés en cercle, mais vous pouvez les laisser se repousser librement tandis que les arêtes agissent comme des ressorts, cette animation pourrait produire un graphe plus facile à lire.
  6. Lorsque vous avez sélectionné la clique maximum ou l'intersection des cliques maximums verrouillez-la et passez à la dernière étape.

Commandes :

  • Cliquez sur un sommet pour le sélectionner ou le dessélectionner.
  • Gardez la touche MAJ enfoncée pour sélectionner plusieurs sommets.
  • Avec un appareil tactile touchez simplement les sommets que vous voulez sélectionner et double-touchez n'importe où pour réinitialiser la sélection.
  • La sélection automatique n'est disponible que pour les très grands graphes (au moins 12 sommets).

Étape 4 : Construction de l'arbre phylogénétique

Instructions :

  1. Les couleurs des sommets et des branches représentent l'état du caractère comme dans la matrice de caractères.
  2. Pour chaque caractère homologue une unique branche noire épaisse doit séparer toutes les espèces dans un état et toutes les espèces dans l'autre état.
  3. Passez en revue successivement tous les caractères homologues, ajoutez des sommets correspondant aux ancêtres et des branches pour les relier aux espèces.

Commandes :

  • Utilisez le clic gauche pour sélectionner une espèce, gardez la touche enfoncée pour la déplacer.
  • Pour créer ou supprimer un ancêtre cliquez à l'endroit désiré en gardant la touche Ctrl enfoncée (ou Cmd ⌘ sur Mac). Un ancêtre peut être créé directement au milieu d'une branche.
  • Vous pouvez aussi supprimer un ancêtre sélectionné en appuyant sur la touche Suppr.
  • Si une espèce est déjà sélectionnée lors de la création d'un ancêtre alors elle sera automatiquement connectée à ce dernier.
  • Pour créer ou supprimer une branche sélectionnez un sommet puis cliquez sur un autre sommet en gardant la touche MAJ enfoncée.
  • Avec un appareil tactile, double-touchez pour créer ou supprimer un ancêtre, et utilisez deux doigts pour créer ou supprimer une branche entre deux sommets.

Actions sur l'arbre :

Paramètres de l'arbre :

Longueur totale de l'arbre :  transformations

Montrer les caractères :

Légende :

Statut du caractère :

Supposé informatif et homologue
Supposé non homologue
Supposé non informatif

État du caractère :

Inconnu Absent Présent Inapplicable

Arbres stockés :

Étape 5 : Décision de classification

Instructions :

  1. Un groupe peut être entièrement à l'intérieur d'un autre groupe.
  2. Si une espèce fait partie de deux groupes, alors l'un des deux doit être complètement à l'intérieur de l'autre.
  3. Si deux espèces appartiennent à un même groupe, alors le chemin qui relie ces deux espèces doit être totalement à l'intérieur de ce groupe.

Commandes :

  • Ajoutez les boites de la classification une par une pour délimiter vos groupes.
  • Déplacez les coins des boites en maintenant le bouton gauche de la souris enfoncé.
  • Vous pouvez aussi déplacer l'ensemble du cadre de la boite en cliquant sur son étiquette.
  • Une fois que vous avez ajusté les contours d'une boite vous pouvez la nommer.

Actions sur les boites :

Boites délimitant les groupes sur l'arbre :

Montrer les caractères :

Légende :

Statut du caractère :

Supposé informatif et homologue
Supposé non homologue
Supposé non informatif

État du caractère :

Inconnu Absent Présent Inapplicable
  • 1/ Séquences biologiques
  • 2/ Distances phylogénétiques
  • 3/ Dendrogrammes

Étape 1 : Collection des données moléculaires

Instructions :

  1. Chargez des séquences biologiques de même nature (ADN, ARN, ou protéines) déjà alignées.
  2. Verrouillez vos séquences alignées pour passer à la suite, aucune autre opération n'est nécessaire.

Commandes :

  • PhyloGraphe n'est pas une application de traitement des séquences mais vous pouvez utiliser Geniegen 2 si un alignement est nécessaire, puis exporter cet alignement vers PhyloGraphe avec le menu prévu à cet effet.
  • Vous pouvez recoder de manière binaire les substitutions les séquences alignées d'ADN, d'ARN ou de protéines (les caractères non informatifs ou ayant plus de deux états différents sont ignorés, les lacunes sont traitées comme des états inapplicables).
  • Vous pouvez recoder de manière binaire les lacunes dans les séquences alignées d'ADN, d'ARN ou de protéines (les substitutions sont ignorées, les lacunes incluses dans d'autres sont traitées comme des états inconnus).
  • Les séquences de nature binaire peuvent être traitées dans l'onglet suivant avec certaines méthodes de distances, mais elles peuvent aussi être envoyées dans la section morphoanatomique pour effectuer une analyse de compatibilité.
 
 
 
 

Légende :

  • Nature :

  • 🧬 ADN
  • ✉️ ARN
  • 🥩 Protéine
  • 🪙 Binaire
  • Comparaison :

  • * Identité
  • . Différence
  • Bases azotées :

  • A Adénine
  • T Thymine
  • C Cytosine
  • G Guanine
  • U Uracile
  • Acides aminés :

  • RKH Chargés positivement (hydrophiles)
  • DENQ Amides ou chargés négativement (hydrophiles)
  • FYW Aromatiques non chargés (hydrophobes)
  • LVMI Aliphatiques (hydrophobes)
  • AG Minuscules et hydrophobes
  • ST Ayant un groupe hydroxyle (petits et hydrophiles)
  • C Très conservé, capable de former des ponts disulfures
  • P Très conservé, conformation spéciale très rigide

Étape 2 : Calcul des distances

Instructions :

  1. Suivez l'arbre de décision pour choisir la méthode de calcul appropriée pour vos données.
  2. Vous devez essayer différentes méthodes de calcul pour voir si les résultats sont convenables.
  3. Verrouillez votre matrice de distances phylogénétiques lorsque vous en êtes satisfait.

Commandes :

  • Les méthodes les plus simples ont une variance moins élevée, elles sont donc préférables lorsqu'elles décrivent bien les données à analyser.
  • Les valeurs des distances peuvent dépasser 100 %, ce n'est pas un problème.
  • Les messages d'alerte éventuels vous informent sur les propriétés mathématiques non respectées par la matrice des distances, vous pouvez les ignorer si vous ne connaissez pas ces propriétés.

Choix de la méthode :

Les séquences sont-elles alignées ?
  
Oui
Quelle est la nature des séquences ?
  
Nucléotidique
La distance de Hamming normalisée maximale entre deux séquences est...
  
supérieure à 10 %
Les distances calculées par le LogDet sont-elles toutes valides ?
  
Oui

Non



entre 5 et 10 %
Le taux de GC de toutes les séquences est-il proche de 50 % ?
  
Oui

Non



entre 2 et 5 %

inférieure à 2 %



Binaire
 


Peptidique



Non
(k = 10 ; c = ? ; s = ?)


Matrice des distances calculées :

Étape 3 : Construction des dendrogrammes

Instructions :

  1. Choisissez un algorithme de construction (NJ est le plus fiable).
  2. Suivez les étapes de l'algorithme pas à pas.
  3. Vous pouvez comparer les dendrogrammes obtenus avec les différents algorithmes.


Le Neighbor-Joining (NJ) :

Lancez l'algorithme, puis à chaque étape cliquez sur la paire la moins divergente (score le plus négatif) dans la matrice des divergences (matrice violette). Placez une racine à la fin de cette procédure, soit en cliquant sur l'une des branches horizontales, soit en utilisant l'une des deux procédures d'enracinement automatique.


Distance totale (BME) : Transformations (MP) : Écart total (WLS) :


L'UPGMA :

Lancez l'algorithme, puis à chaque étape cliquez sur la paire la plus similaire (distance la moins grande).

Distance totale (BME) : Transformations (MP) : Écart total (WLS) :


Le WPGMA :

Lancez l'algorithme, puis à chaque étape cliquez sur la paire la plus similaire (distance la moins grande).

Distance totale (BME) : Transformations (MP) : Écart total (WLS) :