La métagénomique clinique, nouvel outil de biologie moléculaire, permet de détecter l’ensemble des micro-organismes présents dans tous types de prélèvements. Son utilisation est plus ou moins pertinente selon le type d’infection : infections du système nerveux central, respiratoires, digestives, oculaires, cutanées... Des études supplémentaires sont nécessaires pour déterminer sa place dans l’arsenal diagnostique en infectiologie.
Les méthodes conventionnelles de microbiologie incluent les examens macroscopiques et microscopiques, la culture pour les micro-organismes cultivables, les sérologies, les PCR (polymerase chain reaction) spécifiques ou multiplexes syndromiques, et le séquençage des zones conservées de bactéries (16S) et des champignons (ITS). Ces méthodes ne permettent pas toujours l’identification d’un micro-organisme lors d’une infection. Actuellement, de nombreuses infections restent sans cause identifiée : par exemple, 50 % des méningites et encéphalites.1 En effet, l’utilisation des méthodes conventionnelles peut être limitée par une faible charge microbienne initiale dans le prélèvement, l’administration précoce d’un traitement probabiliste, ou un délai de pousse prolongé.
La métagénomique clinique (MgC) est un nouvel outil diagnostique dans l’arsenal des microbiologistes. Alors que la majorité des tests de biologie moléculaire est spécifique d’un ou plusieurs micro-organismes, la MgC permet de rechercher tous les acides nucléiques présents dans un échantillon et d’identifier ainsi potentiellement tous les micro-organismes.
La MgC peut également permettre de suivre l’évolution génétique du micro-organisme, de déterminer sa phylogénie ou de prédire sa résistance au traitement.2
Mode d’emploi de la métagénomique clinique
La MgC peut être réalisée sur tout type d’échantillons cliniques (sang, urine, prélèvements respiratoires, prélèvements profonds, liquide céphalorachidien [LCR], biopsies).
Analyses biologiques
Extraction des acides nucléiques et préparation des banques
La première étape consiste à extraire tous les acides nucléiques (ADN et ARN) présents dans l’échantillon. Après l’extraction, des banques de séquençage sont construites, consistant en la fragmentation en petites séquences d’ADN, l’ajout d’adaptateur et d’index, une amplification et une purification des acides nucléiques. Les banques sont ensuite chargées sur une plateforme de séquençage.
Séquençage
La MgC repose sur les nouvelles technologies de next generation sequencing (NGS), ou séquençage haut débit, permettant de générer un très grand nombre de séquences. La méthode la plus connue est le séquençage par amplification en pont (Illumina), générant des séquences courtes (environ 300 paires de bases [pb]). Récemment, de nouvelles méthodes de séquençage dites de troisième génération (Pacific Biosciences et Nanopore) sont apparues, perrmettant de séquencer des séquences plus longues (plusieurs dizaines de kilobases).
En MgC, l’utilisation des analyses non ciblées de type shotgun sont privilégiées. Elles ne nécessitent pas d’amplification ciblée et permettent de séquencer la totalité de l’ADN et/ou de l’ARN, et peuvent ainsi identifier tous types de micro-organismes (bactéries, virus, champignons, parasites) en un seul test. Malgré des quantités élevées de micro-organismes dans certains compartiments comme le tube digestif, la taille du génome humain est 100 à 106 fois plus grande que celle des génomes microbiens et il est donc présent en quantité plus importante. Il constitue la majorité de l’ADN et de l’ARN séquencé. Les acides nucléiques des micro-organismes représentent en général moins de 1 % de la totalité des acides nucléiques présents dans l’échantillon.
Analyses bio-informatiques
Les technologies de NGS génèrent un nombre de données important, demandant des capacités de stockage et de traitement conséquentes. Les séquences obtenues après séquençage sont appelées reads. Compte tenu de la relativement faible quantité d’acides nucléiques microbiens présents dans les échantillons cliniques, la documentation microbiologique nécessite un nombre important de reads. Après avoir éliminé les reads ne respectant pas les critères de taille et de qualité de séquençage, ainsi que ceux apparentés au génome humain, les reads restants sont comparés aux séquences contenues dans des bases de données taxonomiques bactériennes, virales, parasitaires et fongiques afin d’identifier les micro-organismes présents dans l’échantillon. De plus, peuvent être réalisées des analyses phylogénétiques, de recherche de supports de résistance et de virulence ainsi que des analyses transcriptomiques microbiennes (fig. 1).