Comment le séquençage de nouvelle génération et l’analyse de données à échelles multiples transformeront la gestion des maladies infectieuses

Des études récentes ont examiné dans quelle mesure le séquençage séquentiel de nouvelle génération sur des échantillons cliniques améliorera les capacités des laboratoires de microbiologie clinique à court terme, mais n’explore pas l’intégration de NGS avec des données cliniques issues des dossiers médicaux électroniques, des données immunologiques d’autres ensembles de données riches pour créer des modèles prédictifs multi-échelles Cette revue présente une gamme de sources «omiques» et de données de patients pertinentes pour gérer les infections et propose des applications potentiellement perturbatrices pour ces données dans le flux de travail clinique. peut être traité par une analyse multi-échelle des données END et EMR qui est idéalement mise à jour et affinée au fil du temps dans chaque organisation de soins de santé Ces données et analyses devraient constituer la pierre angulaire des futurs systèmes de santé d’apprentissage pour les maladies infectieuses

Séquençage du génome entier, infections nosocomiales, infections nosocomiales, dossiers médicaux électroniques, analyse multiéchelle Le séquençage de la génération suivante et les techniques d’analyse «big data» peuvent transformer notre compréhension des maladies qui ont une composante héréditaire complexe, comme le cancer, le diabète, et l’insuffisance cardiaque L’impact de ces technologies sur la gestion des maladies infectieuses, qui ont des causes distinctes et identifiables pouvant être isolées, cultivées et testées contre des médicaments in vitro dans le cadre d’un flux clinique standard, est peut-être encore plus significatif. Notre capacité à acquérir des données « omiques » sur les infections augmente de façon exponentielle. La parallélisation à l’échelle nanométrique du séquençage de l’ADN a fait chuter de façon abrupte le coût par paire de génomes finis tout en augmentant le débit, et le coût du séquençage et de l’assemblage d’une génération bactérienne Le séquençage de PacBio RS a augmenté les longueurs de lecture médianes à plus de kbp, facilitant la finition automatique et automatisée des génomes pour les agents pathogènes de la flambée Des études récentes ont utilisé des techniques expérimentales « omiques » telles que les cytokines Luminex, le séquençage de l’ARN et cytométrie de masse pour caractériser les réponses immunitaires à l’infection ou la vaccination avec une précision remarquable Applications potentielles de cette gamme de classer les infections respiratoires aiguës chez les enfants prédire l’immunogénicité d’un vaccin De nombreuses bases de données publiques curate et disséminer Les DME peuvent potentiellement atténuer ce problème car ils incluent généralement des données démographiques, des médicaments, des résultats de laboratoire, etc. Cependant, de nombreuses parties prenantes différentes saisissent les données du DME, extrayant automatiquement certains faits, par exemple: « Ce patient a eu la grippe dernière Tu Les méthodes de haute précision pour extraire des phénotypes infectieux tels que les syndromes grippaux , le statut VIH du virus de l’immunodéficience humaine et la pneumonie acquise dans la communauté ont été démontrées, et des consortiums comme eMERGE Electronic Les dossiers médicaux et la génomique normalisent la comparaison, la validation et le dépôt de ces algorithmes dans un référentiel central

Exemples de bases de données bioinformatiques publiques pouvant être utilisées pour l’analyse multi-échelle des maladies infectieuses Base de données pour la recherche générale sur les maladies infectieuses Multipathogènes génomes pathogènes spécifiques NCBI Nucleotide GenBank / RefSeqENA / EMBLDDBJ ViPRNMPDRPATRICEuPathDB Base de données sur la recherche sur l’influenzaTuberculose DatabaseLan: bases de données pour le VIH, le VHC et le HFV Produits géniques et fonctionnalités UniProtKEGG Base de données d’interaction hôte pathogène Base de données sur la résistance aux antibiotiques Base de données exhaustive sur la résistance aux antibiotiques Expression et profils immunitaires GEOArrayExpress ImmPort Base de données pour la recherche générale sur les maladies infectieuses Multipathogènes Genomes spécifiques aux pathogènes NCBI Nucleotide GenBank / RefSeqENA / EMBLDDBJ ViPRNMPDRPATRICEuPathDB Influenza Research DatabaseTuberculose DatabaseLang: Base de données pour Produits et fonctionnalités du gène VIH, VHC et HFV Base de données d’interaction hôte pathogène UniProtKEGG Base de données sur les gènes de résistance aux antibiotiquesInteraction complète Base de données de résistance iotique Expression et profils immunitaires GEOArrayExpress ImmPort Des citations pour des bases de données individuelles peuvent être trouvées dans les données supplémentaires: DDBJ, DNA Data Bank of Japan; ENA / EMBL, Laboratoire européen des nucléotides / Laboratoire européen de biologie moléculaire; EuPathDB, base de données des pathogènes eucaryotes; GEO, expression génique omnibus; VHC, virus de l’hépatite C; HFV, virus de la fièvre hémorragique; VIH, virus de l’immunodéficience humaine; ImmPort, base de données d’immunologie et portail d’analyse; KEGG, Kyoto Encyclopédie des gènes et des génomes; LANL, Laboratoire national de Los Alamos; NCBI, Centre national d’information sur la biotechnologie; NMPDR, ressource nationale de données sur les pathogènes microbiens; PATRIC, Centre d’intégration des ressources Pathosystems; ViPR, Base de données sur les pathogènes viraux et analyse Resourcea Liste non exhaustiveVue LargeLe mariage de l’information clinique numérique en temps réel avec la technologie «omics» permet d’accroître la précision de la prise de décision clinique et nous incite à concevoir et exécuter rapidement des analyses bioinformatiques. Les maladies infectieuses qui intègrent les données EMR sont encore rares, bien qu’une étude récente ait établi un réseau social d’infection nosocomiale à partir de données EMR utilisant des contacts enregistrés entre patients et soignants. CDI qui surpasse les modèles basés uniquement sur des risques médicalement reconnus Probablement en raison de la difficulté d’intégrer des données à travers plusieurs niveaux, aucune étude publiée n’a encore établi de lien entre modélisation prédictive et données EMR avec des séquences génomiques pathogènes ou d’autres données « omiques ». , pour maladie infectieuse, est exactement ce qui remplira la vision d’un système de santé à apprentissage rapide qui convertit les sous-produits informatifs des soins de santé enregistrés par les praticiens en données probantes pour la prise de décisions futures considérant que les données EMR contiennent des détails sur le processus clinique et les résultats Ils permettent de revenir à la physiopathologie et aux interactions spécifiques hôte-pathogène présentes chez chaque patient. Ensemble, ils peuvent alimenter un «moteur d’apprentissage» intégrant des données hétérogènes dans de nouvelles perspectives, interventions et thérapies cliniques. Nous verrons comment tirer parti des logiciels bioinformatiques actuels pour construire un tel moteur, et comment ce moteur sera en mesure d’attaquer les problèmes actuellement insurmontables sur le terrain

LE LABORATOIRE DE MICROBIOLOGIE CLINIQUE GENOMIQUE

Des revues antérieures ont proposé que la technologie de séquençage à bas prix transforme la microbiologie clinique, tout en reconnaissant les obstacles techniques et informationnels à l’adoption. Le séquençage du génome entier par NGS fournit une résolution ultime pour les études épidémiologiques de transmission et de parenté. Cependant, pour l’identification des agents pathogènes, il est peu probable que le NGS utilise des systèmes de culture robotisés tels que Vitek et BD Phoenix ou des systèmes de spectrométrie de masse plus récents uniquement pour comparer les coûts et les sensibilités. identifier des agents pathogènes nouveaux ou rarement vus Comme la sensibilité ou la résistance d’un organisme aux médicaments est en principe entièrement codée dans son matériel génétique , l’END peut aussi réduire les délais d’essai de sensibilité aux microorganismes à croissance lente tels que Mycobacterium tuberculose et le type de VIH Cette stratégie devrait seulement s’étendre à des catalogues plus complets de génomique les bactéries responsables de la résistance aux médicaments sont compilées pour d’autres organismes pathogènes

Tirer parti des outils bioinformatiques existants

Un obstacle souvent mentionné pour l’utilisation généralisée des NGS en microbiologie clinique est le manque de logiciels facilement accessibles pour convertir ces données en identifications d’espèces, phylogénies et susceptibilités médicamenteuses. Cependant, de nombreuses solutions bioinformatiques ouvertes à maturité pour les composants individuels de ces Les exemples de la plupart des sous-tâches sont énumérés dans le tableau Comme l’utilisation de NGS par les laboratoires de microbiologie clinique devient plus courante, on pourrait s’attendre à ce que les progiciels de microbiologie clinique génomique à part entière deviennent largement répandus. disponible

nologie; MIRA, imitant l’assemblage de lecture intelligent; NCBI, Centre national d’information sur la biotechnologie; RAxML, Randomized Axelerated Maximum Likelihood; RAST, annotation rapide utilisant la technologie du sous-système; SNP, polymorphisme mononucléotidique Liste non exhaustive Des outils bien établis sont disponibles pour de nombreuses sous-tâches spécifiquesVueCette attente comporte des lacunes prévisibles La première est que les outils actuels sont liés à des référentiels de preuves centralisés Bien que les défenseurs de la microbiologie clinique génomique envisagent souvent des bases encyclopédiques hébergées par des consortiums internationaux , la conservation humaine est coûteuse et inefficace à grande échelle, et de nombreuses maladies infectieuses sont des phénomènes spécifiques aux régions. Les modèles fondés sur des données regroupées peuvent ne pas refléter la variation entre les régions de prestation de soins Par exemple, un modèle de fitness récent basé sur des données de surveillance génomique internationale ne crée des prédictions que sur la résolution de clades couvrant plusieurs continents car la mise en œuvre de NGS dans un laboratoire de microbiologie produit des données de séquençage copieuses Au fil du temps, au fur et à mesure que les interfaces d’échange de données seront développées, les institutions pourraient former des consortiums pour généraliser les analyses, une stratégie qui a réussi à accroître le pouvoir du génome humain dans son ensemble. Une deuxième lacune est que les outils actuels d’annotation de pathogènes font principalement des prédictions en utilisant le critère simpliste de similarité de séquence. Les algorithmes de ML pourraient éventuellement intégrer un plus large éventail de caractéristiques génotypiques extractibles des génomes pathogènes: si des annotations, et plus – et former des modèles holistiques qui prédisent les phénotypes Un modèle intégrateur «top-down», prédisant des phénotypes limités de génotypage pour Mycoplasma genitalium est disponible ; Cependant, les modèles de virulence ML à l’échelle du génome ont été pour la plupart «ascendants», aveugles à la connaissance mécaniste, et orientés vers des pathogènes de plus petit génome avec des gènes génomiques considérables. les données de surveillance ML sur les caractéristiques des séquences virales ont prédit des combinaisons antirétrovirales plus efficaces pour le VIH , des marqueurs génétiques pour la sélectivité de l’hôte dans les familles de virus , et une sélection optimale des souches pour les vaccins antigrippaux HN. Il existe encore un important potentiel inexploité pour les modèles ML qui prédisent la virulence, la transmissibilité et la pharmacorésistance des génotypes pathogènes. Le troisième inconvénient est que pour de nombreux pathogènes communs, ces modèles sont encore limités par la rareté des métadonnées cliniques liées aux pathogènes séquencés. à partir des DME comprennent des variables pronostiques, telles que la durée du séjour et la disposition, un Les données de laboratoire exportées à partir des systèmes d’information de laboratoire peuvent aider à définir des phénotypes plus riches. Pour certaines maladies, les DME contiendront des résultats de laboratoire qui reflètent directement l’infection. gravité, par exemple, charge virale pour le virus de l’hépatite C et le VIH , alors que d’autres maladies nécessiteront des critères plus complexes [,,] Le traitement des notes médicales facilitera l’extraction de phénotypes cliniques complexes et de haute précision. Les études de routine sur les médicaments prescrits et administrés permettront des études ponctuelles de croisements entre génotypes pathogènes et interventions et résultats. Une caractérisation plus poussée de certaines interactions hôte-pathogène peut être fournie par le profilage immunologique et moléculaire de patients sélectionnés, ainsi que par des expériences sur des animaux. établir des associations génétiques pathogènes individuelles et mo Les biomarqueurs dérivés de telles données pourraient améliorer les modèles prédictifs basés sur une intégration zélée des données NGS et EMR. L’augmentation des phénotypes EMR associés aux génomes pathogènes stimulera une nouvelle génération de modèles de pathogénicité et de risque basés sur les données génomiques sucre inverti. Conduire un «moteur d’apprentissage» qui intègre des données d’entrée hétérogènes à partir d’une rencontre avec un patient infecté et prédire les résultats d’interventions possibles. Les pronostics peuvent être délivrés aux médecins via des systèmes d’aide à la décision clinique complétant les fonctions EMR. La boucle EMR-NGS-EMR devrait être le but ultime des pipelines bioinformatiques pour la microbiologie clinique génomique, car cela maximiserait l’utilité des données créées pour les rencontres cliniques, en continuant à mettre en évidence les observations et les résultats d’hier pour les prédictions de demain

Les technologies NGS permettent maintenant l’analyse génomique de routine des échantillons de microbiologie clinique Lorsqu’elles sont intégrées aux phénotypes pathogènes dérivés des métadonnées cliniques dans les dossiers médicaux électroniques EMR et les métadonnées de laboratoire, nous pouvons générer des modèles prédictifs pour les agents pathogènes. Si les stratégies de prise en charge sont formulées à partir de ces prévisions et envoyées aux médecins des maladies infectieuses et au contrôle des infections hospitalières, une stratégie de lutte continue contre les infections, les infections, les infections et les infections. La boucle de l’analyse des données, de l’application et de l’affinement des modèles est crééeFigure View largeDownload slideA apprendre le système de santé pour les maladies infectieuses Séquençage de nouvelle génération Les technologies NGS permettent maintenant l’analyse génomique de routine des spécimens cliniques de microbiologie Lorsqu’elles sont intégrées aux phénotypes pathogènes dérivés de métadonnées cliniques dans les dossiers médicaux électroniques et les métadonnées de laboratoire, nous pouvons générer des modèles prédictifs de transmission pathogène, d’épidémies, de pharmacorésistance, de virulence et de facteurs de risque d’infection ou de résultats critiques spécifiques au système de santé et à sa population de patients. les stratégies sont formulées à partir de ces prédictions et envoyées aux médecins des maladies infectieuses et le contrôle des infections hospitalières, une boucle continue d’analyse des données, l’application et l’affinement du modèle est créé.Cela semble ambitieux, mais nous pouvons regarder à des logiciels analogues conçus comme sous-composants anticiper les coûts probables et les possibilités de développement La plate-forme informatique d’IB et sa contrepartie SCILHS Scalable Collaborative Infrastructure pour un système de santé apprenant sont des solutions indépendantes des fournisseurs pour extraire et unifier les données à travers les DME afin de les réutiliser dans la conception de cohorte. et méta-analyse robuste Le consortium eMERGE a stimulé la création de projets de recherche avancée en santé numérique SHARPn pour la normalisation et le traitement du langage naturel des données EMR et CLIPMERGE Mise en œuvre clinique de la médecine personnalisée par les dossiers médicaux électroniques et la génomique pour les alertes pharmacogénomiques automatisées. a été créé après – des années de développement avec des subventions publiques annuelles de $ – $ millions [- -] Si le logiciel open source susmentionné est mis à profit, une échelle égale de financement public et de collaboration entre les centres médicaux universitaires pourrait faire des progrès similaires. La structure modulaire a permis à l’IB de s’étendre organiquement après la publication initiale , suggérant que les stratégies efficaces devraient d’abord viser des tâches simples mais cliniquement utiles telles que l’identification des espèces et des transmissions. Contributions En bref, un reasonab L’investissement dans le génie logiciel scrupuleux pourrait produire les germes d’un système d’apprentissage de la santé pour les maladies infectieuses au cours de la décennie.

IMPACT SUR LA GESTION CLINIQUE

Trois applications concrètes de cette stratégie abordent les problèmes mondiaux urgents des maladies infectieuses Un des problèmes est l’augmentation de la résistance aux antimicrobiens, que l’Organisation mondiale de la santé considère comme l’une des plus grandes menaces pour la santé humaine. blâme, avec des études récentes estimant la fraction de mésusage entre un quart et la moitié de tous les traitements La multirésistance augmente la morbidité et la mortalité des infections nosocomiales, qui ont une incidence de millions de cas par an États-Unis et un coût annuel estimé à plus d’un milliard de dollars qui éclipse le coût probable de tout effort de prévention basé sur l’informatique. La menace sérieuse des organismes circulants largement résistants aux médicaments, dont certains ont un taux d’échec thérapeutique de , modifie l’analyse des risques pour les procédures hospitalières une fois considéré comme de routine et appelle à de nouvelles stratégies de gestion

Identifier les patients à haut risque pour les infections nosocomiales

Le contrôle des infections pour les IAS dépend de l’identification des patients à haut risque et de l’application de précautions d’isolement ou de la réduction des facteurs de risque connus pendant l’hospitalisation. Pour le CDI, l’infection nosocomiale la plus fréquemment signalée aux États-Unis. [La notion prédominante selon laquelle les infections sont principalement transmises de personne à personne dans les hôpitaux entre en conflit avec les données récentes de l’END montrant que les sources d’infection sont plus diverses , suggérant un rôle accru pour les patients colonisés asymptomatiques et les sources environnementales système représente un milieu unique de réseaux de contact de personne à personne, de surfaces contaminées, de microbiomes et de colonisation asymptomatique qui contribue au risque d’ICD. Les données des DME et des NGS peuvent prouver ou infirmer la transmission entre patients et dévoiler les secrets des facteurs de risque modifiables. ces algorithmes ML environnement chaotique prédire le risque individuel de CDI pour un grand hôpital a réalisé une meilleure zone sous la courbe caractéristique de fonctionnement du récepteur [AUC] = lors de l’opération sur & gt; Des modèles de LM similaires basés sur les données EMR entre et pour The Mount Sinai Hospital à New York, englobant les patients et les diagnostics CDI, montrent des performances égales AUC = et tirent des associations qui ne sont généralement pas publiées pour le CDI Ils peuvent être uniques à l’environnement du mont Sinaï et inclure le rapport de cotes d’insuffisance respiratoire [OR],; % intervalle de confiance [IC], -, irrégularité nutritionnelle OU,; % CI, -, et pancytopénie OR,; % IC, – Timothy O’Donnell, communication personnelleUn système d’aide à la décision basé sur un modèle permettrait de dépister les patients présentant une ICD plus élevée ou une probabilité de colonisation asymptomatique et de permettre un diagnostic et une intervention plus précoce des événements de transmission confirmés par NGS et des interactions entre EMR et autres. Les données pourraient étendre ce modèle de base pour mettre en évidence les facteurs communs derrière la transmission vérifiée et informer les modifications empiriques en temps réel de la politique de contrôle des infections. L’analyse transversale par phénotypes NGS et les facteurs de risque faciliteraient la prise de décision clinique plus précise. , si le raccourcissement du temps du patient dans les unités de soins intensifs ou la diminution de l’utilisation d’antibiotiques provocateurs serait plus préventif dans le milieu local À court d’un essai clinique qui est probablement impossible à reproduire, beaucoup moins présent, donc un modèle quantitatif localisé peut seulement aider

Détection précoce des éclosions à l’intérieur et à l’extérieur de l’hôpital

Les suites logicielles de contrôle des infections actuelles telles que VigiLanz Dynamic Monitoring Suite et TheraDoc Infection Control Assistant émettent principalement des alertes épidémiologiques basées sur les seuils de fréquence d’infection Ceci peut être rendu obsolète par la NGS de routine des échantillons cliniques de microbiologie, qui détermine avec précision si un événement de transmission s’est produit. ,] Un système logiciel avec accès aux DME et autres données hospitalières pourrait rechercher automatiquement des éléments communs entre cas de transmission vérifiés, soignants, équipements ou salles et alerter le personnel pour inspecter ces éléments avant qu’ils produisent suffisamment de transmissions pour déclencher une alerte de seuil de fréquence. Le NGS pourrait également aider les hôpitaux à différencier les infections acquises par la communauté et par les hôpitaux et à affiner ainsi les mesures utilisées pour évaluer les politiques de contrôle des infections. Un effort actif pour échantillonner l’environnement à l’intérieur et à l’extérieur de l’hôpital L’hôpital échantillonne également l’écosystème pathogène de la population locale Les hôpitaux signalent déjà les diagnostics d’infections hautement transmissibles et dangereuses aux autorités gouvernementales et partagent les données de l’END. car ces cas permettraient une évaluation en temps réel de l’origine des pathogènes, de leur évolution et de la localisation des populations naïves pour un agent pathogène. Les efforts actuels de cartographie et de surveillance seraient grandement améliorés par des informations phylogénétiques riches, permettant des épidémies disparates. régions à relier [,,] Un suivi en temps réel de la propagation des maladies infectieuses informerait mieux les médecins qui diagnostiquent et traitent de nouveaux patients, les agents de terrain qui suivent les cas et les contacts, et les responsables des politiques de santé qui cherchent des mesures préventives.

Intendance antimicrobienne

Les systèmes d’aide à la décision pour l’antibiothérapie empirique ont été étudiés pendant des décennies , mais avec la prévalence de la résistance aux antimicrobiens qui monte en flèche, l’urgence de mettre en place des systèmes qui encouragent spécifiquement les antibiotiques a augmenté . Une stratégie plus agressive pousse les alertes EMR chaque fois que les médecins prescrivent un traitement antibiotique incompatible avec les meilleures pratiques Ces solutions ignorent la puissance du DME pour fournir des preuves qui justifient ou améliorent les interventions de gestion des antimicrobiens. Par exemple, bien qu’il soit généralement admis que la surutilisation des antibiotiques augmente la prévalence de la résistance, les programmes actuels de gestion des antimicrobiens n’ont démontré aucun effet sur les résultats des patients ni même qu’une diminution du traitement antibiotique entraîne une diminution de la résistance aux antibiotiques. Les NGS peuvent révéler et énumérer les mécanismes génétiques de la résistance circulant dans un système de santé en traçant la récurrence des agents pathogènes dans la communauté locale, un système de santé équipé de NGS. Inversement, étant donné les données longitudinales suffisantes, les efforts d’un programme de gestion des antimicrobiens peuvent être validés en observant une diminution de l’émergence de la résistance. mutations à des médicaments prescrits plus prudemment

CONCLUSIONS

L’accès routinier aux données génomiques des pathogènes va transformer notre capacité à gérer les infections, mais seulement si nous pouvons intégrer ces informations avec des données cliniques et autres pour alimenter les modèles prédictifs des résultats critiques. En supposant que les coûts, la précision et les délais peuvent être résolus, La spécificité sans précédent de ces données permettra à court terme de reconstruire les réseaux de transmission à l’intérieur et à l’extérieur des hôpitaux. À long terme, de riches données cliniques liées aux génotypes pathogènes seront bientôt disponibles. Intégration de ces capacités dans un nouveau flux de travail clinique qui affine activement les modèles prédictifs en s’adaptant aux nouvelles données. Figure devrait améliorer la gestion des cas, la prédiction des risques pour les infections nosocomiales, la détection des éclosions et la prédiction du pronostic, la virulence et la prédisposition aux infections actives. , et la gestion des antimicrobiens. Le chaînon manquant cette transformation, et le but de la réaliser, est un logiciel qui exploite les meilleurs outils existants, incorpore tous les types de données hétérogènes pertinentes, s’appuie sur des algorithmes de phénotypage électronique pour nettoyer les données EMR de faible précision et valide contre le cas clinique standard Les menaces posées par la multirésistance aux médicaments et les infections associées aux soins de santé exigent une révolution dans la stratégie de gestion La modélisation prédictive fondée sur des données moléculaires et cliniques riches et variées entraînera une révolution dans la gestion des maladies infectieuses. augmenter la précision des soins et aider à tenir ces menaces à distance

Remarques

Remerciements Nous remercions Deena Altman, Shirish Huprikar et les membres du Pathogen Surveillance Program du Mount Sinai pour leurs suggestions critiques sur le manuscrit. Soutien financier Les deux auteurs ont été soutenus par Icahn Institute for Genomics et Multiscale Biology au Mont Sinaï Conflit d’intérêts potentiel. ConflitsLes deux auteurs ont soumis le formulaire ICMJE pour la divulgation des conflits potentiels de conflits d’intérêts que les éditeurs considèrent pertinents pour le contenu du manuscrit ont été divulgués