Profondeur | équipe CMU Professeur Xing Bo, puis une nouvelle réalisation: l'utilisation des technologies d'apprentissage pour prédire la profondeur des médicaments de décharge

Lei Feng nouvelles du réseau, avec le développement rapide des systèmes de dossiers de santé électroniques (DSE) et les nouvelles sources de données de soins de santé, les données médicales et de santé est apparu en grand nombre. Volume de données et se développer de la complexité, l'analyse médicale et la prise de décision devient beaucoup de temps, sujettes à l'erreur, et non idéal. Dans une variété de prise de décisions cliniques, le développement d'un traitement idéal est un élément vital et très difficile. Même en partant du principe du diagnostic, les médecins doivent encore continuer à optimiser la durée du plan de traitement du patient.

Où après que les patients sont sortis de l'admission à l'hôpital pour prédire des médicaments est une prise de décision clinique importante, elle aide les types de régimes de médecin des médicaments, et a décidé lors d'une hospitalisation quand commencer ou arrêter le médicament, car il faut du temps pour ajouter des médicaments ou d'autres drogues pour gérer les paramètres. Cela peut être une décision difficile pour les médecins, car les informations disponibles au moment de l'admission est limitée.

Lei Feng réseau a signalé il y a quelques jours « l'équipe CMU Professeur Xing Bo dernières réalisations: l'utilisation de la génération automatique de rapports AI d'imagerie médicale. » Récemment, l'équipe a une nouvelle réalisation, étude approfondie de la façon d'utiliser des techniques d'apprentissage pour aider les médecins à prédire leurs médicaments de décharge en fonction des dossiers médicaux en matière d'information sur la santé du patient. Ils ont conçu une convolution réseau de neurones pour analyser les dossiers médicaux, puis prédire les médicaments d'un patient à la sortie.

Lei réseau apprenais, modèle sémantique peut être extrait et caractérisé du texte non structuré dans le bruit, et peut apprendre automatiquement corrélation pharmacologique entre les différents médicaments. Équipe sur 25000 copies des dossiers médicaux des patients ont été évalués dans ce modèle, et comparé à quatre types de modèles standards. Macro F1 sur les scores moyens, la meilleure méthode par rapport au modèle de référence augmentation de 20%.

Deux difficultés majeures avec des médicaments et prévisions déchargée étude approfondie

Dans le processus d'apprentissage à utiliser la profondeur de décharge prédire le temps de traitement médicamenteux d'admission, il y a deux difficultés. Tout d'abord, la plupart des informations de traitement disponibles est des dossiers médicaux non structurés (appelés dossier d'admission), tels que les antécédents médicaux, les antécédents familiaux, les allergies et ainsi de suite. Par rapport aux données structurées et les données des signes de laboratoire et d'autres informations, un tel traitement de texte de forme libre et une machine plus difficile à comprendre. De plus, ces documents comprennent également des synonymes, des abréviations et des fautes d'orthographe. Par conséquent, à partir de ces bruyants et des textes non structurés extraire efficacement le modèle sémantique est le premier problème que nous devons résoudre.

En second lieu, dans la pratique clinique, afin de guérir rapidement et efficacement la maladie, en utilisant souvent deux ou plusieurs médicaments ou combinaison de nombreux programmes sont largement reconnus dans les directives de traitement clinique ou un consensus d'experts. Par exemple, les patients d'AVC ont pris l'aspirine, afin de prévenir efficacement la réapparition d'accident vasculaire cérébral, le médecin recommandera bithérapie antiplaquettaire (thérapie antiplaquettaire), qui est, tout en prenant de l'aspirine et le clopidogrel. De nombreuses études montrent que l'apparition et le pronostic de la mort a une certaine influence de la thérapie multiple combinaison de médicaments pour la progression de la maladie. Comment découvrir automatiquement et profiter de cette corrélation entre le médicament, pour une prévision plus précise de plusieurs médicaments est crucial, et ce qui est très précieux.

méthode

Conception de l'étude

Avant les patients recueilli unité de soins intensifs (USI) des dossiers de santé électroniques ont été étudiés de manière rétrospective (étude rétrospective), selon les dossiers médicaux construit un modèle pour prédire les médicaments de la profondeur de décharge d'étude. Nous avons comparé la différence entre le médicament et le médicament le médecin donne le modèle et les quatre modèles de référence d'autres prédisent, pour évaluer la performance du modèle.

Les données pré-traitement

L'étude a utilisé l'accent MIMIC-III ensemble de données et les huit types d'agents anti-hypertenseurs apparaît dans lesquels: métoprolol (métoprolol), le furosémide (furosémide), le lisinopril (lisinopril), l'amlodipine ( amlodipine), l'aténolol (atenolol), hydrochlorothiazide (hydrochlorothiazide), le diltiazem (diltiazem), le carvedilol (carvedilol).

Ces médicaments sont choisis en fonction des considérations suivantes: Premièrement, ces médicaments sont souvent utilisés pour l'hypertension artérielle traitement - l'un des plus commun et la plupart des maladies chroniques graves, elles sont très répandues dans le MIMIC-III. En second lieu, ils sont difficiles à prévoir: leur prescription et de l'utilisation varient considérablement, surtout quand ils sont utilisés ensemble, ce qui les rend un bon banc d'essai de notre approche. La fréquence de ces médicaments est déséquilibré (comme représenté sur la Figure 1): dans laquelle certaines des fréquences très fréquemment, tandis que d'autres sont de petite fréquence, ce qui ajoute une autre couche de difficulté. Il est à noter que, tant qu'il y a suffisamment de données cliniques, notre méthode peut être facilement étendu à d'autres types de médicaments.

Figure 1.8 antihypertenseurs dans l'ensemble de données de fréquence MIMIC-III, Hctz hydrochlorothiazide est un raccourci

modèle de conception

Nous avons mis au point un modèle d'apprentissage en profondeur pour prédire les médicaments de décharge en fonction des informations disponibles au moment du traitement. L'entrée du modèle des dossiers médicaux, la sortie est un médicament du patient déchargée (un ou plusieurs). Ce modèle comprend deux fonctions: l'extraction efficace de la sémantique de haut niveau et bruyante de l'original texte non structuré peut être considéré de manière appropriée et la structure de séquence entre les mots consécutifs, en deuxième lieu, le modèle peut apprendre de différents médicaments pertinence pharmacologique.

Afin d'atteindre simultanément ces deux objectifs, nous avons mis au point un modèle de réseau de neurones (CNN) à convolution. Du haut niveau, le modèle: 1) en utilisant une pluralité de couches empilées d'unités cachées pour obtenir fiche d'entrée sémantique latente; 2) à l'aide de différents opérateurs de convolution de fenêtre pour obtenir un n-gramme sémantique partiel dans la présente séquence et de la structure; 3) peuvent être trouvés dans le facteur implicite commun pour obtenir une étude pharmacologique de la corrélation entre le médicament.

Le type d'informations disponibles lors de l'affichage 8 types de colonne de gauche de traitement, chaque ligne de l'afficheur colonne de droite le MIMIC-III extraire cette information correspondant à la chaîne de caractères de titre

Figure modèle 2.CNN de l'architecture réseau

résultat

Des scores macro et micro-moyenne sur deux types de moyenne F1 regard, CNN il y a beaucoup plus élevé que le taux pour tous les autres points de référence de modèles précis. F1 entre les deux scores moyens, CNN mise à niveau sur la macro moyenne plus importante. CNN sur sept médicaments ont été les meilleurs scores F1. Furosémide est la seule exception, où le RF a surperformé CNN. CNN par rapport à la promotion de la référence se reflète principalement dans le rappel (rappel), et sa précision est comparable au modèle de base. Dans tous les types de modèle de référence, seul le traitement médicamenteux comme perceptron multicouche (MLP) est entré dans la pire performance de la moyenne moyenne micro et macro F1, En outre, la machine à vecteurs de support non-linéaire (SVM) et les performances RF supérieures modèle de régression logistique linéaire (LR).

CNN par rapport aux autres scores de référence de plus élevé à partir de la structure hiérarchique de la couche cachée. structure permet une telle CNN peut extraire des informations sémantiques pertinentes sur une variété de taille des particules (niveau de mot et le niveau de texte de niveau de phrase).

Mettre en place et évaluer

Modèle de base : Nous CNN modèle avec le modèle SVM, RF et LR pour comparer trois catégories. Et CNN, ces modèles manquent de l'apprentissage automatique de la représentation sémantique du texte ou des mécanismes pour capturer la corrélation entre les médicaments. Ces modèles caractéristiques d'entrée extraites de la fréquence terme record enregistré et la fréquence du document inverse (TF-IDF) vecteur. (Lei Feng réseau Note: TF-IDF est une méthode statistique permettant d'évaluer l'importance d'un mot ou d'un corpus L'un des documents sur l'importance du mot tel qu'il apparaît dans le fichier à un ensemble de fichiers. le nombre est proportionnel à l'augmentation, mais aussi diminuer à mesure que la fréquence est inversement proportionnelle à son apparition dans le corpus).

Comme observé dans la pratique clinique, l'hôpital a admis un médicament étroitement lié à la drogue, et parfois il y a un grand chevauchement. On peut se demander, juste assez pour prédire si le médicament a été libéré sans avoir besoin d'autres types d'informations d'admission, tels que les antécédents médicaux et la plainte principale sous une drogue à l'hôpital. Pour répondre à cette question, nous comparons à une autre base, en utilisant uniquement des médicaments admission en entrée et en utilisant Multilayer Perceptron (MLP) pour prédire le médicament de décharge.

Indicateurs d'évaluation: Afin d'évaluer la performance du modèle, nous avons mesuré la précision de la classification (médicaments) sur l'ensemble de test, le rappel micro-moyenne et F1 scores et les scores de toute classification des drogues et des macros moyenne. Étant donné que la fréquence des classes de médicaments sont fortement déviés (Figure 1), micro-moyenne (qui est propice à la catégorie fréquente) peut sous-estimer la fréquence catégorie d'erreurs, la valeur moyenne de la macro peut mieux révéler les classes de modèle rarement la performance.

résultat

Différents modèles de médicaments anti-hypertenseurs ont évalué cinq fois, se trouve dans le tableau 2, la précision résultante (P), la valeur moyenne de rappel (R) et le nombre F (F).

Tableau 2: Précision et CNN quatre médicaments d'évaluation du modèle de base (P), le rappel (R) et le nombre F (F). Pour comparer les cinq modèles par un micro et macro moyenne moyenne.

Ceci est cinq fois l'écart type de précision visible, le rappel et les valeurs de F dans supplémentaires Tableau 6.

Supplémentaires Tableau 6

Les deux dernières lignes du tableau 2 montrent les médicaments sept moyens de micro (Micro Moy) et moyenne macro (Macro Moy). valeur F peut être visualisé individuellement vu, CNN en moyenne mieux que la moyenne des quatre autres modèles de micro et macro. En moyenne, par rapport aux micro, CNN en moyenne plus importante optimisation macro. Huit types de médicaments dont les 7, CNN a reçu la valeur F la plus haute. La seule exception est le furosémide, F est supérieure à la valeur de la CNN RF. Par rapport aux quatre autres modèles de base, CNN principalement pour améliorer le rappel du médicament, la valeur de précision avec d'autres modèles similaires. Four modèle de base, la méthode micro perceptron multicouche (MLP) moyenne et la valeur minimale moyenne de F1 macro, machine à vecteurs de support non linéaire (SVM) et RF est un modèle non linéaire, en fonction de son niveau général d'un modèle de régression logistique linéaire modèle (LR ) bon.

CNN principales raisons autres qu'un modèle de base est la suivante: elle utilise les informations sémantiques hiérarchiques de la couche cachée pour capturer une pluralité de granularité. Nous utilisons une variété d'indicateurs visuels pour vérifier. Tout d'abord, vérifier si le vecteur intégré est capable de capturer la sémantique du mot. Considéré comme chaque vecteur de mot w est incorporé, l'informatique embarquée la distance euclidienne entre le vecteur des vecteurs w avec un autre mot, et puis récupérer le vecteur intégré w à partir du dernier mot. Le tableau 3 montre les 20 mots et mots les plus proches euclidiennes. Ensuite, nous utilisons la couche de filtre de convolution de détection d'index visuel, et vérifier si elles peuvent capturer des phrases sémantiques. Nous avons choisi l'expression ayant la valeur propre maximale avec match différent de la fenêtre du filtre. Le tableau 4 montre la taille de fenêtre maximale est de 3, et dans lequel une taille de fenêtre de phrase est généré filtre 4.

discuter

Comme le montre le tableau 2, cinq modèles d'évaluation complet, autre que le modèle de base CNN, il y a deux raisons principales: l'une des raisons est CNN peut capturer des informations sémantiques à travers une variété de tailles de particules, tandis que d'autres modèle de base n'a pas un tel mécanisme. Les mots sont équipés en utilisant la couche CNN, couche dense, et une couche de convolution pour identifier mot sémantique, phrase texte sémantique et sémantique.

Tableau 3.20 vecteur intégré w et le mot le plus proche de la distance euclidienne.

Le tableau 3 montre chacun muni de son vecteur de mot le plus proche a une forte pertinence clinique. Par exemple, « artère » du mot adjacent est « Troponine » de pertinence clinique élevé de ces deux mots.

La corrélation entre les mots comme suit: Pour les patients souffrant d'une maladie coronarienne, les taux de troponine, « aorte » et « valve mitrale » deviendront les mots pertinents, parce que les valves aortique et mitrale sont les plus vulnérables à la maladie vanne. « Angine » et « échocardiographie » deux mots est également pertinente, étant donné que l'angine de poitrine peut être diagnostiquée par échocardiographie figure. Cela donne à penser que la sémantique du vecteur intégré peut bien saisir les mots.

Tableau 4. Visualisation du filtre. Taille de la fenêtre est la taille de fenêtre maximale de 3 et un filtre 4, caractérisé généré dans une phrase.

Par convolution de la couche, chaque filtre peut reconnaître sémantique spécifique. Par exemple, les filtres 1-4 sont les varices, les maladies rénales, la maladie coronarienne, et des tests de laboratoire. Les filtres 5-8 sont des problèmes respiratoires, les maladies cardiaques, l'insuffisance cardiaque et greffe artérielle. Fait intéressant, mais il n'a pas de mots mots sémantiquement liés existent dans le même filtre. Par exemple, dans le filtre 2, « tabouret noir », « hypertension rénale » « hémodialyse », ces trois mots mots pas communs, mais ils sont étroitement liés sémantique. « Melena » est un symptôme courant de la maladie rénale au stade terminal, « dialyse » est un traitement courant pour les maladies du rein. 8 montre la taille de la fenêtre de filtre doivent utiliser des filtres différents. Bien que ces mots sont associés à la « insuffisance cardiaque congestive » (CHF), mais ils révèlent les différentes sémantiques dans différents premier mot. Ils sont le résultat de CHF, les antécédents médicaux, la cause, la présence et la gravité. Si nous utilisons uniquement le filtre de taille de la fenêtre 3, vous ne pouvez obtenir « l'insuffisance cardiaque congestive » Ceci est une sémantique. Cependant, en utilisant une taille de fenêtre du filtre 4 peut capturer la sémantique plus de granularité.

texte intégral sémantique peut être obtenue dans les couches denses. Comme représenté sur la. Figure 3, un vecteur de mesure des annotations liées à la drogue déchargée par la proximité. Par exemple, la première petite figure, voir clairement les deux marqueurs, les marqueurs correspondent des groupes « métoprolol » et « non métoprolol. » D'autres chiffres peuvent également voir un phénomène similaire, ce qui indique que le patient a été déchargé de prédire l'ampleur du médicament par la proximité du vecteur est très utile. De plus, ces chiffres, nous pouvons obtenir des connaissances cliniques. « Métoprolol » et « furosémide » carte petit échantillon, le marqueur rouge et marqueurs noirs ont un chevauchement important, ce qui suggère que ces deux médicaments peuvent être compatibles. petit échantillon figure « amlodipine » et « aténolol » peut être vu, le degré de recouvrement marqueur marqueur rouge et noir est petit, ce qui indique que les deux médicaments peu la compatibilité.

Une autre raison importante modèle CNN est mieux que l'autre modèle de base est qu'il peut capturer la corrélation entre le médicament. CNN obtenu par les modèles de pertinence est très cohérent avec le classement PMI. Tous les médicaments sauf le lisinopril, le modèle CNN avec des médicaments selon PMI trouvé le même selon le get liés à la drogue la plus pertinente. Cela indique que le modèle CNN peut effectivement saisir la corrélation entre le médicament.

On peut voir le modèle CNN peut effectivement améliorer aténolol, diltiazem et d'autres moins fréquemment utilisés médicaments la valeur F1. Métoprolol et médicaments furosémide fréquemment utilisés, modèle de valeur F1 CNN et d'autres modèles de même. Ainsi, le modèle macro CNN peut améliorer la valeur moyenne de la fréquence F1 en utilisant la drogue plus faible. Mais pour les médicaments pharmaceutiques à haute fréquence, CNN n'a pas amélioré de façon significative le modèle pour les moyennes micro F1 valeurs. Prédiction de la drogue dépend de deux facteurs:

(I) la corrélation entre le médicament et les informations d'entrée;

(Ii) la corrélation entre le médicament et d'autres médicaments.

Pour médicaments moins fréquemment utilisés, la corrélation entre les médicaments et d'autres médicaments sera très important. CNN a saisir efficacement les mécanismes de liés à la drogue, et donc plus adaptés à la prédiction moins de médicaments fréquemment utilisés.

MLP F1 le plus bas en cinq médicaments en valeur, et la valeur moyenne de F1 est également faible. La raison est que le modèle MLP en utilisant uniquement des médicaments comme entrée, devrait entrer plus d'informations, telles que les antécédents médicaux, la plainte principale, et ainsi de suite. Cela indique que la prédiction de décharge prévue de médicaments de médicaments et d'hospitalisation sont significativement différentes, la nécessité d'une utilisation efficace des autres types d'informations pour faire des prévisions précises. Pour tous les modèles, plus la fréquence de consommation de drogues en valeur générale F est relativement élevé, car plus la base de données utile pour prédire la performance de la machine à apprendre à jouer.

limitation

Alors que les performances de CNN mieux que d'autres modèle de base puissant, nous discutons de certaines de ses limites.

Tout d'abord, l'écart CNN dans la performance sur les classes de médicaments rares et fréquentes est encore grande, il a amélioré bien que par rapport à la valeur initiale. Par exemple, CNN F1 score des deux médicaments les plus courants sont 0,79 et 0,70, respectivement, que ceux qui ne fréquentent pas la drogue (atenolol et HCTZ) est beaucoup mieux. Dans les travaux futurs, nous prévoyons de trouver un moyen de combler cette lacune.

Une autre limitation de notre approche est qu'elle est purement axée sur les données, ne comprend pas la connaissance humaine. Dans la pratique clinique, les médecins se réfèrent aux directives des associations professionnelles à Prescrire des médicaments. Ces lignes directrices peuvent être incorporées dans le modèle CNN, afin d'améliorer encore la précision de la prévision, nous prévoyons d'explorer à l'avenir.

Encore une fois, dans notre méthode actuelle, seule l'information médicale est utilisée pour prédire les médicaments à l'hôpital. facteurs non cliniques tels que le type d'assurance, le coût des médicaments, l'influence des médicaments sur ordonnance, devraient également être intégrées dans des modèles prédictifs.

Enfin, la note MIMIC-III est très bruyant, nous sommes les étapes de prétraitement ne traitent pas complètement le bruit. Par exemple, la chaîne de caractères de titre utilisé pour identifier les différents types d'accès à l'information est pas exhaustive, ce qui a conduit à beaucoup d'informations sont perdues. Ensuite, nous allons traiter manuellement « coin » de l'affaire, et les intégrer dans l'ensemble de la formation.

conclusion

Nous avons trouvé que disponible lorsque vous utilisez les informations afin de prédire avec précision le médicament d'admission à l'hôpital. Ces prévisions peuvent fournir des informations précieuses pour le médecin d'élaborer un plan de traitement. Sur les huit médicaments, le modèle CNN de 0,63 (micro moyenne) la précision, le taux de rappel est de 0,70.

Sur les scores macro moyenne en termes de modèle F1, CNN plus de 20% de mieux que le meilleur modèle de base. CNN gain de performance en raison de deux capacités, et la capacité à ne pas appartenir à ces deux méthodes de base. Tout d'abord, CNN peut apprendre la représentation sémantique du texte. Nous détaillons les composants individuels de la visualisation du modèle, y compris les mots intégrés, les filtres de convolution et des couches denses.

Ceux-ci montrent visuel, CNN modèle sémantique de taille différente peut être extrait du texte original. En second lieu, CNN est en mesure de saisir la corrélation entre les mécanismes de médicaments partagés par des facteurs potentiels. Cette capacité est meilleure que la performance de base de CNN Une autre raison principale est capturée par le manque d'échantillons de formation thérapies liées, en particulier dans le traitement médicamenteux hors du commun.

Bien que l'inspiration de nos solutions est d'une tâche particulière peut être accompli, mais il peut aussi devenir une tâche commune des programmes dans d'autres prédicteurs cliniques. Par exemple, l'étiquette est transférée de la cible par le médicament à la maladie, CNN peut être utilisé pour faciliter le diagnostic.

« Civilization 6 » Le nouveau pack d'extension « changeant » publié au début de l'année prochaine sur la ligne
Précédent
Netflix est déterminé à ne pas participer au Festival de Cannes! Et ne veulent pas l'effondrement, selon le comité d'organisation sorti dans les salles
Prochain
C'est ce que l'opération? Directeur Wang Yuan Landsat diss les fans, puis supprimez les excuses de micro-blogging
Millet Huawei 360, des milliers de téléphone en plein écran guerre imminente!
colère Dong Mingzhu! Avec ma photo de la personne qui utilise le téléphone est Gree iPhone X foulards disponibles, au prix de 271 yuans, à Thunder play-off monnaie a changé son nom pour « chaîne g »
images fixes verset « Trough » pour déverrouiller le mystère caché Nick Xu Jinglei est un paradoxe entre une idée
Noir et peur, « Xian Fei Déesse »! Charmaine et photo rouge net est « beauté » dans un visage de serpent de bénédiction
Professeur Zheng Nanning: toujours sans pilote totalement autonome face à des défis difficiles - pour parler de la construction cognitive humanoïde conduite autonome
La seule liste restreinte 70e chinois Cannes: Yin Yang Shan Fang mettant en vedette « Passing l'avenir » fichier donné 5,17
Sur la génération de Dieu U Xiaolong 625, également publié plus d'un an « vieux vin dans de nouvelles bouteilles » fait nouvelle machine!
Bonne événement de l'industrie blanchisserie dans le domaine du point ouvert et facile du sommet du marketing de la marque a ouvert dans le Zhejiang
disque cloud privé + relais sans fil + valeur de couleur ultra-haute, ce produit est l'époque après l'artefact de lecteur réseau!
Ray Poudrerie ne suffit pas de bonnes nouvelles? « Macross cohabitation » et Tong Li Ya jamais fait de sucre
Linwu: développement et construction d'un mur solide d'acier pour construire de nouveaux pôles de croissance économique