Andrew Ng Derniers résultats médicaux AI: utilisation AI pour améliorer la précision de la détection des anévrismes cérébraux, ce qui réduit considérablement les cliniciens de temps diagnose

Départ de Baidu, Andrew Ng est retourné à l'Université de Stanford de continuer à se livrer à la recherche universitaire, les applications médicales est l'un des sens vertical de ses deux ans plus précieux, Andrew Ng et l'équipe ont publié un certain nombre de réalisations: algorithme CNN identifie une pneumonie , a annoncé les plus grandes données d'imagerie médicale mis MURA et ainsi de suite.

Lei Feng réseau que récemment, le site officiel de l'Université de Stanford a publié les résultats d'Andrew Ng, une nouvelle équipe: Avec des algorithmes d'intelligence artificielle pour aider les radiologues d'améliorer le diagnostic des anévrismes cérébraux. Le résultat de l'article publié dans « JAMA Open Network ».

anévrismes non rompus diagnostic clinique est une tâche critique - anévrisme cérébral est un vaisseau sanguin dans les bosses du cerveau peut entraîner une fuite ou une rupture, peut conduire à des accidents vasculaires cérébraux, des lésions cérébrales ou la mort.

angiographie par tomographie assistée par ordinateur (CTA) est le principal, les modalités d'imagerie minimalement invasives actuellement utilisées pour le diagnostic des anévrismes intracrâniens, le suivi et la planification préopératoire. Mais même neuroradiologist professionnel de diagnostiquer aussi besoin de prendre beaucoup de temps. Fiabilité faible noteur (interjuges accord) sur la fiabilité du diagnostic présente également un défi supplémentaire.

Ces dernières années, la vague de l'intelligence artificielle, convolution réseau de neurones (CNN) a une série de tâches visuelles (y compris l'analyse d'images médicales) ont montré d'excellentes performances sur. Cependant, avec la profondeur de l'apprentissage pour améliorer le clinicien la capacité de travail n'est pas beaucoup de réalisations.

Par conséquent, l'utilisation de l'intelligence artificielle pour aider les cliniciens à identifier de manière fiable l'anévrisme cliniquement significative du CTA fournira un utile et facile à utiliser des outils de diagnostic pour les radiologues de soutien, des neurochirurgiens et d'autres cliniciens.

Sur la base de ces considérations, l'équipe Andrew Ng a établi un modèle d'apprentissage profond pour anévrisme intracrânien sur le CTA détecte automatiquement et le segment zone spécifique pour aider les cliniciens par le CTA pour le diagnostic des anévrismes intracrâniens.

Ce qui suit est les détails de votre travail, l'IA dig Kim Ji-groupe universitaire compilé. Regarder « dig Kim Ji AI » numéro public dans le mot-clé de réponse de dialogue « Andrew Ng », vous pouvez obtenir le PDF original .

résumé

importance: l'apprentissage en profondeur est possible d'améliorer les performances des cliniciens dans l'imagerie médicale, l'interprétation, et grâce à la segmentation automatique raccourcit le temps de diagnostic. À ce jour, peu d'études ont exploré ce sujet.

objectif: Le développement et l'application du modèle de division des réseaux de neurones (modèle HeadXNet), le modèle peut être généré avec précision voxels d'anévrisme intracrânien dans la prédiction d'en-tête angiographie par tomographie assistée par ordinateur (CTA) formation d'image, afin d'améliorer les capacités de diagnostic des anévrismes intracrâniens clinicien.

Schéma, environnement et participants: Dans cette étude de diagnostic, nous avons développé une structure de réseau de neurones convolution en trois dimensions, 611 cas de la tête du CTA, l'ensemble de la formation afin de générer une segmentation d'anévrisme. Dans 115 jeu de test d'examen, le résultat du modèle de segmentation a été présenté au clinicien.

Entre le 13 Août 2018 et 4 Octobre 2018, indépendamment du fait que les améliorations apportées au modèle, huit cliniciens pour diagnostiquer la présence d'un anévrisme sur l'ensemble de test dans un ordre aléatoire et 14 jours de wash-out design crossover période. Dans la tête et le cou entre le 3 Janvier, 2003 à mai 2017 et 31 contrôles ont été utilisés pour les modèles de formation, de validation et de test. Au moins un cas d'anévrismes majeurs d'importance clinique, anévrismes intracrâniens unruptured contrôle est positif. hémorragie exclus, rupture d'anévrisme, un traumatisme ou faux anévrisme infectieux, malformation artério-veineuse, des pinces chirurgicales, des bobines, un cathéter ou d'autres contrôles matériels chirurgicaux. Tous les autres CTA, sont considérés comme le groupe témoin.

résultats: les données Comprenant 818 chèques de 662 patients indépendants, CTA, où 328 cas (40,1%) comprenant au moins un cas d'anévrismes intracrâniens, 490 cas d'examen (59,9%) des anévrismes intracrâniens. Lire l'ensemble de test de huit cliniciens expérience 2-12 ans. Afin de renforcer la capacité des cliniciens à prédire l'intelligence artificielle générée par la division, par rapport sans amélioration, les cliniciens et obtenu une amélioration statistiquement significative de la sensibilité, la précision et la fiabilité des aspects noteur:

L'augmentation moyenne de la sensibilité clinicien 0,059 (IC à 95%, de 0,028 à 0,091; P = 0,01 ajusté), l'augmentation de la précision moyenne 0,038 (IC à 95%, de 0,014 à 0,062; ajusté P = 0,02), la différence moyenne inter-évaluateur (Fleiss ) augmente 0,060, 0,799 augmenté de 0,859 (ajusté P = 0,05).

Spécifique (0,016; 95% CI, -0,010 à 0,041, ajusté P = 0,16) et le temps de diagnostic (5,71 secondes; IC à 95%, 7.22-18.63 secondes; ajusté P = 0,19) n'a pas moyenne statistiquement des changements importants.

Conclusions et signification: modèle d'apprentissage profondeur, nous avons établi de détecter avec succès la signification clinique des anévrismes intracrâniens importants CTA. Cela donne à penser que le diagnostic de l'intelligence artificielle modèle intégré peut être améliorée grâce à la performance clinicien prévisions fiables et précises pour optimiser les soins aux patients.

méthode

données

Nous avons étudié rétrospectivement la tête et du cou ou de la tête menée à l'Université de Stanford Centre médicale 3 Janvier 2003 au 31 mai 2017 CTA rapports d'inspection continue étaient 9455 cas. examen quant au fond inclus, hémorragie méningée, pseudoanévrisme infectieuse ou post-traumatique, des malformations artério-veineuses, accident vasculaire cérébral ischémique ou des vaisseaux sanguins chroniques non spécifiques tels que l'athérosclérose trouvé intracrânienne ou une autre maladie vasculaire, et des pinces chirurgicales, des bobines, d'un cathéter ou d'un autre matériel chirurgical. Des exemples de dommages causés par la détérioration exclu du traumatisme ou d'un moteur causé par le radiologue de nerf avec 12 ans d'expérience. Rapport d'inspection comprend également importants anévrismes non rompus ( >  3 mm).

marque de radiologistes

Ensemble de test pour vérifier l'ensemble de la norme de référence est déterminée par un neuroradiologue certifié a 12 ans d'expérience. Déterminer la présence d'un anévrisme par un examen des rapports de radiologie d'origine, vérifiez l'examen du CTA. De plus, si possible, pour confirmer davantage le diagnostic d'anévrisme cérébral par angiographie. l'accès Neuroradiologue de boîte pré-et le suivi examen de tous l'imagerie médicale numérique et série DICOM, rapports originaux et de l'histoire clinique et processus de consultation pour déterminer la meilleure balise standard de référence.

Dans chaque anévrisme d'inspection, le radiologue également l'emplacement de chacun de l'anévrisme. Notez l'utilisation de logiciels open source, ITK-SNAP, un anévrisme de segmentation manuelle identifié dans chaque tranche.

modèle

Dans cette étude, nous avons développé un appelé en trois dimensions HeadXNet CNN, une division des anévrismes intracrâniens de tomodensitométrie. CNN est un réseau neuronal pour traiter des données d'image, et est particulièrement adapté à trois dimensions CNN ou transformation séquence d'images de volume.

HeadXNet est un codeur - (. E sur la figure 1 supplément) configuration du décodeur CNN, dans lequel le codeur est associé à la résolution de volume résumé codé, le décodeur de l'extension de codage du volume segmenté pleine résolution. Les valeurs de probabilité pour chaque section de voxel anévrisme de résultat, la même taille que l'image originale. Adapté par le codeur 50 de la couche réseau SE-ResNeXt, le décodeur est une série de 3 × 3 transposition de convolution.

Et UNET De même, dans les sauts de connexion codeur à trois couches, le processus de codage pour fournir en sortie directement transmis au décodeur. Le codeur est sur le jeu de données pré-formés Kinetics-600, qui est marquée par une série de comportements humains vidéos YouTube, encodeur après la pré-formation, et les trois derniers blocs de convolution de couche de sortie de 600 voies est supprimée, ajouter une mise en commun et le décodeur de couche de pyramide immense espace de position correspondant.

Processus de formation

Pendant la formation, nous avons échantillonné au hasard 16 échantillons sous-volume du volume. Pré-traitement de l'ensemble de données pour trouver le contour du crâne, et chaque échantillon rééchantillonné à 208 × 208 pixels avant chaque échantillon dans la section transversale de la récolte autour du crâne. Les sections ont ensuite été découpées en 192 x 192 pixels (utilisés lors de la formation de coupe aléatoire, en utilisant écrêtage central pendant l'essai), la taille finale de l'entrée est de 16 × 192 × 192, la même transformation est appliquée aux étiquettes de segmentation. processus de formation à l'aide d'une combinaison pondérée basée sur les dés binaire et voxel de perte d'entropie croisée.

Avant d'entrer dans la formation du modèle, l'image d'entrée est prise comme -300,700 unités Hounsfield, les données normalisées et le centre zéro. La formation à l'aide de trois GPU TitanXp (NVIDIA), minibatch 2 sur chaque GPU. Utilisation de l'optimisation des paramètres de modèle d'optimisation de descente de gradient stochastique, l'élan de 0,9, le poids initialisation aléatoire droit taux d'apprentissage de crête de 0,1 et 0,01 en poids préformation. le taux d'apprentissage par le taux linéaire d'apprentissage d'échauffement du pic 0 Dao 10000 itérations pour ajuster, puis plus de 300.000 fois le cosinus de l'itération de recuit.

En outre, le codeur pré-formation pour les premiers 10.000 itérations, le taux d'apprentissage est fixé à 0. A propos de régularisation, tous les paramètres de formation pour la perte de poids, plus 0,001 poids atténuation L2, abandon aléatoire et de la profondeur dans le bloc codeur. Ne pas utiliser abandon standard.

Afin de contrôler le déséquilibre des classes, nous avons utilisé trois méthodes.

Tout d'abord, les exemples positifs mal classés par le codeur et la mise à jour des paramètres perte de plus d'encouragement foyer, ajouter une perte secondaire après.

Deuxièmement, les échantillons de formation anormale fréquence d'échantillonnage est supérieure à celle des échantillons normaux, de sorte qu'un échantillon anormal, 30% des itérations de formation.

Enfin, l'itération de formation, lorsque l'étiquette est complètement divisée par l'arrière-plan (normal) voxels, le décodeur de paramètre est pas mis à jour.

Afin de générer l'ensemble de la segmentation prédite de volume, les feuilles continues 16 sections de sortie divisées sous-volume sont simplement raccordés. Si le nombre de tranches non divisible par 16, le dernier volume d'entrée rempli de zéros, le dos du volume est tronquée sortie correspondant à la taille d'origine.

Conception de l'étude

Nous avons effectué une étude de précision de diagnostic, comparer le modèle avec et sans indicateurs de performance améliorées cliniciens. L'étude a porté sur huit cliniciens, 115 cas chaque jeu de test de diagnostic, la moitié ont aidé le modèle, et l'autre moitié n'a pas. Cliniciennes rapport original, l'histoire clinique et le suivi des connaissances des études d'imagerie.

L'utilisation d'un plan croisé, les cliniciens ont été répartis au hasard en deux groupes. Dans chaque groupe, la moitié fixe cochés ordre aléatoire du groupe sont triés, et l'autre moitié tournent dans l'ordre inverse. Groupe 1 n'a pas lu le premier modèle pour améliorer l'inspection, le deuxième groupe a lu le contrôle du modèle amélioré. Après une période de sevrage thérapeutique de 14 jours, la mise renforcée inversée de telle sorte que le groupe de modèles ayant 1 à lire inspection renforcée, Groupe 2 pas de modèle d'inspection amélioré lu (Fig. 1A).

Les cliniciens drapeau est au moins une des anévrismes cliniquement importants (diamètre supérieur à 3 mm). La lecture du clinicien dans le diagnostic de lecture seule, utiliser le même écran de définition (3840 × 2160 pixels), l'affichage de la CTA, open source norme DICOM Viewer (Voya). CLINICIENS leur label application logicielle d'entrée de données, l'application automatique vérifie la marque précédente dossier d'inspection et le temps entre la différence de courant.

Quand un modèle est renforcée lire, modèle de prédiction des cliniciens recouvrant directement le CTA dans une région d'intérêt (ROI) sous forme divisée. Pour veiller à ce que tous les cliniciens à l'aide de l'interface d'affichage d'image familière, les prédictions du modèle montrent un retour sur investissement dans le logiciel de visualisation standard DICOM.

Dans chaque modèle de probabilité prédictive voxel est supérieur à 0,5, le médecin dans le sens axial, des tranches coronales et sagittales peut voir une série de couches rouge de couverture translucide (Fig. 1C). Lorsque le chargement, le médecin peut accéder à la ROI immédiatement et peut être commuté pour afficher une image inchangée ROI CTA (fig. 1B).

couverture rouge est le seul indice que le modèle pour prédire si un CTA, contient notamment l'anévrisme. Compte tenu de ces résultats du modèle, le médecin peut choisir de considérer ou ne pas tenir compte selon le jugement clinique.

Lorsque le médecin pour le diagnostic en l'absence d'un modèle amélioré, un examen n'a pas montré un retour sur investissement. Dans le cas contraire des outils de diagnostic pour une meilleure lecture et non amélioré est le même.

A, conception de l'étude croisée. Les cliniciens sont divisés en deux groupes, dans le modèle d'ordre aléatoire avec et sans interprétation améliorée, il y a eu deux semaines délavage.

B, pas amélioré le modèle d'interprétation, axiale, coronale et sagittale CTA analyse originale.

C, modèle amélioré d'interprétation, le résultat de la segmentation dans le modèle de couverture axiale CTA, coronale et sagittale. Le médecin peut sélectionner et afficher le couvercle près balayé, comme le montre la figure B. AI représente AI, CTA, l'angiographie par tomographie assistée par ordinateur.

Analyse statistique

Pour déterminer si d'inclure la vérification anévrisme double tâche, en utilisant la sensibilité, la spécificité et la précision d'évaluer et de cliniciens ne disposent pas d'un modèle avec des performances améliorées. La sensibilité représente le nombre réel de résultats positifs divisé par le nombre total d'anévrismes positifs, représentent en particulier un véritable résultat de négatif divisé par les anévrismes au total des cas négatifs, la précision est le nombre de vrais positifs divisé par les résultats positifs de tous les cas de test vrai.

moyenne de tous les cliniciens Microscopique dans ces statistiques sont également calculées par chacune des données statistiques et vrais positifs, faux négatifs et des faux positifs liés au nombre total. En outre, afin de convertir la sortie du modèle de prédiction binaire divisée, au moins si le modèle prédit un voxel appartenant à l'anévrisme et l'autre négatif, la prévision considéré comme positif. Utilisez 95% Wilson intervalle de confiance de score pour évaluer les changements de la valeur estimée de la sensibilité, la spécificité et la précision.

Pour déterminer si le modèle améliore le clinicien d'obtenir des améliorations significatives des performances, nous avons effectué un test t de test unilatéral des différences dans les huit sensibilité des cliniciens, la spécificité et la précision grâce. Pour déterminer la robustesse des résultats et si les résultats comprennent les radiologues de pratique et neurochirurgiens, nous avons effectué une analyse de sensibilité: nous n'avons calculé la sensibilité de radiologue certifiés ANNEES, les différences de spécificité et de précision t-test.

Le temps moyen pour le modèle avec ou sans renforcement de diagnostic clinicien calculée comme la différence entre le temps continu moyen du diagnostic dans la feuille de calcul; t 95% utilisé pour évaluer la variabilité d'intervalle d'estimation de la confiance. Pensez à l'interruption d'interprétation clinique ou des erreurs d'enregistrement de temps, d'éliminer les cinq plus long et le plus court temps pour chaque lecture chaque tranche de cinq diagnostic clinicien. Pour évaluer si l'augmentation du modèle raccourcit considérablement le temps de diagnostic pour les huit cliniciens et le modèle de différence de temps moyen amélioré ne pas être un t-test Unilatéral.

Les cliniciens et radiologues évaluent sous-ensemble de la fiabilité calculée en utilisant la exacte Fleiss. Pour déterminer si le modèle amélioré augmente l'évaluation de la fiabilité, les cliniciens évaluent la fiabilité sur l'ensemble de test a été test de permutation Unilatéral. Procédé de permutation aléatoire comprenant des modèles d'échange avec ou sans renforcement clinicien d'étiquetage pour avoir été préalablement marqué avec un sous-ensemble aléatoire de l'ensemble de test est lue maintenant amélioré est marqué comme étant lu en l'absence de renfort, et vice versa; calculer une valeur de concentration précise Fleiss (et la différence) test avec les balises de remplacement.

Ce processus a été répété rapport de substitution 10000 fois pour produire une distribution Fleiss zéro de différence (notée par le clinicien modèle amélioré d'évaluation de la fiabilité ne dépassant pas sans rehaussement), la valeur non corrigée de la différence de P calculée rapport Fleiss nous avons observé Fleiss différence k plus.

Afin de contrôler le taux d'erreur familywise application Correction Benjamini-Hochberg compte tenu de multiples tests d'hypothèses, Benjamini-Hochberg ajustée P 0,05 indique la signification statistique. Tous les tests sont simples queue.

résultat

Les données d'inspection contient 818662 séparée du patient, dans lequel le CTA dans 328 cas (40,1%) comprenant au moins un cas d'anévrismes intracrâniens, 490 cas d'examen (59,9%) Aucun anévrisme intracrânien (fig. 2). Dans le cas d'anévrisme dans 328 cas, 15 de 20 cas de patients avec spécial contient deux anévrismes ou plus. 148 cas d'anévrisme taille d'anévrisme entre 3m-7mm, 108 anévrismes entre 7-12 mm, l'anévrisme 61 cas entre 12 à 24 mm, et 11 des anévrismes de plus de 24 mm.

Répartition de la position de l'anévrisme résulte que: 99 cas dans l'artère carotide interne, 78 cas de l'artère cérébrale moyenne chez 50 patients à l'intérieur d'un anévrismes à col caverneux, 44 cas de l'artère basilaire et 41 situé en face des artères de circulation, 18 situés dans le véhicule artère, 16 situé vertébro-basilaire, et 12 cas de l'artère cérébrale antérieure est située.

Tous les tests ont été effectués sur un GE Discovery, GE LightSpeed, GE Revolution, Définition Siemens, Siemens Sensation ou scanner Siemens Force épaisseur de coupe de 1,0 mm ou 1,25 mm, la tête en utilisant des protocoles cliniques ou angiographiques cou angiographiques standard. Il n'y avait pas de différence entre le programme et l'épaisseur de la tranche de l'anévrisme et la non inspection d'anévrisme. Dans cette étude, la séquence extraite axialement à partir de l'inspection, et l'étiquette sur chacune des tranches axiales de division marqués contenant l'anévrisme. Nombre d'images par examen entre 113-802 (moyenne 373 ).

L'examen est divisé en 611 cas pour vérifier l'ensemble de la formation (494 patients, moyenne âge, 55,8 ans; 372 femelle) utilisé pour former le modèle, 92 cas de contrôle groupe de validation (86 patients; moyenne âge 61,6 59 ans; F) pour la sélection du modèle, de vérifier l'ensemble 115 cas d'essai (82 patients, moyenne variance âge 57,8 74 ans; Femmes) utilisé pour évaluer la performance des cliniciens et modèle (figure 2).

Nous avons stratifié ensembles de validation et de test de la méthode d'échantillonnage aléatoire formés comprennent chacun 50% des cas d'anévrismes artériels et 50% des cas normaux, le reste de l'ensemble d'apprentissage pour l'examen, dont 36,5% est anévrisme chèque. 43 cas de patients avec anévrismes l'examen de suivi et d'inspection ont porté plus de cas se produisent dans les données. Compte tenu de ces patients répétées, les patients examinés afin qu'aucun paquet chevauchement entre les différents groupes. La figure 2 contient les données démographiques du patient et de la pathologie pour chaque groupe.

(CTA) Examen sélectionné 818 cas par les temps professionnels de vérification de radiologue de l'angiographie par tomodensitométrie 9455 réalisée à l'Université de Stanford Medical Center dans la période 2003-2017. Ces tests sont divisés en un ensemble de formation, de développer et de test, ont été utilisés pour former les modèles, la meilleure évaluation de la sélection du modèle et le modèle sélectionné.

Au total, huit cliniciens ont participé à l'étude, dont six radiologue pratique enregistré, un neurochirurgien pratiquant et un cabinet de radiologie médecin. L'expérience de radiologiste de 3 ans à 12 ans, et un neurochirurgien pour assister à une expérience de 2 ans, les stagiaires sont acceptés à l'Université de Stanford Medical Center dans la deuxième année de formation. Groupe 1 et du Groupe 2 sont chacun constitués de trois radiologues composition; interne et neurochirurgiens sont dans le groupe 1. Non clinicien impliqué dans l'établissement de référence examen standard.

En l'absence de renfort micro sensibilité moyenne pour le clinicien pour obtenir 0,831 (IC à 95%, 0,794 à 0,862), la spécificité était de 0,960 (IC à 95%, de 0,937 à 0,974), la précision était 0,893 (IC à 95%, 0,872 -0,912). Dans le cas du renforcement clinicien micro sensibilité moyenne atteint 0,890 (IC à 95%, 0,858 à 0,915), la spécificité était de 0,975 (IC à 95%, 0,957 à 0,986), la précision était 0,932 (IC à 95%, 0.913- 0,946). La sensibilité du modèle de base est 0,949 (IC à 95%, 0,861 à 0,983), la spécificité était 0,661 (IC à 95%, 0,530 à 0,771), la précision était 0,809 (IC à 95%, 0,727-0,870). Performance, chaque micro cliniciens et leur performance moyenne du modèle donné en eTable 1.

Le renforcement de cas, la sensibilité clinicien moyenne globale et une augmentation significative de la précision moyenne ont statistiquement, sont (0,059; 95% de C, 0,028 à 0,091; P = 0,01 ajusté) et (0,038; 95% CI, de 0,014 à 0,062; ajusté P = 0,02). La spécifique moyenne aucun changement statistiquement significatif (0,016; IC à 95%, de -0,010 à 0,041, ajusté P = 0,16).

Tableau détaille les médecins d'amélioration globale de la performance clinique,. La figure 3 comprennent chacun clinicien amélioré. Affiche un modèle avec et sans amélioration des performances en individuel Annexe eTable 1. Une analyse de sensibilité a confirmé que le radiologue pratique même enregistré, il existe d'importantes sensibilité statistiquement moyenne (0,059; IC à 95%, 0,013 à 0,105; P = .04 après ajustement) et de précision (0,036; IC à 95% , 0,001 à 0,072; P = 0,05 ajusté) augmentation. Dans son ensemble, enregistrés sont données dans les informations supplémentaires eTable 2 pratiquant des améliorations de performance radiologue.

Les cliniciens n'a pas amélioré le temps de diagnostic micro-moyenne est 57,04 secondes par examen (IC à 95%, 54.58-59.50 secondes). Chaque fois que l'annexe 3 eTable clinicien, le diagnostic est affiché par moment dans eFigure 2. Avec l'augmentation, le temps de diagnostic moyen n'est pas diminution statistiquement significative (5,71 secondes; IC à 95%, -7.22-18.63 secondes, ajustée P = .19). Modéliser moyenne de 7,58 seconde (IC 95%, 6.92-8.25 secondes) et les sorties des contrôles de processus de division FIG.

Matrice de confusion, qui fait état d'un vrai positif tous les résultats cliniciens et de faux positifs et des résultats vrais négatifs et de faux négatifs (avec ou sans modèle amélioré) forme, figure à l'annexe eTable 4.

L'évaluation de la cohérence du clinicien, une augmentation statistiquement significative du 0.060 (ajusté P = 0,05), la précision améliorée ne Fleiss 0,799 K, 0,859 est amélioré. Pour l'inscription aux radiologues de pratique, leur fiabilité des noteurs a augmenté de 0.063, n'a pas amélioré la précision Fleiss 0,783 K, amélioré à 0,847.

discuter

Dans la présente étude, nous avons utilisé un modèle d'étude de croisement, modèle d'apprentissage approfondi de la recherche à l'aide du CTA à améliorer la capacité des cliniciens à détecter les anévrismes cérébraux. Avec l'amélioration du modèle, les cliniciens sensibilité, la précision et la fiabilité de noteur nettement améliorée. Aucune différence significative de la spécificité et le temps de diagnostic.

Compte tenu des conséquences potentiellement catastrophiques du risque de rupture d'anévrisme manqué, les médecins avaient besoin d'une détection très fiable et des outils de détection automatique pour améliorer la performance clinicien. Anévrysme rupture dans 40% des patients sont mortels, chez les patients ont survécu, les deux tiers des personnes conduiront à un dysfonctionnement neurologique irréversible, par conséquent, une détection précise et en temps opportun est essentiel.

En plus de l'examen dans le diagnostic du CTA améliorer considérablement la précision du clinicien, vous pouvez également utiliser des outils de détection d'anévrisme automatisés (par exemple, cette étude fournit des outils de test) pour établir des priorités flux de travail, de sorte que ceux qui sont plus susceptibles d'être positifs le chèque peut recevoir un diagnostic d'expert en temps opportun, ce qui pourrait réduire le temps de traitement et d'obtenir des résultats plus favorables.

Des différences significatives cliniciens dans le diagnostic de l'anévrisme a été bien documenté et est généralement attribué à un manque d'expérience ou surspécialité formation neuroradiologie, la nature de main-d'uvre de l'anatomie neurovasculaire complexe ou d'identifier l'anévrisme. Des études ont montré que la fiabilité très différents en fonction de détection d'un anévrisme CTA de évaluatrices qui vont entre les indicateurs d'évaluation de la fiabilité est de 0,37 à 0,856, évaluer le niveau en raison de la taille anévrisme et radiologues expérience individuelle varie.

En plus d'améliorer considérablement la sensibilité et la précision, l'utilisation du modèle pour améliorer clinicien augmente également de manière significative la fiabilité des noteurs, l'augmentation de 0,799 à 0,859. Cela signifie que le modèle en améliorant, les cliniciens ont différents niveaux d'expérience et d'expertise peuvent générer une interprétation plus précise et cohérente de la radiologie.

Actuellement, le CTA cliniciens outil d'amélioration de l'anévrisme artériel, comprenant la détection d'un rendu tridimensionnel de la soustraction osseuse et le système vasculaire crânien, qui en fonction des paramètres de seuil de contraste de l'application afin de mieux délimiter le système vasculaire cérébral et la génération d'un rendu 3D pour aider à reconstruire détection anévrisme. Cependant, l'utilisation de ces outils pour les cliniciens est temps et de travail, dans certaines institutions, ce processus est sous-traitée au laboratoire 3D, à un coût supplémentaire.

Dans cette étude, les outils de développement intégrés directement dans viewer DICOM standard, seulement quelques secondes pour générer la carte de segmentation dans un nouvel examen. Si elle est intégrée dans le flux de travail standard, il peut réduire considérablement le coût et le temps du diagnostic pourrait conduire à un traitement plus efficace et les résultats des patients plus favorables.

Apprentissage en profondeur a récemment obtenu un succès dans une variété de tâches de reconnaissance d'image à base clinique. La recherche montre que réseau neuronal à deux dimensions détecter une hémorragie intracrânienne aiguë et d'autres performances du cerveau dans les examens de tête CT, tels que les aspects de l'effet de masse de fracture du crâne ou une bonne performance.

Une étude récente a examiné le rôle potentiel de l'apprentissage dans le diagnostic de la profondeur en fonction de l'angiographie par résonance magnétique des anévrismes cérébraux.

Une autre étude a montré que, dans l'interprétation des études IRM du genou, fournissant les prédictions du modèle d'apprentissage profond pour les cliniciens, augmenter la déchirure du ligament croisé avant la spécificité de détection.

À notre connaissance, avant cette étude, l'apprentissage en profondeur pas été appliquée au CTA, cette modalité d'imagerie de première ligne pour détecter les anévrismes cérébraux. Nos résultats montrent que la profondeur du modèle de segmentation d'apprentissage peut produire des prévisions fiables et interprétables, améliorer les cliniciens à diagnostiquer et à améliorer leur performance. Dans cette étude, la mise en uvre et l'essai du modèle améliore significativement la sensibilité clinicien, la précision et l'utilisation du CTA pour détecter les anévrismes cérébraux avec les différents aspects de l'expérience et de l'expertise du médecin pour vérifier la fiabilité.

limite

Bien sûr, cette étude a des limites. Tout d'abord, parce que l'étude ne concerne que les anévrismes non rompus, le modèle de détection d'un anévrisme, aspects récidive de la lésion ou liée à la performance malformation artérioveineuse de l'anévrisme après coupure chirurgicale ou la bobine n'a pas été étudiée après anévrisme rupture.

Ensuite, pour éliminer l'influence due au matériel ou comprenant dispositif chirurgical, de sorte que la performance du modèle est affecté par ces inconnus. Dans le contexte clinique, le CTA est couramment utilisé pour évaluer de nombreux types de maladies vasculaires, non seulement pour la détection d'anévrisme. Par conséquent, la forte prévalence des anévrismes de l'ensemble de test et les cliniciens de la double tâche peut introduire un biais dans le test.

De plus, l'étude a été réalisée pour les données d'un des établissements d'enseignement unique de soins tertiaires, lorsqu'il est appliqué aux données d'autres organismes avec différents scanners et des protocoles d'imagerie (tels que les différentes épaisseurs de tranche) ne peut montrer bien la performance.

conclusion

Cette étude établie sur la base du CTA détection automatique des anévrismes intracrâniens modèle d'apprentissage en profondeur. Nous avons constaté que le modèle a augmenté de manière significative entre la sensibilité des cliniciens, la précision et la fiabilité de l'évaluateur. travaux futurs examinera en outre les performances de ce modèle, et appliquer des données provenant d'autres organismes et hôpitaux. Lei Feng Lei Feng net net

PyTorch Hub: lauréat du Prix Yann Turing LeCun forte pression! Une ligne de code pour reproduire facilement le modèle grand public
Précédent
Uber montrent taxi aérien, conférence de presse Gree pour signaler le processus de réduction; exposer téléphone shell nouveau format iPhone | Lei Feng Matin
Prochain
Millet entrant matériel AI Education: les élèves peu d'amour est finalement devenu un « enseignant »
Caché derrière les coulisses des deux fondateurs de Google, vient soudainement
Institut Confucius à l'Université de Wroclaw a tenu la deuxième session du Festival Pivoine
« Chine 2019 Exposition philatélique mondiale » enveloppes premier jour émis, élément Wuhan mouche au pays
Robot Temi a dévoilé l'électronique grand public de l'Asie Show, il peut être votre plus recherché robots personnels
La crise est l'occasion, Tencent, Ali LoRa entrants ont fait quoi?
problème gradient disparaître: les problèmes, les causes et leurs solutions signification
les agents chargés de l'application de la loi piller les magasin de beauté, les femmes de panique fait jeter par la fenêtre des dispositifs médicaux
Son ouvert plus de 100 kilomètres trouvé le père « perdu » le Netizen: tu es parti
Deux villes se sont réunis des experts représentant huit provinces le long du fleuve Yangtsé à Wuhan, un grand total termes de protection et le développement du fleuve Yangtsé Water Technology
Les responsables américains demandent une interdiction d'extension Huawei, Salesforce a annoncé une acquisition de blockbuster 15,7 milliards $, la réforme du système de rang Tencent | Lei Feng Matin
Chimpanzé la viande au Royaume-Uni est devenu une délicatesse de luxe? Les experts mettent en garde: vous mangez la peur causée par une infection du SIDA