la poitrine massive « 30.000 patients avec 110.000 images dans 14 catégories pathologiques » NIH Publication ensemble de données de rayons X

1 Ji-won nouveau rapport

Une poitrine imagerie médicale rayons X sont les plus courantes et les plus rentables. Cependant, le diagnostic clinique de la poitrine rayons X est très difficile, parfois considéré comme plus difficile à diagnostiquer que l'imagerie thoracique CT. Au cours des dernières travaux prometteurs ont été signalés, en particulier l'étude récente et le travail dans la classification profondeur (TB) de la tuberculose. Étant donné que seulement est encore très difficile quelques milliers d'images sont utilisées à l'étude dans le monde réel médical, sur tous les ensembles de données de rayons X de la poitrine, pour réaliser la détection et le diagnostic assisté par ordinateur cliniquement pertinente (CAD), sinon possible.

Openi est de loin la plus grande poitrine publique ensemble de données de rayons X, puisque seulement 4143 poitrine vue aux rayons X de l'avant, pour les performances des réseaux de neurones pour identifier la profondeur des maladies pulmonaires très limitées.

Dans cette base de données, NIH fournit une version améliorée de l'ensemble de données dans le travail futur proche (une augmentation de six catégories de maladies et plus d'images), environ 27 fois la taille du nombre Openi devant la poitrine à rayons X. Tous les jeux de données sont extraites de la base de données cliniques de PACS du Centre national des États-Unis pour l'hygiène clinique, qui contient environ 60% de la poitrine positive hôpital film à rayons X.

NIH chercheur impliqué dans les travaux du Dr Lv Yue a dit le nouveau Ji-won, une radiographie thoracique du patient pour enlever la charge de travail de l'information sensible est très grande, analogue à trouver des visages et des plaques d'immatriculation dans Google Street View Lane et mettre floue.

Il est rapporté que, avant la publication de ces données, les chercheurs du NIH à la main et la machine à examiner avec soin au moins sept fois, le dernier NIH interne a également une douzaine d'étudiants de doctorat et les médecins, sera 110.000 images deux fois plus à l'oeil nu. Ceci est de permettre aux chercheurs dans le monde travaillent mieux, comme le Dr Lv Yue a dit: «J'espère que vous apprécierez et amusez-vous! »

Les chercheurs du NIH attendent cet ensemble de données par rapport à l'ensemble de données précédente radiographie X plus représentatif de la véritable répartition de la population et le défi de diagnostic clinique de la réalité du patient. La taille de l'ensemble de données, à partir du nombre total d'images et le point de vue de la fréquence des maladies pleural, sera également formé pour mieux promouvoir la profondeur des réseaux de neurones.

Détails: 30000 + patients, 110.000 + images, 14 catégorie pathologie commune, et plus

données ChestX-ray ensemble comprenant 30.805 patients 112, 120 de l'image de rayons X d'une vue de face et une image de l'étiquette à l'aide des rapports de radiologie PNL maladies liées excavés 14 (chaque image peut comporter une pluralité d'étiquettes).

14 se compose d'une pathologie thoracique de type ensemble commun de données, y compris atélectasie, changement réel, l'infiltration, pneumothorax, dème, l'emphysème, la fibrose, épanchement, pneumonie, épaississement pleural, une hypertrophie cardiaque, des nodules, et une hernie, Ceci est une extension (voir le document ci-dessous ArXiv) dans les maladies communes, le Dr Wang Xiaosong et Peng Yifan, le Dr Lv Yue, qui papier CVPR 20178 liste.

  • CVPR-17 papiers et adresse: Wang X, Y Peng, Lu L, Lu Z, Bagheri M, Summers RM-ChestX ray8: .. Hôpital échelle Chest Base de données de rayons X et points de référence sur la classification Faiblement-Supervisé et localisation des maladies courantes Thorax IEEE CVPR 2017 (http: //openaccess.thecvf.com/content_cvpr_2017/papers/Wang_ChestX-ray8_Hospital-Scale_Chest_CVPR_2017_paper.pdf)

  • ArXiv papier, CVPR-17 est une extension du papier, l'appendice 14 contient des ensembles de données et la répartition des maladies décrites: https://arxiv.org/pdf/1705.02315.pdf

  • acquisition d'image Box Adresse: https://nihcc.app.box.com/v/ChestXray-NIHCC

Il convient de noter que, en raison de nombreuses raisons, les rapports de radiologie d'origine (associés à ces études rayons X de poitrine) ne sont pas partagés publiquement. Text Mining taux de précision de l'étiquette de la maladie devrait> 90%.

contenu:

  • 112120 poitrine image rayons X de la vue de face, format PNG avec une résolution de 1024 * 1024 (dans le dossier images)

  • Toutes les métadonnées de l'image (Data_Entry_2016.csv): index d'images, recherche tag, # piste, identification du patient, l'âge du patient, le sexe, et la position de l'image.

  • 1000 frontières image (BBox_List_2016.csv): index d'images, recherche tag, Bbox . Les coordonnées du coin supérieur gauche de chaque boîte. Chaque case représente la largeur et la hauteur.

  • limitations:

  • La PNL est l'utilisation de balises d'images extraites, donc il y aura quelque chose de mal étiquette, mais la précision de la PNL étiquette est estimée à > 90%.

  • zone de cadre de sélection Maladie (boîtes englobantes) un nombre très limité.

  • Poitrine rapport de radiologie de rayons X ne devrait pas être partagé publiquement. Nous encourageons l'utilisation de cet ensemble de données commun des chercheurs et des institutions de recherche partageant « mises à jour » dans les études futures d'étiquettes d'image et / ou nouveau cadre de sélection, ceux-ci peuvent être annotés à la main.

  • A: maladies concomitants de la statistique 14:

    A. 2 poitrine ensemble de données de rayons X 14 sortes de matrice de survenue de la maladie du sein (matrice de co-occurrence)

    B. Des exemples courants 8 maladies pulmonaires de visualisation (omis)

    C. Une entrée de l'échantillon (S'il vous plaît noter que le rapport de radiologie thoracique d'origine rayons X est pas publiquement partagée)

    D. Utilisation de faible profondeur de supervision réseau neuronal positionnement maladie deux échantillons

    Construire une image médicale réelle à grande échelle ensemble de données

    Ce qui suit est le Dr Lv Le mai de cette année, conférence GTC « Construire des ensembles de données d'images médicales vraiment à grande échelle: la profondeur de l'étiquette pour trouver et reconnaissance extrémité ouverte » partie du PPT, que vous pouvez apprendre derrière ensemble de données radiographie pulmonaire massive de ce NIH a annoncé travail spécifique.

    L'intégration de la machine dans le diagnostic de la prise de décision humaine pour les médecins est difficile, les médecins sont réticents à une bonne utilisation, mauvais médecins ne savent pas comment utiliser. Par conséquent, il doit y avoir une meilleure coordination des procédures de diagnostic humaines. Surtout en médecine de précision, de nouveaux biomarqueurs d'imagerie afin de mieux aider les médecins humains font des jugements précis, mais aussi spécifique au niveau du système d'extraction de similarité du patient qui permet un traitement personnalisé possible.

    Il y a trois clés associés à cela, une détection et un diagnostic assisté par ordinateur, et deuxièmement, la segmentation sémantique dans l'analyse d'images médicales, et le troisième est la plus vraie de grands ensembles mines d'information de profondeur de données (y compris le texte et les images).

    Sur le chemin de surmonter le problème de la médecine des radiations, la pénurie des ensembles de données d'images médicales disponibles est devenue un problème majeur. Les chercheurs ont travaillé à fournir de meilleures solutions.

    recherche connexe, le Dr Wang Xiaosong, Peng Yifan ,, Hoo-chang Shin, le Dr Lv Yue, qui a été engagée.

    En dessous de ce papier CVPR-17 est la base de cette publication NIH d'ensemble de données d'image de rayons X.

    Sur la base des réalisations existantes, nous pouvons voir les futurs défis et orientations de recherche: pour améliorer la précision de la balise d'image, améliorer la précision de la classification multi-étiquettes, ainsi que pour améliorer la précision du positionnement.

    Les défis sont nombreux, plus de résultats, nous vous invitons à nous rejoindre!

    Tous les 64 PPT Télécharger: http: //on-demand.gputechconf.com/gtc/2017/presentation/S7595-le-lu-building-truly-large-scale-medical-image-datatbase.pdf

    [Cliquez pour lire ou balayer la moitié d'achat original du « billet Early Bird »]

    2019 billets Fête du Printemps calendrier publié! Grab votes avec quatre cents millions de personnes, êtes-vous prêt?
    Précédent
    Servir chaud! Juste casserole « être un service de police personnalisée » Laba
    Prochain
    Capello Suning, comprend quatre grands Super League et de la Ligue des Champions Coupe du Monde entraîneur gagnant
    poèmes L de dix poèmes d'amour: une histoire, une période de profond sentiment!
    Mongolie dette nationale, la hausse des prix, soutenus par renminbi, ou ils voient l'espoir économique
    « Programmeur Libérée » MIT « Genesis » machine à l'apprentissage du nouveau système génère automatiquement Bug rapiéçage
    partenaire Alibaba Jiang Fang: Ali, pas si
    Zhangjiajie peut le faire jouer? Huanglong Cave dans le pays des merveilles souterraines, des merveilles de la grotte des États-Unis à l'asphyxie!
    Les hommes autour de 700.000 emprunteurs en prêts aussi routinières 16 millions encore pour rembourser
    « Vision par ordinateur palmaire promettant la » reconnaissance d'image terminal intelligent, l'aménagement paysager, générer un inventaire des applications
    victoires nationales de football sud-coréen lieu a été fermé le football chinois béni, amis: le grand trésor qui a été canonisé Han Kang chasseur
    Nous vivons dans leurs propres préjugés
    Suisse est venu, ils comprendraient ce Encounter bref!
    « Pourquoi investir NVIDIA Chi King » Wang Jin, Han Xu a déménagé de la maison de la Silicon Valley, trois mois après les véhicules sans pilote sur la route en Chine