la poitrine massive � 30.000 patients avec 110.000 images dans 14 cat�gories pathologiques � NIH Publication ensemble de donn�es de rayons X

1 Ji-won nouveau rapport

Une poitrine imagerie m�dicale rayons X sont les plus courantes et les plus rentables. Cependant, le diagnostic clinique de la poitrine rayons X est tr�s difficile, parfois consid�r� comme plus difficile � diagnostiquer que l'imagerie thoracique CT. Au cours des derni�res travaux prometteurs ont �t� signal�s, en particulier l'�tude r�cente et le travail dans la classification profondeur (TB) de la tuberculose. �tant donn� que seulement est encore tr�s difficile quelques milliers d'images sont utilis�es � l'�tude dans le monde r�el m�dical, sur tous les ensembles de donn�es de rayons X de la poitrine, pour r�aliser la d�tection et le diagnostic assist� par ordinateur cliniquement pertinente (CAD), sinon possible.

Openi est de loin la plus grande poitrine publique ensemble de donn�es de rayons X, puisque seulement 4143 poitrine vue aux rayons X de l'avant, pour les performances des r�seaux de neurones pour identifier la profondeur des maladies pulmonaires tr�s limit�es.

Dans cette base de donn�es, NIH fournit une version am�lior�e de l'ensemble de donn�es dans le travail futur proche (une augmentation de six cat�gories de maladies et plus d'images), environ 27 fois la taille du nombre Openi devant la poitrine � rayons X. Tous les jeux de donn�es sont extraites de la base de donn�es cliniques de PACS du Centre national des �tats-Unis pour l'hygi�ne clinique, qui contient environ 60% de la poitrine positive h�pital film � rayons X.

NIH chercheur impliqu� dans les travaux du Dr Lv Yue a dit le nouveau Ji-won, une radiographie thoracique du patient pour enlever la charge de travail de l'information sensible est tr�s grande, analogue � trouver des visages et des plaques d'immatriculation dans Google Street View Lane et mettre floue.

Il est rapport� que, avant la publication de ces donn�es, les chercheurs du NIH � la main et la machine � examiner avec soin au moins sept fois, le dernier NIH interne a �galement une douzaine d'�tudiants de doctorat et les m�decins, sera 110.000 images deux fois plus � l'oeil nu. Ceci est de permettre aux chercheurs dans le monde travaillent mieux, comme le Dr Lv Yue a dit: �J'esp�re que vous appr�cierez et amusez-vous! �

Les chercheurs du NIH attendent cet ensemble de donn�es par rapport � l'ensemble de donn�es pr�c�dente radiographie X plus repr�sentatif de la v�ritable r�partition de la population et le d�fi de diagnostic clinique de la r�alit� du patient. La taille de l'ensemble de donn�es, � partir du nombre total d'images et le point de vue de la fr�quence des maladies pleural, sera �galement form� pour mieux promouvoir la profondeur des r�seaux de neurones.

D�tails: 30000 + patients, 110.000 + images, 14 cat�gorie pathologie commune, et plus

donn�es ChestX-ray ensemble comprenant 30.805 patients 112, 120 de l'image de rayons X d'une vue de face et une image de l'�tiquette � l'aide des rapports de radiologie PNL maladies li�es excav�s 14 (chaque image peut comporter une pluralit� d'�tiquettes).

14 se compose d'une pathologie thoracique de type ensemble commun de donn�es, y compris at�lectasie, changement r�el, l'infiltration, pneumothorax, d�me, l'emphys�me, la fibrose, �panchement, pneumonie, �paississement pleural, une hypertrophie cardiaque, des nodules, et une hernie, Ceci est une extension (voir le document ci-dessous ArXiv) dans les maladies communes, le Dr Wang Xiaosong et Peng Yifan, le Dr Lv Yue, qui papier CVPR 20178 liste.

CVPR-17 papiers et adresse: Wang X, Y Peng, Lu L, Lu Z, Bagheri M, Summers RM-ChestX ray8: .. H�pital �chelle Chest Base de donn�es de rayons X et points de r�f�rence sur la classification Faiblement-Supervis� et localisation des maladies courantes Thorax IEEE CVPR 2017 (http: //openaccess.thecvf.com/content_cvpr_2017/papers/Wang_ChestX-ray8_Hospital-Scale_Chest_CVPR_2017_paper.pdf)
ArXiv papier, CVPR-17 est une extension du papier, l'appendice 14 contient des ensembles de donn�es et la r�partition des maladies d�crites: https://arxiv.org/pdf/1705.02315.pdf
acquisition d'image Box Adresse: https://nihcc.app.box.com/v/ChestXray-NIHCC

Il convient de noter que, en raison de nombreuses raisons, les rapports de radiologie d'origine (associ�s � ces �tudes rayons X de poitrine) ne sont pas partag�s publiquement. Text Mining taux de pr�cision de l'�tiquette de la maladie devrait> 90%.

contenu:

112120 poitrine image rayons X de la vue de face, format PNG avec une r�solution de 1024 * 1024 (dans le dossier images)

Toutes les m�tadonn�es de l'image (Data_Entry_2016.csv): index d'images, recherche tag, # piste, identification du patient, l'�ge du patient, le sexe, et la position de l'image.

1000 fronti�res image (BBox_List_2016.csv): index d'images, recherche tag, Bbox . Les coordonn�es du coin sup�rieur gauche de chaque bo�te. Chaque case repr�sente la largeur et la hauteur.

limitations:

La PNL est l'utilisation de balises d'images extraites, donc il y aura quelque chose de mal �tiquette, mais la pr�cision de la PNL �tiquette est estim�e � > 90%.

zone de cadre de s�lection Maladie (bo�tes englobantes) un nombre tr�s limit�.

Poitrine rapport de radiologie de rayons X ne devrait pas �tre partag� publiquement. Nous encourageons l'utilisation de cet ensemble de donn�es commun des chercheurs et des institutions de recherche partageant � mises � jour � dans les �tudes futures d'�tiquettes d'image et / ou nouveau cadre de s�lection, ceux-ci peuvent �tre annot�s � la main.

A: maladies concomitants de la statistique 14:

A. 2 poitrine ensemble de donn�es de rayons X 14 sortes de matrice de survenue de la maladie du sein (matrice de co-occurrence)

B. Des exemples courants 8 maladies pulmonaires de visualisation (omis)

C. Une entr�e de l'�chantillon (S'il vous pla�t noter que le rapport de radiologie thoracique d'origine rayons X est pas publiquement partag�e)

D. Utilisation de faible profondeur de supervision r�seau neuronal positionnement maladie deux �chantillons

Construire une image m�dicale r�elle � grande �chelle ensemble de donn�es

Ce qui suit est le Dr Lv Le mai de cette ann�e, conf�rence GTC � Construire des ensembles de donn�es d'images m�dicales vraiment � grande �chelle: la profondeur de l'�tiquette pour trouver et reconnaissance extr�mit� ouverte � partie du PPT, que vous pouvez apprendre derri�re ensemble de donn�es radiographie pulmonaire massive de ce NIH a annonc� travail sp�cifique.

L'int�gration de la machine dans le diagnostic de la prise de d�cision humaine pour les m�decins est difficile, les m�decins sont r�ticents � une bonne utilisation, mauvais m�decins ne savent pas comment utiliser. Par cons�quent, il doit y avoir une meilleure coordination des proc�dures de diagnostic humaines. Surtout en m�decine de pr�cision, de nouveaux biomarqueurs d'imagerie afin de mieux aider les m�decins humains font des jugements pr�cis, mais aussi sp�cifique au niveau du syst�me d'extraction de similarit� du patient qui permet un traitement personnalis� possible.

Il y a trois cl�s associ�s � cela, une d�tection et un diagnostic assist� par ordinateur, et deuxi�mement, la segmentation s�mantique dans l'analyse d'images m�dicales, et le troisi�me est la plus vraie de grands ensembles mines d'information de profondeur de donn�es (y compris le texte et les images).

Sur le chemin de surmonter le probl�me de la m�decine des radiations, la p�nurie des ensembles de donn�es d'images m�dicales disponibles est devenue un probl�me majeur. Les chercheurs ont travaill� � fournir de meilleures solutions.

recherche connexe, le Dr Wang Xiaosong, Peng Yifan ,, Hoo-chang Shin, le Dr Lv Yue, qui a �t� engag�e.

En dessous de ce papier CVPR-17 est la base de cette publication NIH d'ensemble de donn�es d'image de rayons X.

Sur la base des r�alisations existantes, nous pouvons voir les futurs d�fis et orientations de recherche: pour am�liorer la pr�cision de la balise d'image, am�liorer la pr�cision de la classification multi-�tiquettes, ainsi que pour am�liorer la pr�cision du positionnement.

Les d�fis sont nombreux, plus de r�sultats, nous vous invitons � nous rejoindre!

Tous les 64 PPT T�l�charger: http: //on-demand.gputechconf.com/gtc/2017/presentation/S7595-le-lu-building-truly-large-scale-medical-image-datatbase.pdf

[Cliquez pour lire ou balayer la moiti� d'achat original du � billet Early Bird �]

Route de la soie

Apprenez � conna�tre la Chine

la poitrine massive � 30.000 patients avec 110.000 images dans 14 cat�gories pathologiques � NIH Publication ensemble de donn�es de rayons X