diagnostic Andrew Ng des r�sultats de pneumonie ne volent pas? Radiologie longue question de la dissertation doctorale: Certains ensembles de donn�es ne peuvent pas utiliser

Lei Feng nouvelles du r�seau, l'imagerie m�dicale est une orientation importante du d�veloppement de l'intelligence artificielle, tout en rivalisant industrie entrant a �galement attir� de nombreux chercheurs de bien connus de participer et ont eu beaucoup de r�sultats impressionnants. L'ann�e derni�re, de nombreuses �quipes nationales et �trang�res ont affirm� utiliser la technologie AI au taux juste au-del� du diagnostic de la maladie humaine, l'algorithme CheXNet Stanford Andrew Ng, qui a fait l'un d'entre eux. Auparavant, Lei Feng r�seau men� des recherches sur la couverture de l'�quipe: � L'�quipe Andrew Ng a publi� les derniers r�sultats de l'imagerie m�dicale, la reconnaissance de la pneumonie avec l'algorithme CNN. � L'�quipe a dit que l'algorithme identifie l'image au-del� du m�decin de la poitrine humaine sur la pr�cision de la pneumonie et d'autres maladies.

Cependant, un autre groupe de chercheurs sur une partie de la recherche actuelle r�sulte en question. L'auteur Luc Oakden-Rayner est l'un d'entre eux, il est le d�partement de radiologie au doctorat � l'Universit� d'Ad�la�de. Selon lui, L'ensemble des donn�es de formation ChestXray14 actuelle ne s'applique pas au travail du syst�me d'intelligence artificielle de diagnostic m�dical. (ChestX-ray14 est le plus grand ensemble de donn�es de photo-coffre receveur contient 100.000 vue de face images � rayons X des 14 maladies)

Pour prouver son point, le Dr Luke Oakden-Rayner abordera les questions suivantes dans cet article: La pr�cision de l'�tiquette, les �tiquettes de signification m�dicale, l'�tiquette de l'importance de l'analyse d'image .

Lei Feng r�seau de Dr. Luke article Oakden-Rayner �tait de ne pas changer l'intention de Xuanyi

ensemble de donn�es ChestXray14 du papier � ChestX-ray8: H�pital �chelle poitrine Base de donn�es de rayons X et points de r�f�rence sur la classification supervis�e par Faiblement et localisation des maladies courantes Thorax �, depuis la premi�re version, les documents et les pi�ces justificatives des ensembles de donn�es ont �t� mises � jour plusieurs fois.

� mon avis, le papier a besoin de passer plus de temps � expliquer les donn�es elles-m�mes d�finies, parce qu'un grand nombre d'utilisateurs de l'ensemble de donn�es sont les chercheurs en sciences informatiques, en l'absence de connaissances cliniques, cette demande est particuli�rement importante. Cependant, cet article pr�sente une exploration de texte et des t�ches de vision par ordinateur, il y a un graphique montrant la pr�cision de l'�tiquette de jeu de donn�es.

Les premiers r�sultats o� montrent (moiti� sup�rieure) est r�alis�e sur un ensemble de donn�es de test a r�v�l� Openi, y compris non seulement le rapport, il y a une artificielle compl�te d'�tiquette marqu�e. La liste ci-dessous fait partie ChestX-ray14 propres donn�es. Les chercheurs ont choisi au hasard 900 rapports par deux commentateurs pour marquer leur classification commune des 14 maladies d'entre eux. Pour autant que je sache, ces commentaires ne sont pas directement v�rifier l'image.

le volume de donn�es limite la quantit� d'erreur devient grand (si le nombre d'�chantillons 10-30 en tant que cat�gorie, une seule erreur, la valeur pr�dictive positive de 95% intervalle de confiance sera de 75% -88%). Mais si vous permettez un certain �cart, chaque �tiquette semble pr�cision sont 85-99%, au moins refl�ter avec pr�cision les r�sultats du rapport.

Malheureusement, il semble que les �tiquettes ne refl�tent pas exactement la condition . l'�quipe du NIH n'a pas montr� qu'ils ont vu ces images, si elles passent le test match �tiquette de texte du rapport pour d�terminer le bien-fond� du processus d'annotation d'image. Je pense que cette s�paration m'a conduit aux probl�mes de qualit� de l'�tiquette propos�e.

Il y a plusieurs fa�ons de construire une image sans avoir recours � l'image de l'�tiquette. Les codes de la CIM, des �tiquettes ou extraites du rapport ou tout autre texte libre, des donn�es suppl�mentaires peuvent �galement �tre utilis�es (donn�es de suivi). Dans une �tude approfondie, nous voyons la courbe de formation, test de gradient, la formation d'essayer de tester si un surajustement en l'absence de r�gularisation. Voir ces images v�rifient l'int�grit� de radiologie - Voir les images, assurez-vous qu'ils sont attendus.

Je habituellement 10 minutes pour compl�ter l'image de lecture 200 stade primaire de � contr�le d'int�grit� �.

Premi�re partie: �tiquette ChestXray14 l'image pr�cision de jeu de donn�es

Voulez-vous dire un tas de balises de collecte de donn�es bas�es sur l'image. Ils sont choisis au hasard ensemble de s�quences comprenant 18 images.

Mon �tiquette n'est pas parfait, d'autres radiologues possible pour certaines de ces �tiquettes ont des doutes. Mais il doit �tre clair que les r�sultats de mon label et du papier / annexe diff�rent grandement.

Je habituellement comme les donn�es dures, alors j'essaie de quantifier la pr�cision de l'�tiquette. En fait, je trouve que beaucoup de ces �tiquettes sont difficiles � d�finir, et ne figurent donc pas dans le tableau suivant. Je regarde chaque cat�gorie de plus de 130 images, le taux d'exactitude est calcul� en fonction sur l'�tiquette originale de mon jugement visuel. La quantit� de donn�es est plus adapt� � une utilisation parce que 95% intervalle de confiance peut alors d�velopper / r�duire de 5%, si le taux d'erreur que je peut atteindre 20%.

Ma vision par rapport � l'analyse du papier les r�sultats de l'exploration de texte

Encore une fois, je pense que mon droit d'�tiquette � la fin, en particulier, et le radiologue r�sultat la d�termination de la poitrine par rapport, mais dans le tableau ci-dessus, la diff�rence est trop grande. Je pense que les donn�es du tableau ci-dessus montrent que ces �tiquettes ne peuvent pas correspondre � l'image affich�e dans la maladie.

Il y a plusieurs fa�ons d'expliquer ce ph�nom�ne. Par exemple, les images initiales permettent d'expliquer le radiologue de l'information autre que l'image. Ils ont l'exp�rience clinique, m�dicale et d'autres r�sultats pr�c�dents. Cette information est tr�s utile, en particulier pour distinguer les maladies similaires.

Si un expert humain ne peut pas faire un diagnostic que de l'image, le syst�me AI est susceptible d'�tre incapable de diagnostiquer. AI peut �tre en mesure de trouver quelques �l�ments de preuve de n�gligeable humaine, mais avec ceux-ci est une �norme diff�rence dans la performance peut �tre g�n�r� et d�raisonnable. Dans l'ensemble, nous avons besoin de l'�tiquette et de l'image qui contient les m�mes informations.

Partie II: Qu'est-ce que cela signifie marque en m�decine?

Ce qui en fait marqu� nom? Ils refl�tent la pratique clinique il? Je pense que la r�ponse est non.

Je pense que le plus difficile � r�soudre est la consolidation de l'�tiquette / infiltrat / at�lectasie / pneumonie collecte et ainsi de suite. Ces images sont �galement d'autres probl�mes m�dicaux, et les t�ches li�es � la valeur clinique, tels que exsudative (Effusion), pneumothorax (pneumothorax), la fibrose. Par exemple, pneumothorax est tr�s faible dans les images � rayons X, souvent ignor�e ou marqu�e taux de pr�cision de la fibrose est tr�s faible. En fait, il y a beaucoup d'autres probl�mes cliniques non-image, tels que:

La pneumonie, l'emphys�me et la fibrose sont les plus probl�me d'imagerie m�dicale de diagnostic clinique plut�t qu'un probl�me.
Les rayons X peuvent manquer jusqu'� 50% des kystes, afin que nous puissions soup�onner rapport de kyste marqu� adopt�.
Personne ne se soucie hernie intermittente, mais parfois ils ont �t� diagnostiqu�s.

Trouver les bons r�glages de donn�es ou l'�tiquette correcte pour apprendre la t�che m�dicale efficace est tr�s difficile. De m�me, nous avons encore besoin d'un expert pour voir les images pour �tablir un diagnostic m�dical.

Partie III: Quels sont les avantages de l'image d'analyse d'images m�dicales?

applications d'apprentissage profondeur radiologie il y a un gros probl�me, si vous ne voyez pas l'image, les cons�quences seront tr�s graves. Si ces �tiquettes est tr�s pr�cise, et le sens de l'�tiquette ne sont pas fiables, alors comment construire sur ce mod�le de jeu de donn�es est d'obtenir de bons r�sultats, il? Quel mod�le d'apprentissage � la fin est?

En fait, nous cherchons � apprendre les r�sultats r�els de sortie peut mod�le correct sur l'ensemble de test, m�me si le r�sultat r�el que l'on appelle visuellement sens.

Les r�sultats de CheXNet: Utiliser le mod�le d'apprentissage en profondeur (. Rajpurkar et Irvin et al) pour d�tecter la pneumonie expert en mati�re de rayonnement sur la poitrine carte rayons X, obtenir une bonne performance sur l'ensemble de test.

Au hasard peut �tre aussi bon terme de r�gularisation du bruit, et m�me de meilleures performances dans certains contextes (Cette technique est appel�e une �tiquette lisse ou �tiquettes souples). bruit structur� est pas le m�me, il ajoute un signal compl�tement diff�rent, et le mod�le va essayer d'apprendre ces signaux.

Dans une mauvaise �tiquette contenant la formation centralis�e, le r�seau de neurones leur �tiquette comme la pneumonie �chantillon tout aussi valable. Si le mod�le d'apprentissage de ces �tiquettes, par exemple, � � quatre pattes � est un signe de pneumonie, alors ce mod�le sera appliqu� au signal graphique de la poitrine, la sortie des r�sultats impr�visibles.

partie caract�ristique de l'apprentissage du mod�le d'image de chien sera utilis� et appliqu� � la figure de la poitrine, bien que cette question et n'a rien � voir.

Si votre objectif est d'optimiser les performances, l'impact n�gatif du bruit sera toujours structur�. Il est �vident que m�me besoin du bruit (o� la relation est non lin�aire), mais l'�cart r�duira la pr�cision du mod�le d'�tiquette.

Rolnich et al � apprentissage profond est robuste au bruit de l'�tiquette massive � r�sultats sugg�rent que structur� d�truit bruit l'�tiquette, et rend la d�gradation des performances. Lorsque le bruit et la source de donn�es r�elles est le m�me, le probl�me peut �tre plus de mal, parce que le mod�le sera confondu avec la cat�gorie de bruit. Cette analogie avec ChestXray14 ensemble de donn�es, leurs �tiquettes est �galement d�truite.

Par cons�quent, ces �tiquettes amoindrira les performances du mod�le. Alors, pourquoi avoir une tr�s bonne performance dans le mod�le de formation des ChestXray14? Est les mod�les de donn�es de compensation du bruit peuvent devenir encore robustes?

Je ne pense pas que nous devons nous concentrer sur d'autres aspects. En fait, dans la construction d'un nouveau label pour le processus de collecte de donn�es, je dois simplifier les t�ches impliqu�es par la cr�ation d'une classe � opacit� � et une cat�gorie � sans conclusion �. Je mis en place une nouvelle �tiquette cr��e avec l'�tiquette d'origine, � l'opacit� � est at�lectasie, la combinaison de la pneumonie, la consolidation et l'�tiquette de p�n�tration, puis former un mod�le sur elle.

Je ne ai besoin d'utiliser un pr�-form� � IMAGEnet ResNet, et le r�seau dans la nouvelle partie de l'ensemble des donn�es de formation. Je ne suis pas hyper-param�tres ajuster, tout mod�le de formation dans un d�lai raisonnable, la performance du mod�le final est tout � fait bon.

Bien que l'ASC est de 0,7, mais compatible avec le taux d'erreur d'�tiquetage, notre performance de classification est tr�s mauvaise. Le mod�le ne peut pas ignorer la mauvaise �tiquette, et la sortie de la pr�diction, il n'a pas la robustesse du bruit de l'�tiquette. Plus important encore, les valeurs d'AUC ne refl�tent pas la performance du diagnostic, cela est un gros probl�me.

Le syst�me AI apprend � pr�dire de fa�on fiable la sortie de sens. Il est la fa�on d'apprendre l'image pr�sente la � opacit� � des cas devient presque pas d'ambigu�t�, mais � aucune opacit� � de l'affaire est jug�e comme des irr�gularit�s graves dans les poumons.

Tel est le probl�me, parce que si vous lisez l'image, sinon le r�sultat sera ce grand. Mod�liser les performances de chaque �quipe sont de mieux en mieux, il semble, AUC plus de points et plus qu'ils semblent � r�soudre � une mission m�dicale s�rieuse.

Je pense qu'il ya un certain nombre de raisons; image m�dicale vaste et complexe, avec de nombreux �l�ments communs. Cependant, la m�thode d'excavation automatique n'est pas incorpor� �tiquette inexact bruit al�atoire. La nature du programme d'exploration de texte conduira � soutenue, la d�pendance inattendue ou des donn�es hi�rarchiques.

De m�me, le Dr Novoa de dermatologie � l'Universit� de Stanford a r�cemment discut� de cette question dans les m�dias:

Pour mesurer avec pr�cision sa taille - quand un dermatologue pour voir une l�sions tumorales possibles, ils contribueront � une r�gle - qui est, lorsque vous utilisez le genre de l'�cole primaire. Les dermatologues font afin de voir les l�sions. Ainsi, dans une s�rie d'images de biopsie, s'il y a une image de la r�gle, l'algorithme d�termine qu'il est plus susceptible d'�tre maligne, en raison de la possibilit� de la pr�sence de troubles li�s au cancer de la r�gle. Malheureusement, Novoa a soulign� que l'algorithme ne sait pas pourquoi cette relation est logique, il est donc facilement interpr�t� � tort comme une r�gle al�atoire est bas�e sur le diagnostic du cancer.

l'apprentissage en profondeur est tr�s forte, si l'entr�e d'image complexe polaris� pour marquer, il peut apprendre � classer ces cat�gories, m�me si elles sont vides de sens. Vous pouvez PARFAITE l'ensemble de la formation de la balise al�atoire, mais les r�sultats montrent que le r�seau profond assez puissant pour ne pas oublier les donn�es de formation. Ils ne montrent pas de donn�es de test de g�n�ralisation, au contraire, ils d�montrent la performance des d�g�ts du bruit.

Je ChestXray14 en effet des donn�es al�atoires faites par une �tiquette de test rapide (autre contr�le d'int�grit�), le m�me r�sultat trouv� dans Zhang et al ;. Et pas g�n�ralis� pour mod�liser l'ensemble de test.

bruit structur� est pr�sent non seulement dans les donn�es de formation. erreur de balise � travers les donn�es de test est �galement conforme. Cela signifie que si un mod�le m�dical pour apprendre � faire une mauvaise pr�vision, il pourrait peut-�tre obtenir de meilleures performances de test. Cela peut uniquement g�n�r� automatiquement par onglet m�thodes � data mining �, mais je trouve aussi une vari�t� de voies menant � la stratification des donn�es de radiologie d'�tiquette artificielle.

rapports de radiologie ne sont pas objectives, en fait, la description de l'image. Le rapport de radiologie but est de fournir des informations utiles, exploitables pour leur personne recommand�e (habituellement un autre m�decin). � certains �gards, le radiologue recommand� deviner ce que les gens veulent l'information, et �liminer les informations non pertinentes.

Cela signifie que en fonction de la situation clinique, l'histoire pass�e et radiologues qui, deux rapports de la m�me image peuvent �tre �tiquet�s diff�rents � tags. � Facteurs affectant les rapports de radiologie, il y a de nombreux facteurs � tous les rapports de radiologie apportent du bruit structurel. Chaque petit cas peuvent avoir des caract�ristiques d'image uniques peuvent �tre apprises.

Il y a beaucoup d'autres �l�ments visuels peuvent �tre divis�s en plusieurs groupes de patients, y compris une qualit� d'image (selon la consultation externe des patients, des patients hospitalis�s, diff�rents soins intensifs), des moyens d'introduction comme un stimulateur cardiaque ou la pr�sence de c�bles ECG, le corps et autres habitudes . Ces facteurs ne sont pas � diagnostic �, mais ils sont susceptibles d'avoir des degr�s de corr�lation avec l'�tiquette, est susceptible de trouver web profond est une chose.

Les chercheurs m�dicaux ont longtemps �t� confront�s � la gestion hi�rarchique des donn�es cliniques. Comme l'�ge, le sexe, le revenu, le r�gime alimentaire, ces facteurs conduisent � la stratification � cacher �. Nous devons aussi savoir � peu pr�s l'aspect visuel de l'ensemble du groupe de distribution sont similaires, ce qui signifie que vous devez voir l'image.

conclusion

Les probl�mes ci-dessus ne signifie pas que la profondeur de l'apprentissage pour l'imagerie m�dicale est sans valeur. �tude approfondie du point le plus important est que cela a fonctionn�. Bien que nous ne comprenons toujours pas pourquoi, mais si vous avez un bon r�seau de donn�es suffisamment profondes et �tiquette, ce sera la priorit� fonctionnalit�s triviales apprendre des fonctionnalit�s utiles pour ces cat�gories, plut�t que de sens.

Par rapport � l'�valuation visuelle humaine, jeu de donn�es d'�tiquettes inexactes ChestXray14, claires, et le secondaire est souvent la d�couverte m�dicale d�crit.

Ces questions d'�tiquettes est � coh�rence interne � dans les donn�es, ce qui signifie que le mod�le peut montrer � bonne performance du jeu de test �, tout en produisant la pr�diction n'a pas de signification m�dicale.

Les �missions de probl�me ci-dessus que la d�finition actuelle de l'ensemble de donn�es ne convient pas pour le syst�me de soins de sant� de formation, l'�tude de l'ensemble de donn�es ne peut pas produire un certificat m�dical valide sans raison valable suppl�mentaire.

Voir les images sont l'analyse d'image � contr�le d'int�grit� � de base. Si vous construisez un ensemble de donn�es, aucun humain ne peut comprendre les donn�es que vous voyez dans l'image, puis les ensembles de donn�es d�sir� travail vous d�cevrons.

donn�es d'image m�dicale est pleine d'�l�ments en couches, caract�ristique utile peut apprendre presque tout. Voyez si votre mod�le � chaque �tape comme d'habitude. Tant que l'�tiquette est assez bon, l'apprentissage en profondeur peut se concentrer sur le travail dans ces donn�es.

Lien original: https: //lukeoakdenrayner.wordpress.com/2017/12/18/the-chestxray14-dataset-problems

Route de la soie

Apprenez � conna�tre la Chine

diagnostic Andrew Ng des r�sultats de pneumonie ne volent pas? Radiologie longue question de la dissertation doctorale: Certains ensembles de donn�es ne peuvent pas utiliser

Premi�re partie: �tiquette ChestXray14 l'image pr�cision de jeu de donn�es

Partie III: Quels sont les avantages de l'image d'analyse d'images m�dicales?

conclusion