Cercles | problèmes de segmentation d'images médicales Percée: réglage automatique des paramètres pour adapter à tous les ensembles de données

Cet article est reproduit de Lei Feng réseau AI dig Kim Ji

Contribution appo-Net est que: non seulement peut être utilisé comme outils de segmentation de la boîte, peut également être utilisé comme base de référence U-Net et puissante plate-forme pour une future division médicale des documents connexes publiés.

Compile | Kaka

Récemment, un article du Centre de recherche allemand sur le cancer, papier division imagerie médicale appelée appo-Net de l'Université de Heidelberg et de l'Université de Heidelberg hôpital a attiré une grande attention.

L'équipe est venu avec un cadre de segmentation d'images médicales possibles d'adaptation pour tout nouvel ensemble de données, le cadre peut régler automatiquement tous les paramètres en fonction des attributs sur un ensemble de données, le processus sans intervention humaine. Se fonder uniquement sur la structure simple U-Net et des programmes de formation solide, appo-Net a reconnu une scission dans les six défis pour atteindre les performances les plus avancées.

résumé

Dans la promotion de la diversité des ensembles de données, la segmentation sémantique est un sous-domaine de l'analyse d'image médicale populaire, chaque année un grand nombre de nouvelle méthode. Cependant, cette méthode complexe de plus en plus est de plus en plus difficile à atteindre. En même temps, beaucoup de la méthode proposée n'a pas réussi à promouvoir à l'extérieur du document présenté, entravant ainsi le processus de développement dans le nouvel ensemble de l'algorithme de segmentation de données.

ici, Nous vous proposons appo-Net ( « non-new-Net ») - un nouveau cadre adaptative tout ensemble de données. Bien que jusqu'à présent le processus est complètement entraînée par des humains, mais nous avons d'abord tenter d'effectuer automatiquement les réglages nécessaires à un ensemble de données des attributs donnés, telles que les données de pré-traitement, la taille du bloc d'image, la taille des lots et le raisonnement fourni.

Il est à noter que, appo-Net supprimé la structure du réseau de fantaisie proposée dans la communauté universitaire, mais seulement compter sur la structure simple U-Net intégré dans un solides programmes de formation. appo-Net a reconnu une scission dans les six défis pour atteindre les performances les plus avancées.

introduction

la segmentation sémantique est encore un sujet de recherche chaud dans le domaine de l'informatique d'images médicales, 70% de gravite de la concurrence internationale autour d'elle se dérouler. Parce durable préoccupation est bien sûr une raison importante de la diversité et des caractéristiques individuelles des ensembles de données d'imagerie rencontrés dans le domaine médical: La taille des données entre des ensembles de données, les dimensions de l'image, la taille de l'image et l'échelle de gris gamme de niveaux de gris de voxel représentations très différentes.

label image peut être très déséquilibrée, peut ne pas être clair, mais la qualité de l'étiquette entre les ensembles de données est très variable. En outre, certains ensembles de données de la géométrie de l'image est très inégale, une feuille ou un cas dans lequel le pas de l'alignement peut se produire et inégale. Pris ensemble, ces cas font les résultats d'une tâche généralisée à d'autres tâches plus difficiles, et quand réappliquer ces méthodes pour résoudre un autre problème, ils ont tendance à échouer.

Ajustez la décision de conception ou de proposer un nouveau processus de concept est complexe: la plupart des options dépendent fortement de l'autre, la preuve que le choix de la distribution dans de nombreux documents, y compris beaucoup de « bruit ». Ainsi, ces dernières années, les chercheurs ont mis en avant un certain nombre de segmentation. Un exemple bien connu est: décodeur U-Net telle bande de sauter connexion - variantes encodent différentes structures, y compris l'introduction d'une connexion résiduelle, connexion intensive, les mécanismes d'attention, la perte de la couche auxiliaire supplémentaire, et d'autres caractéristiques recalibrage (couche de mise au point automatique).

Des modifications spécifiques très différentes les unes des autres, mais ils ont tous un accent particulier sur les changements d'architecture réseau. Compte tenu du grand nombre de documents relatifs à la division, ainsi que la diversité et les défis associés à des ensembles de données spécifiques pour obtenir de plus en plus difficile de suivre ces documents pour déterminer quels sont les principes de conception vraiment été promu vérifiées de l'expérience. Sur la base de notre propre expérience, de nombreux nouveaux concepts de conception et de ne pas améliorer les performances de segmentation, parfois même endommager les performances de la ligne de base.

Une question clé aujourd'hui est de calculer des images médicales (split) méthode est appliquée aux nouveaux enjeux de processus entièrement impulsés par l'homme fait. Il est basé sur l'expérience, le document met l'accent sur la structure du réseau, et sauter sur tous les autres paramètres. Le procédé de réglage de référence généralement sous-optimale afin de compenser en proposant une nouvelle structure. Étant donné que la super-forte dépendance de l'espace des paramètres et un grand nombre de minima locaux, ce qui rend la méthode mieux adapter au nouveau problème devient très difficile, donc tout le monde dans ce cycle ne peut pas vraiment être blâmé. Toute cette situation pour les chercheurs et les milieux universitaires, il est frustrant. Surtout dans un tel ensemble diversifié de champ de données de l'imagerie médicale, le progrès dépend en grande partie de notre capacité à résoudre ces problèmes.

Ce document tente de prendre la première étape dans cette direction: nous vous proposons un non-new-Net (UNN-Net), comprenant s'adapter automatiquement aux nouveaux ensembles de données de segmentation. Sur la base de l'analyse automatique de l'ensemble de données, la conception automatique appo-Net et la mise en uvre du processus de formation du réseau. Autour d'une architecture standard de réseau U-Net, nous supposons que la segmentation par un ensemble de système et une sélection rigoureuse des paramètres produiront des performances ultra-concurrentiel. En fait, sans aucun réglage fin manuel de la situation, qui met en uvre le plus de performance de pointe sur plusieurs critères de division médicale bien connu.

méthode

algorithme de segmentation peut être formalisé comme fO de fonction (x) = y, où x est l'image, y est la segmentation prédite correspondante, est l'application voulue du procédé de formation et un ensemble ultra-paramètre. peut être très grandes dimensions, y compris l'ensemble du processus de prétraitement au raisonnement. De nombreux articles ont généralement porté sur le rapport et confirmé en sélectionnant les plus pertinents sur , il fournira le code source dans des circonstances idéales pour couvrir complètement . Toutefois, si vous passez à un nouveau ensembles de données ont des attributs différents, ce manque de compréhension de la façon dont le processus d'ajustement de . Ici, nous avons d'abord tenter de formaliser ce processus.

Plus précisément, nous cherchons l'ensemble de données entre une bonne fonction de promotion g (X, Y) = . Dans la première étape, vous devez identifier ces paramètres ne nécessitent pas ultra-ajustement, dans notre cas, ces paramètres sont le reflet d'un système de segmentation super puissant mais simple et un solide programme de formation, ces facteurs sont dynamiques, la nécessité d'apporter les changements correspondants dans X et Y.

Dans la deuxième étape, on définit g de paramètre dynamique, un ensemble de règles heuristiques dans notre exemple, pour ajuster la normalisation et système de ré-échantillonnage, taille de bloc et la configuration de la taille de l'image et de la structure de réseau informatique spécifique en vrac y compris l'intégration réseau et le raisonnement. En résumé, appo-Net est peut adapter sans cadre d'interaction utilisateur divisé différents ensembles de données ne voit pas.

2.1 Prétraitement

normalisation de l'image

Cette étape nécessite des informations modalité d'entrée de données. Si le mode est pas la CT, la NNU-Net en soustrayant la moyenne et l'écart type divisé par les valeurs de gris d'intensité normalisée. Si la modalité est CT, est automatiquement exécuté de 0,5% à 99,5% Niveau distribution d'intensité de cisaillement similaire de la fenêtre de forte valeur de gris de l'ensemble d'apprentissage est divisé région de premier plan. Afin de répondre à la méthode d'initialisation de poids typique, en utilisant la moyenne mondiale de perspectives et l'écart type des données est normalisée.

espacement voxel

NNU-Net chiffres tout terrain dans les données d'apprentissage, et sélectionne la valeur de pas pour chaque axe que le pas de cible. Ensuite, utilisez l'interpolation spline du troisième ordre rééchantillonnage tout l'ensemble de la formation. brai anisotrope (ici, le plan de tangage de l'enveloppe extérieure en particulier plus de trois fois plus grande que l'in-plane) interpolation peut provoquer des artefacts. Dans ce cas, nous utilisons l'interpolation du plus proche voisin pour compléter le plan. Pour chaque catégorie d'étiquettes de segmentation correspondant, en utilisant le rééchantillonnage d'interpolation linéaire.

2.2 étape de formation

Architecture de réseau

Trois configuration modèle U-net (cascade 2D U-Net, U-Net 3D et deux modèle 3D U-Net) indépendamment l'un de l'autre, la conception et la formation. Dans la cascade de deux modèle d'architecture U-Net 3D, un modèle qui génère les premiers résultats de segmentation de résolution, suivie par l'étape suivante par un second raffinement du modèle. En ce qui concerne l'original réseau U-Net, nous ne les trois modifications suivantes: La première consiste à utiliser une opération de convolution de remplissage de bord de bande pour obtenir une production constante et la forme d'entrée, et le second est un exemple normalisé, le troisième est au lieu d'utiliser Leaky Relus Relus.

réseau hyperparam'etre

Ces paramètres doivent ajuster la forme des données de formation pré-traitées. Plus précisément, NNU-Net règle automatiquement la taille du lot, le nombre de blocs d'images de mise en commun et la taille de chaque axe, de telle sorte que les restes de la consommation de mémoire à l'intérieur d'une certaine plage (12 GB GPU TitanXp). Dans cette étape, plus la taille du bloc d'image h préférence à la taille du lot (taille du lot minimum de 2), pour obtenir d'autres informations de contexte spatial. La taille de chaque axe sera mise en commun des voxels à 4 ou moins. Toute la structure U-Net en utilisant un filtre de convolution 30 dans la première couche, et ce nombre est doublé à chaque opération de mise en commun. Dans un cas typique, si la taille du bloc d'image sélectionnée de la couverture de voxel inférieur à 25%, sera utilisée dans les données de formation échantillonnés concaténés 3D U-Net. Lorsqu'une image est destinée taille de bloc en cascade est trop petit pour couvrir toute la résolution de l'UNN-Net obtenir encore le contexte adéquat.

formation réseau

Toute la structure U-Net ont été la moitié de la formation validation croisée. Chaque tour est à 250 petits lots. Jeu de dés en utilisant la perte et la perte d'entropie croisée en tant que somme de la fonction de perte. Adam optimiseur utilisé comme un taux d'apprentissage initial de 3 × 10-4, la pourriture l2 en poids de 3 × 10-5. La formation moyenne mobile exponentielle lorsque la perte est pas améliorée au cours de la dernière période de 30, le taux d'apprentissage a diminué à 0,2 fois. Lorsque le taux d'apprentissage inférieur à 10-6 ou plus de 1000 cycles de formation, la formation d'arrêt. Nous utilisons le cadre de batchgenerators pour l'amélioration des données en ligne pendant la formation. Plus précisément, on utilise la déformation élastique, la rotation aléatoire et aléatoire et mise à l'échelle de la mise en valeur gamma. Si les données sont anisotrope, la transformée spatiale effectuée dans le plan 2D.

2.3 Raisonnement

En utilisant une méthode de fenêtre glissante de prédiction de chaque cas, dans lequel la zone de chevauchement est réglé sur la moitié de la taille du bloc d'image. Cela augmente le droit de la zone près du centre de la lourde prévue. les données de test Inverted pour améliorer sur tous les axes.

NNU-Net intégré combinaison formée par deux U-Net (2D, 3D et cascade), et sélectionner automatiquement le meilleur modèle pour la prédiction ou ensemble de test intégré selon les résultats de la validation croisée. Plus encore, appo-Net est également produit en utilisant la validation croisée du modèle intégré de cinq.

résultat

appo-Net était à l'origine dans la division médicale sur la première étape du Défi Décathlon Décathlon sept formations ensemble de données mis au point. Défier l'ensemble de données couvre beaucoup de différences et les défis dans les problèmes de la division médicale normalement rencontrées. appo-Net Défi divisé (première étape et la deuxième étape) dans le décathlon médical et cinq autres défis de la division médicale populaire ont été évalués. Tous les résultats défi sont présentés dans le tableau 1.

Figure 1: la performance de la segmentation appo-Net ensemble de données de test dans la médecine respective. Tous les classements sont soumis sur un graphique (en date du 19 Mars 25). Numérique Décathlon, LITS, ACDC et BCV dés points, lésion MS et différentes mesures PROMISE12 utilisation.

division médicale Décathlon (Decathlon)

La première étape des défis comprennent les ensembles de données sept susmentionnés, les participants utilisent ces ensembles de données pour développer l'algorithme de segmentation peut être favorisée. Dans la deuxième étape, il fournit un trois autres ensembles de données inconnues. L'algorithme ne fait pas d'autres changements ou l'interaction de l'utilisateur appliqué à ces ensembles de données. L'évaluation des deux étapes sont définies dans le test officiel effectué. Dans les première et deuxième phases, appo-Net a un net avantage dans le défi du décathlon.

split coeur Challenge (ACDC)

Deux images ciné-IRM au cours de chaque coeur est divisé en trois parties. Défi offre 100 cas de formation, chaque cas, il y a deux périodes. Nous avons divisé les données manuellement appo-Nets pour la moitié de la course validation croisée. appo-Net a fait le premier (sur 50 test) dans la liste ouverte, et définit les données atteignant l'état de l'art.

segmentation verticale de multiples lésions de sclérose en plaques défi

division des tâches sclérose en plaques dans l'image IRM. Fournit cinq patients, chaque patient a 4-5 points de temps (un total de 21 points de temps), il y a deux assesseurs, chaque point de temps des commentaires. Nous évaluerons chaque personne comme un ensemble de formation séparée et diviser manuellement les cas de formation pour assurer la stratification des patients. Dans l'ensemble de test, appo-Net a classé 163 ont été présentés dans le cinquième avec un score de 93,09, juste derrière les quatre Vanderbilt University a présenté les résultats dont le meilleur score 93,21.

PROMISE12

tâche de segmentation de la prostate est anisotrope dans l'image IRM. Offres 50 cas de formation annotés et 30 cas de test non étiquetés. ensemble de test appo-Net score de 89,08, se classant au 11e rang sur 290 au total ont été présentées en (première: 89,59).

lITS

segmentation d'une tumeur du foie défi par 131 images d'apprentissage (CT) et 70 des composants de test. Pour les cas de formation, il offre la segmentation du cancer du foie et du foie. appo-Net sur la maladie et le foie scores dés étaient 0,725 et 0,958. En supprimant toutes les régions autres que la zone de premier plan après la communication maximale de traitement dés augmentation du score à 0,738 et 0,960, dans la partition de la lésion des cartes ouvertes a atteint dés divisé état de l'art, et l'équipe du foie divisé le classement 12317 bit (première: 0,966).

Au-delà du défi voûte crânienne (Abdomen)

L'ensemble des données de tâche est divisée 13 organes dans les images CT abdominales. Défi offre 30 images formation annotés et 20 images de test. appo-Net sur cet ensemble de données atteint l'état de l'art, le score moyen dés de 88,1%, plus élevé que les trois deuxièmes points (un total de 43 tableaux présentés). Plus précisément, appo-Net 11 Meilleur score particulier de 13 organes.

Le tableau 2 montre l'étude d'ablation afin de vérifier la sélection appo-Net et dans la conception. Toutes les expériences ont été effectuées en utilisant les mêmes données dans le jeu de partitionnement des données représentatives Décathlon de la première étape. Ces résultats indiquent que nous devrions modifier une part, l'utilisation de Leaky Relus, d'autre part pour vérifier les exemples que nous avons choisi la normalisation, l'amélioration des données et la perte de l'effet de la fonction.

2 représentée sur la figure. choix de conception appo-Net expériences d'ablation. Une partie des données de formation et 3D U-Net Decathlon des données représentatives établies à partir de l'expérience. valeurs NNU-Net représentent la moyenne des notes d'avant-plan de dés (tamis des tumeurs du foie et du foie, par exemple en moyenne ensemble de données de coefficient), l'ablation de partition dés représente le changement de pourcentage dans l'étude.

discuter

Nous avons introduit appo-Net, peut adapter automatiquement à un ensemble donné de données sans cadre d'intervention de l'utilisateur de la division médicale. À notre connaissance, appo-Net est le premier à essayer les ajustements nécessaires doivent être répartis entre le cadre de la collecte de données formelles. appo-Net atteindre les meilleures performances de pointe dans six défi partagé public. Il est très remarquable, car appo-Net ne dépend pas d'une variété de structure multi-domaine complexe proposé ces dernières années, mais seulement compter sur la structure simple U-Net. Il faut souligner que nous ne devons pas régler manuellement le défi de l'hyper-paramètres entre les ensembles de données, tous les choix de conception sont déterminés automatiquement par UNN-Net de. Encore plus surprenant est qu'il est plus que d'autres algorithmes spécialement conçus manuel sur la partie de l'ensemble de données.

appo-Net comprend un nombre fixe de choix de conception communs, tels que la structure U-Net, dés, la perte de données et de modèles pour améliorer l'intégration, ainsi que certains design dynamique sélectionné est déterminée par un ensemble de division suivre nos règles d'expérience. Bien que, la meilleure façon d'utiliser ces règles ne peuvent pas résoudre ce problème. Plus d'un ensemble de données, les travaux futurs peut essayer de données d'ensemble d'attributs de l'étude directement ces règles. Bien que les choix appo-Net peuvent se concentrer sur la réalisation de bonnes performances dans plusieurs division de données, mais cela ne signifie pas que nous devons trouver la configuration globale optimale.

En fait, on peut voir à partir des expériences d'ablation indiquées dans le tableau 2, remplacer Relu de Leaky sélection Relu n'a pas affecter les performances, nos solutions d'amélioration des données peuvent ne pas appliquer à tous les ensembles de données, de post-traitement doit également une étude plus approfondie. Les résultats montrent que nous LITS, post-traitement le bon choix peut être bénéfique. Un tel post-traitement peut être automatisé ou en analysant les données de formation par validation croisée en fonction du résultat du schéma de sélection. Cette partie automatisée tentative de la version initiale de UNN-Net au cours de Décathlon Défi, mais en raison de l'amélioration continue ne peut pas être mis au rebut.

Maintenant que nous avons mis en place, nous pouvons systématiquement évaluer à ce jour le plus puissant de base U-Net, la polyvalence d'une conception de réseau plus avancé et la performance par rapport au cadre général adopté ici la mise à niveau. Par conséquent, appo-Net ne peut être utilisé que comme des outils de segmentation de la boîte, peut également être utilisé comme base de référence U-Net et puissante plate-forme pour une future division médicale des documents connexes publiés.

Documents originaux https://arxiv.org/abs/1904.08128

Ouvrez adresse source https://github.com/MIC-DKFZ/nnunet

Les produits secs | usage kNN de fantaisie
Précédent
Hot | Zhou Zhihua recommandé aux utilisateurs du système de renseignement de formation professionnelle et de la formation artificielle Guoneishoubu: un peu difficile
Prochain
Le visage de la précision et l'efficacité de la compréhension du contenu, Facebook est l'utilisation de la technologie d'auto-surveillance
La réduction des charges de sécurité sociale pour la gestion de la mise en uvre formelle de cette année, il y a trois changements majeurs dans la sécurité sociale
Nouvelles | Institut de l'Université de Tsinghua a établi la théorie de base du centre de recherche en intelligence artificielle, Zhu a été directeur de la « troisième génération » profonds algorithm
vague mondiale Kompany a éclaté dans la boîte à gagner Aguero, Manchester City 1-0 Leicester City
Dynamic | Réglage du widget pour commencer, secondes AI pour vous permettre de devenir fashionistas
Ding Feng | hommage au fondateur de la Chine Intelligence artificielle M. WANG Xianghao
hydrogénation du benzène / benzène brut: Analyse de la chaîne de valeur de l'industrie d'hydrogénation du benzène brut
Suso briser Borigni Pa Kuita accomplissement Substitué rouge, Milan 2-1 Bologne
indice boursier a continué « sur la ligne » voiture utilisée pour l'adhésion à des niveaux de circulation
Amazon part des ingénieurs: Comment faire pour capturer, créer et construire des ensembles de données de haute qualité
Baidu Post Bar post annonce officielle inaccessible temporairement avant 2017
Chine Guide économique: un développement en trois étapes et la chaîne industrielle économie mondiale « Modèle Goose »