Les produits secs | segmentation d'interpr�tation panoramique tous azimuts, la construction et la pr�vision de la d�finition de t�che r�seau

Technologie AI Revue de presse , Auteur Liu Universal, Universit� du Zhejiang ma�tre des sciences de contr�le et de g�nie de l'automatisation, l'Institut des sciences et de la technologie, comme le chercheur de l'algorithme d'exclusion, algorithme panoramique segmentation OANET premier auteur, les int�r�ts de recherche comprennent la segmentation panoramique, la segmentation s�mantique. Il est aussi le 2018 COCO + mapillary vue panoramique jeu de la division d�tection Kuang membres de l'�quipe championne.

Cet article a paru dans presque savoir, Lei Feng r�seau de r�impression autoris�e.

avant-propos

Dans la vision informatique, image segmentation s�mantique (s�mantique Segmentation) t�che est de pr�dire la classe s�mantique pour chaque pixel, division exemples (instance Segmentation) t�che est de pr�dire la zone de chaque pixel contenu dans l'instance d'objet. division panoramique a �t� propos� conjointement par le FAIR et l'Universit� de Heidelberg en Allemagne, sa mission est de donner des exemples de cat�gories et �tiquettes ID pour chaque pixel dans l'image, la g�n�ration d'une segmentation d'image globale, unifi�e.

Ensuite, nous allons interpr�ter pleinement la t�che de segmentation panoramique, suivant cette carte mentale vous aider � saisir les caract�ristiques de la t�che globale de segmentation de panorama:

carte Interpr�tation de l'esprit divis� panoramique

Tout d'abord, nous allons analyser les caract�ristiques de base de l'�valuation et de la division panoramique des t�ches, ainsi que les derni�res avanc�es de la recherche, puis pr�senter notre travail publi� dans CVPR 2019 Occlusion R�seau Aware (OANET), ainsi que Kuang, en tant que groupe impliqu� dans l'Acad�mie de d�tection 2018 COCO l'introduction du tournoi de segmentation panoptique, la segmentation Enfin panoramique de l'�tude sont r�sum�es et analys�es.

Interpr�tation de la t�che et l'avant-garde du progr�s

t�che de segmentation panoramique, la t�che de l'objet cible la segmentation d'instance peut �tre divis�e en segmentation des choses et des sous-t�ches sous-t�ches. Proc�d� de s�paration panoramique comprend g�n�ralement trois parties distinctes: objet section de segmentation d'exemple, la section de segmentation de la substance, le r�sultat de branchement deux partie de sous-condens�; segmentation d'instance d'objet de segmentation de choses en g�n�ral et le r�seau r�seau ind�pendant, ou la caract�ristique d'image non partag�e entre les param�tres de r�seau, de cette fa�on, non seulement conduire � une plus grande charge de calcul, l'algorithme n�cessite une force d'int�gration post-traitement s�par� des deux pr�dictions, et conduisent � la division panoramique ne peut pas �tre appliqu�e dans l'industrie.

Ainsi, l'optimisation peut �tre analys�e � partir de l'algorithme de segmentation suivant l'angle panoramique

(1) des structures de ch�ssis de r�seau;

(2) l'int�gration des sous-t�ches;

(3) d�livre la pr�diction favoris;

Ces trois questions sont, respectivement, ce qui correspond � trois aspects importants algorithme de segmentation panoramique, ci-dessous nous analyser s�par�ment les difficult�s de ces probl�mes, ainsi que des m�thodes et des solutions am�lior�es propos�es r�cemment travaux connexes.

�valuation de la segmentation panoramique

�quipe FAIR est divis� en un ensemble panoramique de nouveaux crit�res d'�valuation PQ (Segmentation panoptique), SQ (qualit� de la segmentation), RQ (qualit� de reconnaissance), calcul�e comme suit:

indice d'�valuation PQ formule de calcul

Dans laquelle RQ est largement utilis� dans le score de d�tection de F1, pour le calcul de la pr�cision de chaque instance de reconnaissance d'objets panoramique divis�, SQ repr�sente la pr�diction correspond au segment apr�s segment marqu� miou, comme indiqu� ci-dessous, et seulement lorsque le segment pr�dit lorsque le segment d'�tiquette IOU strictement sup�rieur � 0,5, qui est deux segments en correspondance.

�tiquettes segmentation panoramique des pr�visions et vrai match illustre

Peut �tre vu de l'�quation ci-dessus, lorsque la qualit� de la segmentation et l'�tiquetage SQ apr�s calcul de pr�diction correspondant, les pr�occupations d'�valuation PQ que la qualit� de la segmentation chaque instance, quelle que soit la taille des diff�rents exemples, � savoir les r�sultats de segmentation d'un grand objet et le petit objet la m�me influence sur le r�sultat final PQ. Yang et al. sont plus pr�occup�s de noter que dans certaines applications un grand r�sultat de la segmentation de sc�ne d'objets, comme un grand portrait divis� carte de segmentation portrait, pilote automatique et d'autres objets dans le PC � proximit� propos� (Parsing couverture) �valuation il est calcul� comme suit:

formule de calcul de l'indice d'�valuation PC

Dans lequel, R, R � repr�sentent des segments correspondant � la classe pr�dite de segments r�els, | R | repr�sente un exemple correspondant de la cat�gorie du nombre r�el de points de pixel marqu�es, Ni repr�sente la somme de la v�ritable type est d�sign� par i de pixels. Des exemples de grands objets en donnant plus de poids, de sorte que l'�valuation peut �tre divis�e refl�tent plus clairement l'indice des grands objets.

Construire un cadre de r�seau

�tant donn� que l'instance d'objet segmentation sous-t�ches et sous-t�ches gavent segmentation appartiennent � deux t�ches de pr�diction visuelle diff�rente, les donn�es d'entr�e et mode d'enrichissement des donn�es, des strat�gies et des m�thodes de formation afin d'optimiser la structure du r�seau et la m�thode est tout � fait diff�rent de la fa�on dont les deux sous-t�ches l'int�gration et de la structure de r�seau unifi�e, la strat�gie de formation est la cl� pour r�soudre le probl�me.

FAIR �quipe de recherche simple et la structure de r�seau efficace Panoptic FPN , masque de r�seau de niveau division RCNN trame r�seau s�mantique divis� r�seau complet de convolution (FCN) et Exemple unifi�e con�ue r�seau unique pr�vu �galement deux sous-t�ches, la structure du r�seau tel que repr�sent� sur la Fig.

La figure Panoptic trame de r�seau FPN

La structure du r�seau peut effectivement pr�voir la segmentation de l'instance d'objet et de segmentation trucs sous-t�ches sous-t�ches. Sur la base du masque r�seau RCNN FPN , les auteurs ont con�u un simple et sous-branches efficaces de segmentation de choses: la vue caract�ristique de la base � diff�rents niveaux de FPN r�sultant de l'utilisation des diff�rents param�tres du r�seau obtenu diagramme caract�ristique de la m�me taille, et dans lequel une addition � la figure combin�s, enfin en utilisant une interpolation bilin�aire �chantillonner l'image originale � la taille, et d'autres choses de pr�diction de la classe.

MIT et comme Google conjointement DeeperLab , en utilisant le processus bas � haut, tout en r�alisant l'instance d'objet segmentation segmentation de sous-t�che sous-t�ches choses, la structure du r�seau, comme indiqu� ci-dessous:

Structure du r�seau DeeperLab

Le r�seau contient un codeur, et la pr�diction de d�codeur trois liens, dans lequel, une partie du codeur et le d�codeur sont partag�s deux sous-t�ches, en vue d'am�liorer les caract�ristiques de l'�tage de codeur, au niveau du codeur d'extr�mit� � utiliser le module PAES (Atrous Spatial Pyramid pooling) < 7>; et dans la phase de d�codage, en utilisant d'abord de 1 x 1 avec un codeur convolutif de rendement figure de bas niveau caract�ristiques caract�ristiques de la r�duction de la dimension figure, utiliser moins de consommation d'espace m�moire et � la profondeur op�ration d'�chantillonnage alternatif . dans lequel de bas niveau comprend de l'op�ration de la figure la figure trait�e aux caract�ristiques de bas niveau de la figure (1/4 format original) et la sortie du codeur (1/16 de la taille originale) assemblant, enfin, l'utilisation d'un grand deux 7 � 7 convolution noyau champ r�ceptives augmente, et diminue ensuite des dimensions de caract�ristique par des op�rations profondeur-espace.

Afin d'obtenir l'instance pr�vue de la cible, similaire � la m�thode de repr�sentation � base de cl�, comme repr�sent�, l'instance objet de la t�te de segmentation des sous-branches, et pr�dit la carte thermique de keypoint (figure A), bien -range carte offset (fig. b) � courte port�e et la carte de d�calage (Fig. C), quatre unit�s de milieu de gamme carte offset (figure d), pour obtenir la relation entre chaque pixel et la clef d'instance, et ainsi de la fusion exemples de diff�rentes classes de forme inconnue, le r�sultat final obtenu la segmentation panoramique.

segmentation cible d'instance d'objet pr�dite sous-branche t�te

L'int�gration des sous-t�ches

Bien que la conception du r�seau, peut �tre sous-t�ches de segmentation instance d'objet et la segmentation des sous-t�ches des choses en unifiant les caract�ristiques du m�canisme de partage, mais li�s entre eux et l'influence entre les deux sous-branche n'a pas �t� explor�, par exemple: deux sous-branches si la t�che peut r�aliser un gain mutuel ou le gain d'effet � sens unique? Ou entre les deux sous-branches ou pr�dire comment la conception associera de sortie? Cette partie du probl�me que nous pouvons appeler l'unit� entre eux pour renforcer la promotion de deux sous-t�ches.

CAS Institut d'automatisation propos� Aunet , papier con�u Module PAM (Proposition Attention Module) et MAM (Masque Attention Module), respectivement, par rapport au premier plan, dans lequel l'�tape RPN la figure et l'instance sortie de segmentation d'objet r�gions divis�es, pour la segmentation de substance fournir le niveau de pixel et l'attention au niveau de l'objet d'attention, dont la structure de r�seau est illustr� ci-dessous:

Structure du r�seau Aunet

Afin de pr�voir la sortie de l'instance d'objet segmentation coh�rente avec la segmentation de choses de sortie pr�dite, Institut Toyota con�u TASCNet , qui est une structure de r�seau, comme indiqu� ci-dessous:

Structure du r�seau TASCNet

La zone de masque Exemples r�seau instance d'objet de segmentation premi�re sous-branche obtenue au premier plan, les caract�ristiques sont mises en correspondance � la figure taille d'origine, de donner des exemples de la zone de masque de premier plan en taille r�elle figure, et le masque de segmentation Exemple stuff Perspectives pr�vu comparer , L2 r�duit au minimum la fonction de co�t en utilisant deux r�sidus de masque.

Pr�visions sortie panoramique

branches de pr�diction de segmentation d'instance d'objet et sous-branches de la segmentation sous-v�tements dans le processus d'int�gration, g�n�ralement par heuristiques (algorithme heuristique) pixel de traitement des conflits, par exemple simplement par segmentation d'instance d'objet des pr�dicteurs sous-branche sujet, et dans la sous-branche de la segmentation de l'instance d'objet combin� score bas� sur le cadre de d�tection � titre d'exemples diff�rents.

De cette fa�on a priori bas�e sur la logique simple, et ne r�sout pas le cas complexe split panoramique combin�, donc, comment concevoir une branche de module instance efficace de l'objet de la solution de segmentation et sous-branche � la segmentation stuff sortie sous-divis�e du processus de fusion panoramique, question importante est panoramique r�partition des t�ches.

Et Hong Kong Structure du r�seau chinois Uber propos� conjointement UPSnet , qui est indiqu� ci-dessous:

Structure du r�seau UPSnet

Tenseur dans lequel les branches des sous-sorties instance objet segmentation et sous-branches segmentation de substance par transformation par mappage, on obtient la sortie de la t�te panoramique, la taille du tenseur (ninst + Nstuff) � H � W, o�, N_ {inst} dynamique variable repr�sente le nombre d'instances dans une image, substance Nstuff repr�sente le nombre de cat�gories, chaque image pour laquelle les valeurs sont les m�mes, et Xstuff Xthing utilis� ci-apr�s d�signe � la fois tenseur de fonction. De plus, le r�seau de pixels pour pr�dire la cat�gorie inconnue (pr�vision inconnue), de sorte que le r�seau peut faire partie de pixels jug�s cat�gorie inconnue et ignor�e au moment du test, pour �viter de faire la mauvaise cat�gorie entra�ne le d�clin de l'indice de PQ.

Apr�s l'obtention de la sous-branche et Stuff branches sous-sorties instance d'objet de segmentation de segmentation, apr�s conversion indiqu� ci-dessous, et mis en correspondance avec Xthing Xstuff.

sch�matique de la t�te de segmentation panoptique

Xstuff peut �tre extraite directement � partir de la sortie du divis� cat�gorie irr�guli�re, la zone de masque dans le i-i�me exemple Xthing Xmaski + Ymaski �tre obtenu, dans lequel Xmaski d�signe la i �me occurrence du bloc indiqu� par correspondant segmentation vraie substance branche de sortie de l'�tiquette sous-cat�gorie zone de masque pris, Ymaski d�signe la i �me occurrence de la sous-branche par exemple la carte de segmentation zone de masque obtenue � la zone d'origine du masque, le pixel final correspondant � l'aide d'une fonction standard de perte transversale d'entropie de la sortie de la t�te panoramique tenseur superviser la formation.

Occlusion Aware interpr�tation Network Box

lien Documents:

Un r�seau de bout en bout pour Panoptic Segmentation

motivation

Panorama divis� exp�riences, nous avons trouv�, �taient par exemple l'objet segmentation des sous-branches et la segmentation de choses pr�diction sous-branche bas�e sur l'algorithme heuristique existant combin�, ph�nom�ne de blocage se produit entre les diff�rentes instances. Afin de r�soudre le probl�me d'occlusion entre les diff�rentes instances, nous vous proposons Occlusion Aware (Network OANET), et con�u le module de commande spatiale (Module Classement Spatial), ce module peut obtenir de nouveaux points du classement gr�ce � l'apprentissage en ligne, et pour les exemples de division panoramique Trier fournir la segmentation.

conception de l'architecture r�seau

Notre structure propos�e du r�seau final divis� panoramique comme indiqu� ci-dessous, le r�seau bas� sur la segmentation d'instance d'objet d'int�gration du r�seau dans lequel la sous-branche et la segmentation des choses sous-branche, tout en r�alisant panoramique de formation et de pr�vision divis�e dans un r�seau. Au cours de la formation pour la segmentation stuff Nous avons �galement proc�d� la supervision et la formation et la cat�gorie de v�tements de cat�gories d'objets, les exp�riences montrent que cela peut aider � pr�dire la conception de l'�toffe.

Structure du r�seau OANET

Une m�thode de segmentation s�mantique similaire, nous proposons un algorithme simple mais tr�s efficace, appel� Module Classement spatial, mieux en mesure d'occlusion de la poign�e, dont la structure r�seau est illustr� ci-dessous:

Classement Spatial structure de r�seau de module

Parmi premi�re instance entr�e nous r�sultat de segmentation tenseur est mis en correspondance avec la taille d'origine, la dimension du tenseur est le nombre d'instances des classes d'objets, les instances des diff�rents masques de classes mapp�es sur le canal correspondant. Toutes les valeurs d'initialisation position de pixel tenseur est nul, des exemples de la valeur mappe de segmentation de masque est fix� � la position 1; Apr�s avoir obtenu le tenseur grand convolution noyau extraction de caract�ristiques pour obtenir pointage de la figure de commande spatiale; Enfin, nous avons calcul� pour chaque instance d'un objet est scores dans l'espace ordonn�e comme suit:

Ici, Si, j, repr�sente la cls cls cat�gorie, le pixel (i, j) les valeurs marquer, il faut noter que Si, j, CCRS a �t� probabilit� normalis�e, mi, j est un masque de pixel Point indicateur repr�sente un point de pixel (i, j) si les instances, chaque instance de scores de commande spatiale obtenue par la pr�diction de la superficie moyenne de tous les pixels de masque dans la moyenne des scores de classement, Pobjs repr�sente la commande de chaque instance de la partition obtenue, ce score pour panoramique et sortie.

Comme on le voit ci-dessous, lors de l'utilisation de l'algorithme de fusion de confiance heuristique commune actuelle, qui est bas�e sur la segmentation d'exemple de trame de d�tection d'occlusion comme base pour le traitement, comme le montre la trame de d�tection de pi�tons de confiance figure est significativement plus �lev� que le cadre de d�tection tie confiance, lorsque deux cas de chevauchement, des exemples de la cravate seront bloqu�s pi�tons exemple, lorsque l'addition a �t� marqu� module de commande spatiale, on peut pr�dire la fraction de commande spatiale obtenue par deux instances du module, selon trier espace classement score obtenu sera plus fiable, PQ aura une am�lioration de plus.

Sch�ma de principe du module de commande spatiale

Analyse exp�rimentale

Segmentation stuff signal de supervision nous avons jou� la branche de test peau, comme indiqu� ci-dessous, l'exp�rience indique que la table tout en �tant classes d'objets de formation supervis�s et des trucs de classe, de fournir plus d'informations de contexte des trucs de Segmentation et d'am�liorer les r�sultats de pr�diction.

Pour explorer la mani�re par exemple d'objet partag� segmentation sous-branche et caract�ristique segmentation de choses sous-branche, nous avons con�u diff�rentes exp�riences et la structure de partage, comme indiqu� ci-dessous, l'exp�rience indique que la table, la structure caract�ristique du mod�le de connexion d'infrastructure partag�e dans laquelle le FPN peut �tre am�lior�e fractionn�s indicateurs panoramique PQ.

Pour explorer l'efficacit� spatiale classement module de notre algorithme propos�, nous avons r�alis� � diff�rentes exp�riences de mod�le de base, comme indiqu� ci-dessous, dans laquelle, w / r�sultats du module classement spatiales, nous vous proposons indication du module de commande spatiale obtenue � partir des r�sultats exp�rimentaux comme on peut le voir, le module de commande spatiale peut am�liorer de mani�re significative les r�sultats du panorama d'�valuation divis� en diff�rents mod�les de base.

Pour tester l'impact diff�rent de convolution des param�tres sur le processus d'apprentissage de blocage, r�alis� l'exp�rience suivante, les r�sultats montrent que la convolution augmentation du champ r�cepteur peut obtenir de l'aide d'apprentissage des fonctionnalit�s plus contextuelles, et obtenir de meilleurs r�sultats.

Le tableau suivant est un algorithme de comparaison et les indicateurs d'information existants propos�s dans le pr�sent document peut �tre vu � partir des r�sultats, l'algorithme propos� peut atteindre des r�sultats optimaux.

R�sum� et analyse

De l'analyse ci-dessus du point de vue de la litt�rature, les diff�rentes t�ches de division d'�mission importante panoramiques ont �t� largement explor�s, mais il est encore une t�che division panoramique difficile, le bord d'attaque de la sc�ne pour comprendre le probl�me, il y a encore quelques questions � explorer:

Tout d'abord, �tant donn� que la division panoramique en divisant chaque cat�gorie, deux pr�dicteurs obtenus sous-t�che de fusion les cas pr�vus sous-t�che division irr�guli�re sous-t�ches, le proc�d� comprend l'algorithme de l'op�ration de traitement plus en d�tail, y compris les segments de filtre, inspir�e algorithme de fusion d�termine pixel ignorer analogues. Les d�tails des indicateurs de r�partition ont un impact plus grand sur le panorama, dans une certaine mesure, entrav� l'�valuation et la comparaison des diff�rents algorithmes;

En second lieu, m�me si un indice d'�valuation peut �tre divis�e meilleure �valuation panoramique dans l'exemple divisant la pr�cision de d�tection d'objet panoramique, et la pr�cision est divis�e objet instance de classe irr�guli�re, mais elle est plus concentr�e sur l'indicateur d'�valuation chaque cas, et non apr�s chaque instance la diff�rence entre les deux. Document propos� un meilleur indicateurs d'�valuation PC (Parsing couverture) pour les grands objets, de sorte que la segmentation des objets volumineux impact plus important sur les indicateurs d'�valuation finale dans certaines des pr�occupations des grands objets tels que la segmentation portrait de t�ches, conduite automatique plus efficace;

En troisi�me lieu, la t�che neutronique des probl�mes panoramique d'int�gration de la segmentation, l'�tude est encore plus �tre consid�r�e comme divisant la segmentation d'instance d'objet de collection panoramique et la segmentation des choses deux sous-t�ches et la fa�on de proc�der de la situation g�n�rale, la segmentation de l'unit�, cibl�e visant � r�pondre la segmentation du r�seau unifi� panoramique rev�t une grande importance.

r�f�rences

Kirillov A, il K, Girshick R, et al. Segmentation Panoptic . ArXiv pr�publication arXiv: 1801,008682018.

Kirillov A, R Girshick, Il K, et al. Panoptic Networks Pyramid Feature . ArXiv pr�publication arXiv: 1901,02446, 2019.

Long J, Shelhamer E, Darrell T. r�seaux enti�rement convolutifs pour la segmentation s�mantique // Actes de la conf�rence IEEE sur la vision par ordinateur et la reconnaissance des formes 2015 :. 3431-3440.

Il K, Gkioxari G, dollar P, et al. Masque r-cnn // Actes de la conf�rence internationale IEEE sur la vision informatique 2017 :. 2961-2969.

T Lin Y, P dollar, Girshick R, et al. r�seaux de pyramide d'entit� pour la d�tection d'objet // Actes de la Conf�rence IEEE sur Vision par ordinateur et reconnaissance 2017 :. 2117-2125.

Yang T J, Collins M D, Zhu Y, et al DeeperLab :. Single Shot image Parser . ArXiv pr�publication arXiv: 1902,05093, 2019.

Chen L C, G Papandreou, Kokkinos I, et al Deeplab :. segmentation d'images s�mantique avec des filets convolutifs profondes, convolution Atrous, et crfs enti�rement connect�s . IEEE transactions sur l'analyse du motif et de l'intelligence artificielle, 2018, 40 (4): 834-848.

Shi W, Caballero J, Husz�r F, et al. En temps r�el image unique et super-r�solution vid�o � l'aide d'un sous-pixel r�seau de neurones convolutionnel efficace // Actes de la conf�rence IEEE sur la vision par ordinateur et la reconnaissance des formes 2016 :. 1874-1883.

Sajjadi M S M, R Vemulapalli, M. Brown Frame-r�currente de super-r�solution vid�o // Actes de la Conf�rence IEEE sur Vision par ordinateur et reconnaissance 2018 :. 6626-6634.

G Papandreou, Zhu T, Chen L C, et al PersonLab :. personne pose estimation et de segmentation d'instance avec un, sur la base partie-bas vers le haut, le mod�le g�om�trique d'enrobage // Actes de la Conf�rence europ�enne sur l'ordinateur Vision (ECCV) 2018 :. 269-286.

Tychsen-Smith L, L. Petersson Denet: Scalable d�tection d'objet � temps r�el avec un �chantillonnage clairsem� dirig� �// Actes de la Conf�rence internationale IEEE sur l'ordinateur Vision 2017 :. 428-436.

Law H, Deng J. Cornernet: Les objets de d�tection de paires de points-cl�s �// Actes de la Conf�rence europ�enne sur l'ordinateur Vision (ECCV) 2018 :. 734-750.

Li Y, Chen X, Z Zhu, et al. R�seau unifi� guid�e Attention pour la segmentation panoptique . ArXiv pr�publication arXiv: 1812,039042018.

Li J, Raventos A, Bhargava A, et al. Apprendre � des choses fusibles et d'autres choses . ArXiv pr�publication arXiv: 1812,011922018.

Xiong Y, Liao R, Zhao H, et al UPSnet :. Un r�seau unifi� Panoptic Segmentation . ArXiv pr�publication arXiv: 1901,03784, 2019.

Peng C, Zhang X, Yu G, et al Grand Matters Kernel -. Am�liorer s�mantique Segmentation par Global Network Convolutif �// Actes de la conf�rence IEEE sur la vision par ordinateur et la reconnaissance des formes 2017 :. 4353-4361.

Cliquez sur Lire l'original , Rejoindre des groupes de discussion CVPR il ~

Route de la soie

Apprenez � conna�tre la Chine

Les produits secs | segmentation d'interpr�tation panoramique tous azimuts, la construction et la pr�vision de la d�finition de t�che r�seau