AAAI 2020 | poli avec d�tection cible progressive et significative des r�sultats optimaux

Publi�: Progressive Feature R�seau de polissage pour la d�tection d'objets Sallent

Adresse Papers: https: //arxiv.org/abs/1911.05942

Cet article papier de r�ception de AAAI2020

Interpr�tation de: BBuf

R�sum�: Les caract�ristiques de l'image est tr�s importante pour une d�tection cible importante. Principalement dans le proc�d� classique destin� � incorporer des caract�ristiques structurelles complexes et un filtre � plusieurs �tages sur des caract�ristiques confondant. Cet article pr�sente un nouveau caract�ristiques du r�seau de broyage progressif (PFPN), peuvent d�tecter des cibles importantes aux d�tails fins pon�age caract�ris� par l'utilisation d'une pluralit� de modules r�p�ter (FPM), et sans aucun post-traitement. En fusionnant les FPM informations de contexte directe de haut niveau mis � jour en parall�le, et dans lequel chaque niveau de la hi�rarchie peut �tre retenu et la taille de l'une des cartes de caract�ristiques, ce qui fait qu'elle peut �tre appliqu�e � toute structure CNN. PFPN sur 5 ensembles de donn�es de r�f�rence obtenues SOTA.

1. Introduction et contribution

D�tection cible importante dans l'image est con�ue pour extraire la r�gion la plus attractive, il a �t� largement utilis� dans la vision par ordinateur, telles que la compression vid�o, le suivi visuel et recherche d'images. image test de signification d�pend des caract�ristiques s�mantiques, y compris les caract�ristiques de bas niveau et des caract�ristiques de haut niveau.

Par cons�quent, afin d'utiliser les d�tails de caract�ristiques s�mantiques, diverses caract�ristiques de fusion �mergentes. Cependant, en raison de certaines caract�ristiques au niveau de fonction est pas exacte, les d�pendances � long terme entre les fonctions, de grande hauteur affecter la sous-utilis�es propose un service capacit� de d�tecter la cause des restes de probl�mes difficiles. Pour profiter pleinement de l'information s�mantique et en d�tail, ce document pr�sente un simple et des caract�ristiques du r�seau de pon�age progressif efficace. La contribution de cet article est la suivante:

Dans le pr�sent document, dans lequel une sorte de significative progressive pour le broyage r�seau de d�tection de cible de mani�re r�cursive am�liorer progressivement les caract�ristiques.

Pour chaque �tape de broyage, le document propose d'affiner les caract�ristiques FPM, retenant ainsi la taille de la fonction et de la structure hi�rarchique de la figure. Il a avanc� l'information s�mantique int�gr�e directement dans toutes les fonctions de bas niveau pour �viter les probl�mes de d�pendance � long terme.

Le 5 ensembles de donn�es de r�f�rence sont obtenus pr�cision SOTA.

2, proc�d�

2.1 Structure g�n�rale

caract�ristique importante progressive pour la d�tection d'objet poli configuration globale d'un r�seau comme indiqu� dans Figure2.

Tout d'abord, l'image d'entr�e est introduit dans le r�seau de base d'une pluralit� de caract�ristiques extraites �chelles. Le document a choisi de faire ResNet-101 r�seau f�d�rateur. Alors que le r�seau f�d�rateur ne VGG16 r�sultats de papier ont �galement d�montr� dans la section exp�rimentale.

Plus pr�cis�ment r�seau ResNet-101 peut �tre divis� en 5 blocs avec stride = 2 de l'op�ration d'�chantillonnage. . Cette caract�ristique de sortie de la figure 5 peut �tre exprim� sous la forme du bloc: Conv-1, Res-2, 3-Res, Res-4, 5-Res. Pour r�duire la taille des caract�ristiques du profil figure de mani�re � obtenir plus, les caract�ristiques d'un premier passage � travers le module de conversion figure (Figure2 dans le TM1), dans lequel chaque niveau par la convolution 1x1 est converti en fonction des m�mes dimensions, par exemple, dans notre mise en uvre pour 256.

Apr�s l'obtention d'une pluralit� de caract�ristiques de m�mes dimensions, s�rie FPM de modules sont reli�s les uns derri�re les caract�ristiques de l'�tablissement pour le raffinage Fig. Figure 2 montre un exemple d'un T = 2. Dans chacun des FPM, les caract�ristiques de haut niveau sont introduits directement dans la fonction de bas niveau � tous am�liorer, ce qui est plus efficace que de mani�re indirecte et r�duit de mani�re significative la perte d'informations. entr�es et sorties FPM ont les m�mes dimensions et tous partageant les m�mes FPMs structure du r�seau.

Nous utilisons diff�rents param�tres pour chacun des FPM, afin qu'ils puissent apprendre progressivement de plus en plus concentr�s sur les d�tails. Les exp�riences montrent que lorsque le temps T = 2, le mod�le a montr� une pr�cision SOTA et la vitesse de 20fps.

Puis, en utilisant le mod�le du second module de convertisseur (TM2 Figure2 in), qui est ensuite �chantillonn� par une convolution bilin�aire constitu� d'un 1x1, �chantillonner directement la r�solution de l'image d'origine et le nombre de canaux sur la cible comprim� 32.

Enfin, un module de fusion (FM) est utilis� pour obtenir la pluralit� de fusion finale de caract�ristique maps figure significative. En raison des caract�ristiques de l'utilisation de FPM apr�s une repr�sentation plus pr�cise, donc FM utilise une strat�gie simple � r�aliser la s�rie, et le mode d'utilisation finale pour former le r�seau.

2.2 dans lequel le module de meulage

Caract�ris� par le module de meulage (FPM) est la composante de base du r�seau en papier PFPN propos�, FPM est un module simple et efficace, ainsi que toute convolution peut utiliser pour am�liorer la repr�sentation g�om�trique d'entit�s de r�seau.

Il conserve le multi-niveau fonctionnalit�s g�n�r� CNN, par exemple, ou un tronc ou une sortie avant du FPM, et apprendre � utiliser la connexion r�siduelle les mettre � jour. N, dans lequel la Fig. F = {fi, i = 1, ..., N}, FPM produire la m�me taille apr�s broyage du diagramme caract�ristique N F ^ {p} = {fi ^ p, i = 1, .. ., N}, comme le montre la figure 2, FPM FPM comprenant N modules parall�les, chacun correspondant � une seule fonction et exprim�e en figure FPM-k.

Plus pr�cis�ment, en utilisant le r�sidu reli� d'un c�t� � la face profonde de la profondeur. En cons�quence, les informations caract�ristiques de haut niveau ayant inject� directement dans le global niveau inf�rieur dispose aux zones d'aide jug�es nettement mieux. Dans la Figure 2 est FPM1-3, Res-3, Res-4, caract�ris� par Res-5 ont �t� mis � jour pour la connexion raccourci Res-3. avantages FPM �galement absorb� r�seau r�siduel (He et al. 2016), de sorte qu'il peut �tre mis � jour et caract�ris�s informations confuses figure progressivement filtr�e.

Ceci est illustr� par les diff�rentes connexions dans Figure2. $ $ FPM-k modules mis en oeuvre peuvent �tre formul�es comme suit:

Il accepte N-k + 1 caract�ristique comme la figure {fj, j = k, .., N}. Pour la figure caract�ristique fj, nous avons d'abord utilis� un des composants convolution 3x3 + BN + Relu pour capturer des informations s�mantiques, qui est ensuite interpol�e � la taille fk. Apr�s ces caract�ristiques de l'�chantillon apr�s interpolation en utilisant la fusion de concat, puis par une r�duction de la convolution 1x1 de dimensionnalit� obtenu pk. Pk est alors trait�e comme fonctions r�siduelles pour mettre � jour les caract�ristiques originales de la figure fk calcul�es derni�re caract�ristique figure F_k ^ p. Quand un temps de 3 k = exemple comme repr�sent� sur la Figure 3.

2.3 Module d'int�gration

Papier en utilisant le module de fusion (FM) pour faire fondre la pluralit� de caract�ristiques et pour d�tecter des objets significatifs de la FIG. Comme le montre la Figure 2, la premi�re multi-niveau comprend TM2 est Concat, puis 3x3 convolution en deux couches. Ensuite, la carte finale saillance une convolution 1x1 dans la derni�re couche.

2.4 les d�tails de mise en uvre

Papier en utilisant la perte d'entropie crois�e pour optimiser la carte de saillance finale et a marqu� une carte importante. Les auteurs ont ensuite utilis� une perte secondaire, l'optimisation sp�cifique est une s�rie de r�sultats interm�diaires avant le module FM, la perte nette totale finale comme suit:

3. Les r�sultats exp�rimentaux

Les Table1 montre les m�thodes d�crites ici dans les cinq ensembles de donn�es ont �t� obtenues de pr�cision SOTA, nous d�montrons l'efficacit� de cette m�thode.

4, l'affichage visuel

5. Conclusion

Pour tirer le meilleur parti des informations et des d�tails s�mantiques, ce document pr�sente une simple et les caract�ristiques du r�seau de broyage progressives efficaces (PFPN). caract�ristiques PFPN contribuent � la raffin�e progressive d'une mani�re r�cursive pour am�liorer le diagramme caract�ristique multi-niveau indiquant, pour chaque �tape de caract�ristiques de polissage, sont caract�ris�s par le module de meulage (FPM) l'information s�mantique de haut niveau int�gr� directement dans le niveau inf�rieur de toutes les caract�ristiques dans les dessins, r�duisant ainsi la perte d'informations. Enfin, le 5 PFPN r�f�rence de la performance est nettement mieux que les 16 types de m�thodes les plus r�centes.

Lei Feng Lei Feng Lei r�seau de r�seau de r�seau Feng