Unsupervised apprentissage nouvelle �tude pr�disent une rotation d'image simple, fournir le signal de surveillance forte se caract�rise par l'apprentissage

�Ji-won nouvelle recommandation

Source d'origine: arXiv

Auteur: Spyros Gidaris, Praveer Singh, Nikos Komodakis

compilation "Lexus World": ah ~ Astro Boy ah, KABUDA, EVA

[New Ji-won EXAMEN Dans ce document, les chercheurs ont form� un r�seau neuronal � reconna�tre la convolution � deux dimensions sur la rotation de l'image est appliqu�e en tant qu'entr�e �. Des aspects qualitatifs et quantitatifs ont prouv� que cette t�che apparemment simple fournit en fait un signal tr�s puissant pour surveiller les caract�ristiques s�mantiques de l'apprentissage.

Au cours des derni�res ann�es, le r�seau de neurones profondeur de convolution (de ConvNets) a chang� le champ de vision par ordinateur, ce qui est d� � leur capacit� in�gal�e d'apprendre des fonctionnalit�s s�mantiques avanc�es d'image. Toutefois, afin d'apprendre avec succ�s ces caract�ristiques, ils n�cessitent g�n�ralement de grandes quantit�s de donn�es manuellement marqu�s, il �tait cher et infaisable. Par cons�quent, les caract�ristiques s�mantiques de l'apprentissage non supervis�, � savoir l'apprentissage sans qu'il soit n�cessaire pour le travail d'annotation manuelle, il est essentiel pour le succ�s d'aujourd'hui obtenir un grand nombre de donn�es visuelles disponibles.

Dans notre �tude, nous avons l'intention d'apprendre l'image pr�sente de cette fa�on: la formation d'un r�seau de neurones pour identifier la convolution est appliqu�e � l'image de rotation � deux dimensions en entr�e. Nous montrons que les aspects qualitatifs et quantitatifs, cette t�che apparemment simple fournit en fait un signal tr�s puissant pour surveiller les caract�ristiques s�mantiques de l'apprentissage. Nous pr�sentons une vari�t� de crit�res d'apprentissage sans supervision dans notre approche d'une �valuation d�taill�e, et de d�montrer les meilleures performances de pointe dans tous ces points de r�f�rence.

Plus pr�cis�ment, nos r�sultats dans ces benchmarks montrent la caract�risation dans l'apprentissage non supervis�, par rapport aux m�thodes pr�c�dentes les plus avanc�es, notre m�thode a apport� des am�liorations consid�rables, ce qui a consid�rablement r�duit l'�cart entre l'apprentissage et le suivi des caract�ristiques. Par exemple, dans les t�ches d'inspection COV PASCAL 2007, mod�le sans supervision AlexNet pr�formation atteint 54,4% des plus performances avanc�es (dans les m�thodes non supervis�es), que dans le cas de l'apprentissage supervis� seulement un petit 2,4 points de pourcentage . Lorsque nous migrons fonction d'apprentissage non supervis� � d'autres t�ches, nous obtenons les m�mes r�sultats surprenants, tels que la classification IMAGEnet, classification PASCAL, la segmentation et la classification PASCAL-10 ICRA. Code et le mod�le de nos documents seront publi�s ici:

(Https://github.com/gidariss/FeatureLearningRotNet).

Ces derni�res ann�es, la profondeur des r�seaux de neurones de convolution dans la vision informatique largement utilis� (LeCun et al., 1998), a fait d'�normes progr�s dans ce domaine. Plus pr�cis�ment, (Russakovsky et al. 2015) par un grand nombre de donn�es d'�tiquette d'identification cible manuellement ou le classement de la sc�ne (Zhou et al. 2014) sur la t�che du r�seau de neurones est convolutionnel form� pour adapter leur r�ussite scolaire puissante repr�sentation visuelle des t�ches de compr�hension de l'image. Par exemple, sous la supervision de cette fa�on, l'image dispose d'apprentissage du r�seau de neurones de convolution leur est migr� pour obtenir de bons r�sultats lors d'autres t�ches visuelles, telles que la d�tection cible (Girshick fait en 2015), la segmentation s�mantique (Long et al., 2015), ou la description d'image (Karpathy et Fei-Fei effectu�s en 2015). Cependant, les caract�ristiques d'apprentissage supervis� ont une limitation majeure qui n�cessite beaucoup de travail marquage manuel. Dans le cas a maintenant un grand nombre de donn�es visuelles disponibles, ce qui est � la fois co�teux et infaisable.

rotation multiples al�atoires de 90 � (par exemple, 0 �, 90 �, 180 �, 270 �) de l'image. Notre m�thode d'auto-apprentissage supervis� des caract�ristiques de base du concept est que si une personne n'a pas de concept de l'image de l'objet d�crit, il ne peut pas �tre appliqu� pour identifier leur rotation

Par cons�quent, les personnes r�centes mani�re non supervis�e d'apprendre la caract�risation avanc�e de convolution bas�e sur les r�seaux de neurones sont de plus en plus int�ress�s par, en �vitant ainsi l'annotation manuelle des donn�es visuelles. Parmi eux, un exemple bien connu est le soi-disant auto-apprentissage supervis�, il d�finit un commentaire t�che excuse sans entrave, en utilisant uniquement des informations visuelles sur l'image ou la vid�o, ce qui donne les caract�ristiques d'un apprentissage fournit un signal de surveillance proxy. Par exemple, afin d'apprendre les caract�ristiques, Zhang et al., Et Larsson et al convolutif r�seau neuronal form� pour la coloration, Doersch et al. (2015) image de gris, et Noroozi Favaro (2016) bloc image pr�dite par rapport position et Agrawal et al. (2015) pr�dit le mouvement entre deux trames successives du v�hicule en mouvement (� savoir, automatique). Cette mission d'auto-surveillance derri�re le principe de base est que la r�solution de ces probl�mes forcera l'apprentissage r�seau de neurones de convolution caract�ristique d'image s�mantique, qui est utile pour d'autres t�ches visuelles. En fait, l'image se caract�rise par la t�che d'auto-apprentissage supervis�, m�me si elles ne l'ont pas tout � fait la caract�risation de la performance de l'apprentissage supervis�, mais ils ont fait leurs preuves lors de la migration vers d'autres t�ches visuelles est un bon choix, comme l'identification des cibles, la cible la d�tection et la segmentation s�mantique. Autre �tude r�ussie de cas de fonction de classification non supervis�e est la m�thode fond�e sur la reconstruction des m�thodes d'apprentissage et sur la base du mod�le de probabilit� de g�n�ration.

Sch�ma de Explicite pour des t�ches de surveillance de l'apprentissage des caract�ristiques s�mantiques de notre projet

Notre �tude suit l'exemple de l'auto-surveillance, et propos� par la formation de la convolution de r�seau neuronal (de ConvNets) identifier transformation g�om�trique est appliqu�e � l'image en entr�e, de sorte que la repr�sentation d'image d'apprentissage. Plus pr�cis�ment, d'abord, on d�finit un ensemble de transformations g�om�triques discr�tes, et ensuite chaque image sur chacun de ces transformation g�om�trique appliqu�e � l'ensemble de donn�es, et l'image convertie produite est amen�e � la formation pour identifier chaque image de mod�le de r�seau neuronal convolutif transform�. Dans cette m�thode, il est un ensemble de transformations g�om�triques, en fait, la d�finition de convolution mod�le de r�seau de neurones doit apprendre la classification des t�ches interface (t�che sous pr�texte de classification). Par cons�quent, afin d'obtenir des caract�ristiques s�mantiques apprentissage non supervis�, le bon choix de ces transformation g�om�trique est essentielle. Nous proposons que la transformation g�om�trique est d�finie comme �tant la rotation de l'image 0 �, 90 �, 180 � et 270 �. Ainsi, un r�seau de neurones est convolutionnel form� pour identifier l'un des quatre images sur la rotation (voir fig. 2) de quatre types de t�ches de classification d'image. Nous croyons que, afin de permettre un mod�le de ConvNet capable d'identifier la transformation de rotation appliqu�e � l'image, il faut comprendre le concept d'objet dans l'image comme d�crit (voir fig. 1), par exemple, leur position dans l'image, et le type de la posture. Tout au long de cet article, nous soutenons cette th�orie du raisonnement qualitatif et quantitatif. De plus, nous avons d�montr� exp�rimentalement que, malgr� notre m�thode d'auto-surveillance est tr�s simple, mais la t�che de transformation de rotation de pr�vision se caract�rise par des offres d'apprentissage une alternative puissante au signal de surveillance. Nous avons fait d'importants progr�s sur les points de r�f�rence pertinents.

Mod�le g�n�r� par l'attention AlexNet figure (carte d'attention), (a) �tre form� pour reconna�tre des cibles (supervision), et (b) est form� pour reconna�tre la rotation d'image (auto-contr�le). Notez que la figure Pour g�n�rer une couche de convolution, on calcule d'abord la cartographie de la couche de fonction, et nous augmentons la puissance p de chaque activation de fonction, l'activation de la position � chacun la carte de fonction Enfin, nous avons r�sum�. Pour les couches de convolution 2 et 3, respectivement, on utilise p = 1, p = 2 et p = 4

Il convient de noter que notre t�che est diff�rente de la supervision des m�thodes de recherche Dosovitskiy et al. 2014 et Agrawal et al., Propos�e pour 2015, m�me si elles se rapportent � des transformations g�om�triques. Dosovitskiy, qui a �t� form� en 2014. convolution mod�le de r�seau de neurones pour cr�er une distinction entre la caract�risation de l'image sans alt�rer les transformations g�om�triques et couleurs. Au lieu de cela, on forme le mod�le de r�seau neuronal de convolution pour identifier la transformation g�om�trique appliqu�e � l'image. Cette m�thode d'auto-mouvement et Agrawal et al en 2015 (m�thode de egomotion) est fondamentalement diff�rente, le proc�d� utilise un mod�le de r�seau neuronal de convolution avec des jumeaux structure (siamois), le mod�le sera deux vid�o cons�cutive ch�ssis en entr�e et de la formation afin de pr�dire sa conversion de cam�ra (par r�gression). En revanche, notre m�thode, un seul r�seau de neurones � convolution en tant que l'image d'entr�e, on a appliqu� une transformation g�om�trique al�atoire (rotation), et une formation (par classification) identifiant une telle transformation g�om�trique, sans acc�der � l'image d'origine .

AlexNet appris par le filtre de mod�le dans la premi�re couche (a) surveillance et le contr�le de la t�che de reconnaissance d'objets de t�che et (b) la rotation de l'entra�nement � la reconnaissance de l'image

Notre contribution:

Nous vous proposons une nouvelle t�che d'auto-surveillance, la t�che est tr�s simple, en m�me temps, nous sommes aussi des articles ont �t� expos�s, en fournissant un signal fort pour la surveillance des caract�ristiques s�mantiques d'apprentissage.

Nous (comme l'environnement ou la migration d'apprentissage semi-supervis�) dans une vari�t� d'environnements et une vari�t� de t�ches visuelles (c.-�-ICRA-10, IMAGEnet, les lieux et la classification PASCAL et les t�ches de d�tection ou segmentation) dans une �valuation d�taill�e de nos m�thodes d'auto-surveillance.

nouvelle m�thode d'auto-surveillance, nous proposons de montrer � tous �gards les r�sultats les plus avanc�s ont �t� nettement am�lior�e par rapport m�thode sans supervision pr�c�dente.

Nos recherches montrent que, pour plusieurs t�ches visuelles importantes, notre m�thode d'auto-apprentissage supervis� de mani�re significative � r�duire l'�cart entre l'apprentissage et la fonction dirig�es et non dirig�es.

Apr�s l'�tude, nous proposons une nouvelle m�thode pour la fonction d'auto-apprentissage supervis�, qui est form� par convolution mod�le de r�seau de neurones pour lui permettre d'identifier la rotation de l'image a �t� utilis� comme l'image d'entr�e. Bien que notre t�che d'auto-surveillance est tr�s simple, mais nous avons prouv� qu'il peut form� avec succ�s le mod�le convolutif de r�seau de neurones pour �tudier les caract�ristiques s�mantiques, les caract�ristiques s�mantiques qui sont utiles pour une vari�t� de t�ches de perception visuelle, comme la reconnaissance d'objets, d�tection d'objet et la segmentation de l'objet . Nous �tions en route � des �valuations d�taill�es dans une vari�t� de conditions non surveill�es et semi-supervis�s, et d'atteindre les meilleures performances de pointe dans le test. Plus pr�cis�ment, notre m�thode d'auto-surveillance am�liore consid�rablement la classification des IMAGEnet, pr�sente la classification non supervis�e PASCAL, �tude d�tection PASCAL, la segmentation et la classification PASCAL-10 les ICRA derniers r�sultats, au-del� de la m�thode classique, ce qui r�duit de mani�re significative la non supervis�e et superviser l'�cart entre les caract�ristiques d'apprentissage.

Lien original: https: //arxiv.org/pdf/1803.07728.pdf

Route de la soie

Apprenez � conna�tre la Chine

Unsupervised apprentissage nouvelle �tude pr�disent une rotation d'image simple, fournir le signal de surveillance forte se caract�rise par l'apprentissage