Cercles | UTS CVPR 2018 papier: d�tecteur de visage am�lior�e de la cl� dans l'apprentissage non supervis�

Technologie AI Revue de presse : L'auteur est titulaire d'un doctorat Dongxuan Yi Universit� de Technologie de Sydney (Xuanyi Dong), il a accept� les documents de surveillance par inscription selon CVPR 2018: Une Unsupervised approche pour am�liorer la pr�cision des d�tecteurs de Landmark visage interpr�tation exclusive des articles �crits pour la technologie AI examen.

Supervision par l'enregistrement du cadre g�n�ral

Supervision par inscription (SBR) est un algorithme d'apprentissage de visage cadre d�tecteur de point critique peut �tre utilis� sans surveillance fa�on � am�liorer tout le visage � base d'images d�tecteur de point critique. SBR utilise le mouvement de l'objet dans la vid�o met en sc�ne pour augmenter la surface relativement lisse d'un d�tecteur keypoint existant. D'autres points cl�s de l'algorithme de d�tection de visage est compar�, SBR ne n�cessite pas l'utilisation de toute information d'annotation manuelle suppl�mentaire peut am�liorer les performances du d�tecteur. La figure est une vue sch�matique d'un cadre de SBR.

les donn�es de formation SBR utilis�es sont annot�es des donn�es d'image et des donn�es vid�o sans �tiquettes. Pendant la formation, SBR peut �tre utilis� sans supervision mani�re � d�tecteur optimize (r�seaux de neurones) pour extraire des informations de la surveillance vid�o. Au cours de la phase de test, comme mod�le form� SBR peut �tre r�alis� avec une plus grande pr�cision dans les donn�es d'image ou vid�o, et permettent des r�sultats de d�tection plus stables dans la vid�o.

Supervision par l'enregistrement du processus de formation

Le processus de formation se compose de deux fonctions de perte de SBR. Le d�tecteur est une fonction de perte, l'autre est un enregistrement du temps fonction de perte. Les deux peuvent ajouter des personnes face � d�tecteur de point critique est plus robuste entre eux. fonction de perte de mod�le d�tecteur est appliqu� au r�sultat de la d�tection et l'annotation manuelle, optimis�s sont telles que les donn�es sur l'�tiquette, et les r�sultats de la d�tection du mod�le le plus pr�s possible annotation manuelle. La synchronisation est optimis�e identit� de s�quence de fonction de perte d'inscription dans plusieurs trames cons�cutives de r�sultat de d�tection keypoint. Plus pr�cis�ment, deux t-1 et t image d'entr�e successive, la m�me personne par le d�tecteur de visage point critique peut �tre obtenue pour le premier r�sultat de d�tection t-1 et le r�sultat de d�tection de la t-i�me trame de la trame, nous allons d'abord T- un r�sultat de d�tection de suivi de piste � la t-i�me trame par le r�sultat de l'algorithme de Lucas-Kanade, la perte de fonction de synchronisation de l'enregistrement est de rendre les r�sultats de la d�tection et le suivi dans le t-i�me trame obtenue obtenue aussi uniforme que possible. Il est � noter, parce que l'algorithme de Lucas-Kanade ne n�cessite pas de formation et ont solution sous forme ferm�e, nous allons algorithme de Lucas-Kanade �crit dans un module de guide de station embarqu� dans CNN. Lorsque la formation, la fonction de perte de d�tection en utilisant l'apparence du visage de l'information par le d�tecteur de cl� annotation manuelle du point d'apprentissage, fonction de perte d'enregistrement de synchronisation en int�grant le module Lucas-Kanade pour assurer la coh�rence du calendrier. Gradient de telle sorte que le mod�le peut �tre transmis au r�sultat de la d�tection de la d�tection par le module compatible Lucas-Kanade trames adjacentes.

(Pour diff�rents d�tecteurs, la fonction de perte de d�tecteur peut �tre diff�rent, comme plus classique Hourglass CPM et d'optimiser l'utilisation du d�tecteur d'erreur quadratique moyenne, mais aussi avec l'utilisation de ces m�thodes algorithme d'optimisation de la perte .sbr L2 est une commune, peut agir dans une vari�t� de d�tecteur de point critique face � am�liorer leurs performances.)

Supervision par l'enregistrement est inspir�e par ce qui est pr�sent�?

CNN mod�le actuellement en formation n�cessite beaucoup de donn�es d'annotation. Cependant, a marqu� un grand nombre de donn�es doit consommer beaucoup de ressources humaines et annotation manuelle souvent inexactes. Illustr� ci-dessous est d�sign� par 16 points sur les images cl�s de la position de deux bouches, une couleur repr�sente un point critique, nous donnons les r�sultats de neuf personnes �tiquettes marqu�es, chaque �tiquette se trouve dans l'art des points critiques positionn�s variance grande. Ces erreurs ont marqu� un grand impact sur les mod�les de formation et de test seront. Nous voulions donc pouvoir utiliser des informations qui ne n�cessite pas de surveillance d'annotation manuelle du mod�le CNN form�? A cet effet, nous vous proposons l'enregistrement de supervision soit, l'utilisation des images vid�o adjacentes � la coh�rence des informations de calendrier que la supervision.

Pourquoi l'article a montr� une augmentation de la surveillance par l'enregistrement ne fait pas beaucoup?

L'�valuation actuelle des indicateurs cl�s de la d�tection des visages des gens sont les deux principaux, NME (Normalis� Erreur moyenne) et l'ASC (aire sous la courbe). Les deux l'�valuation peut �tre une bonne mesure de l'�cart avant les r�sultats des tests et �tiquet�s manuellement, mais pas bien refl�t� la performance du mod�le dans la vid�o. G�n�ralement, les gens font face � d�tecteur de point critique pr�dit les coordonn�es du point cl�s seront la gigue forte dans la vid�o, mais le r�sultat de l'utilisation de la formation face � SBR d�tecteur de point critique est tr�s stable dans la vid�o, il n'y a aucune mise � niveau de ces la fa�on de mesurer, mais refl�te clairement l'effet de SBR de la vid�o de d�monstration.

Utilisez les d�tails de supervision par l'enregistrement doivent faire attention � quoi?

SBR est un noyau de synchronisation de la fonction de perte d'enregistrement, en fonction du module de suivi Lucas-Kanade, le r�sultat de suivi est bon ou mauvais un impact direct sur l'effet de SBR. Dans le m�me temps, le seul lorsque les coordonn�es initiales suivi du temps plus ou moins pr�cis est logique pr�dit de coordonn�es de d�tecteur de coordonn�es est initialis� module de poursuite de Lucas-Kanade. Notez qu'il utilise deux points, (1) lorsque le d�tecteur est en images marqu�es sont initialis�s au d�but de l'utilisation de la formation SBR. (2) Notez que la r�solution / taille du visage / �tat d'occlusion vid�o est s�lectionn�e pour assurer qu'aucune annotation vid�o module de suivi Lucas-Kanade pour suivre le succ�s.

Supervision par enregistrement des ressources connexes

PyTorch Mise en uvre: https: //github.com/facebookresearch/supervision-by-registration

Facebook Blog recherche: https: //research.fb.com/publications/supervision-by-registration-an-unsupervised-approach-to-improve-the-precision-of-facial-landmark-detector

Vid�o de d�monstration: https://drive.google.com/file/d/19tLhPBb2f8S70jFk_WTUYKaJxVEsQGwX/view

Documents Adresse: http: //openaccess.thecvf.com/content_cvpr_2018/papers/Dong_Supervision-by-Registration_An_Unsupervised_CVPR_2018_paper.pdf

Route de la soie