� La plus grande ensembles de donn�es de visage align� homme du monde �. ICCV 2017: de la r�solution de face alignement est pas loin

1 Ji-won nouvelle compilation

IMAGEnet un million marque ensembles de donn�es pr�cises ouvre une nouvelle �re de reconnaissance d'image, il a ainsi r�alis� que les donn�es avec l'algorithme est tout aussi important. Afin de construire de meilleurs mod�les et d'algorithmes, de plus en plus les chercheurs ont commenc� � se d�rouler dans l'exploration des ensembles de donn�es et m�thodes pour les donn�es d'�tiquetage est pas non plus limit� � temps artificielle.

Ce dernier aspect d'un r�sultat est Computer Vision Laboratory de l'Universit� de Nottingham chercheurs � publier dans le papier ICCV 2017, les chercheurs d�crivent loin les plus grands ensembles de donn�es d'alignement 3D du visage qu'ils cr�ent (environ 230000 pi�ces de pr�cision dans le papier l'image de la marque), et leur utilisation 2D � la conversion 3D produit tag.

Posted appel� � distance nous r�solvons l'alignement face 2D et 3D Jusqu'o�? � (Dans quelle mesure sommes-nous de r�soudre le probl�me 2D et 3D du visage d'alignement? Et un ensemble de donn�es de 230.0003D rep�res du visage). Les chercheurs esp�rent que, sur la base de cet ensemble de donn�es, les probl�mes d'alignement face marquera le d�but plus et un d�veloppement plus rapide.

Les r�sultats montrent : Le r�seau des documents pr�sent�s (cr�ateur d�crit comme � l'alignement du monde face la plus pr�cise du r�seau �) pour d�tecter des points caract�ristiques du visage, 2D et 3D de coordonn�es s'appliquent. Source: Projet Github

alignement des visages, la plupart des recherches de vision par ordinateur au cours des derni�res d�cennies un sujet

Avec l'�mergence de grande �chelle et la profondeur des ensembles de donn�es d'annotation d'�tude, des travaux r�cents ont montr� encore atteint en vision par ordinateur sur la t�che la plus difficile de pr�cision sans pr�c�dent. Dans ce travail, les auteurs mettent l'accent sur les points caract�ristiques (localisation historique), en particulier les traits du visage de l'homme, �galement connu sous le nom (alignement face) align� face, � alignement Face � peut dire que les quelques derni�res d�cennies, l'ordinateur l'un des th�mes visuels les plus �tudi�s.

fonctionnalit� r�cemment sur l'utilisation de r�seaux de neurones convolutionnel (CNN) travail de positionnement du point a repouss� les limites dans d'autres domaines, tels que l'estimation de la pose du corps humain, mais il ne sait pas comment les r�sultats obtenus en termes de surface d'alignement.

Historiquement, selon les diff�rentes t�ches, diff�rentes techniques ont �t� utilis�es caract�ristiques emplacement. Par exemple, avant l'�mergence du r�seau de neurones, les travaux d'estimation de la pose du corps humain est principalement bas� sur le sch�ma de la structure (structure picturale) et l'extension complexe (extension), parce qu'ils sont capables de simuler l'apparence de grand changement, s'adapter � un large �ventail de la posture humaine. Bien que ces m�thodes n'ont pas �t� montr� pour obtenir une grande pr�cision pour (m�thode de r�gression en cascade) r�gression des t�ches d'alignement face en cascade montrent, mais d'autre part, sous l'initialisation cascade m�thode erron�e de r�gression de la performance, ou un grand nombre de points caract�ristiques de la d�t�rioration ou de rotation ferm�e auto-large dans le plan.

R�cemment, bas�e sur la r�gression carte thermique de l'architecture du r�seau de neurones de convolution compl�te (r�gression heatmap) a r�volutionn� l'estimation de la pose du corps humain, m�me pour les plus difficiles ensembles de donn�es a �galement �t� une tr�s grande pr�cision. �tant donn� que peu de leur demande de fin de formation de fin et les projets du travail, cette approche peut facilement �tre appliqu�e aux probl�mes d'alignement du visage.

5 grandes contributions, y compris pour la premi�re fois de construire une base solide, construit en utilisant la m�thode 2D-3D de loin les plus grands ensembles de donn�es

Les auteurs disent que, selon cette voie, � Notre principale contribution est de construire et de former un solide r�seau align� face, et la premi�re enqu�te sur un grand tout visage 2D existants ensembles de donn�es sont align�s ensembles de donn�es 3D et la distance du nouvellement introduit propri�t�s proche de la saturation (saturant de performance) jusqu'� quel point ".

Plus pr�cis�ment, leurs contributions sont les suivantes:

1. Pour la premi�re fois de construire une base tr�s forte (de base) , Combin� avec l'�tat de l'art architecture des points caract�ristiques et l'�tat de l'art du bloc r�siduel et une formation compl�te dans une tr�s grande expansion du jeu de donn�es de points caract�ristiques du visage 2D. Ensuite, nous �valuons tous les autres ensembles de donn�es 2D (environ 230000 images), nous enqu�tons sur le visage align� de la 2D pour r�soudre le probl�me dans quelle mesure.

2. Afin de r�soudre le probl�me de visage 3D ensembles de donn�es moins align�es, nous Propose en outre une annotation 2D 2D dans les m�thodes de points caract�ristiques d'annotation 3D CNN, et l'utiliser pour cr�er des ensembles de donn�es LS3D-W, qui est de loin la plus grande et la plus difficile jeu de donn�es de points caract�ristiques du visage 3D (environ 230000 image), qui est presque tous les ensembles de donn�es existants Unifier get.

3. Ensuite, nous avons form� un r�seau align� face 3D et �valu� dans une nouvelle organisation � grande �chelle de donn�es de points caract�ristiques du visage 3D, nous enqu�tons sur le visage humain de 3D pour r�soudre le probl�me d'alignement encore loin.

Tout le facteur � traditionnel � 4. Nous �tudions encore l'impact des performances align�es face, comme un grand geste, l'initialisation et la r�solution, et l'introduction de facteurs � nouveaux �, � savoir la taille du r�seau.

5. Les r�sultats montrent nos r�seaux align�s face-2D et 3D ont r�alis� une tr�s haute performance de pr�cision, ce qui peut �tre proche de propri�t�s de saturation de l'ensemble des donn�es utilis�es.

Structure 2D-FAN : HG construit par empilement de quatre face de nappe align�e (R�seau de visage d'alignement, FAN), dans lequel tous les blocs de goulot (dessin du carreau) est remplac� par la nouvelle couche, parall�le et bloc multi-�chelles.

M�thodes et donn�es: 2D, 3D et �tiquetage des propri�t�s de conversion 2D-3D sont proches de la saturation

L'auteur a construit un premier r�seau align� face "FAN" (Facee r�seau Alignment), puis appuie sur FAN, construit 2D � 3D-FAN, �galement sur une image 2D donn� dans un r�seau de points de rep�re pour le visage 3D. Les auteurs disent, � leur connaissance, � grande �chelle des exp�riences d'alignement face 2D / 3D dans la formation et l'�valuation FAN un puissant r�seau, mais aussi la premi�re fois.

Sur la base de leur une de l'architecture la plus avanc�e de la posture du corps HourGlass (HG) pour construire FAN et HG bloc de goulot d'�tranglement du module d'origine est remplac� par un nouveau hi�rarchique parall�le structure multi-�chelle (propos�e par d'autres chercheurs) estimation.

2D-3D �-FAN architecture r�seau : La posture du corps sablier architecture bas�e sur l'estimation, et l'image en 2D est un des rep�res du visage d'entr�e RGB, la sortie est les sites d'int�r�t 3D du visage correspondant.

2D-FAN Marqu�

3D-FAN Marqu�

Ci-dessous une comparaison avec la m�thode classique (rouge), ce point de vue plus de pr�cision apparente de la nouvelle m�thode:

En plus de la construction FAN, auteur vise �galement � cr�er la premi�re grande �chelle jeu de donn�es historique du visage 3D. Actuellement 3D donn�es Rep�res du visage est encore tr�s rare, et donc apportent une contribution consid�rable � ce travail. Compte tenu des excellents r�sultats 2D-FAN, les auteurs ont d�cid� d'utiliser 2D � 3D-FAN g�n�rer un jeu de donn�es historiques du visage 3D.

Mais elle pose aussi un probl�me qui est difficile d'�valuer la 2D � la 3D des donn�es. L'ensemble des donn�es existantes est le plus grand AFLW2000-3D similaire. Ainsi, avant l'utilisation de 2D-FAN, g�n�rer une 2D des rep�res marqu�s du visage, puis utiliser la 2D � 3D-FAN, la conversion des donn�es en 2D � des rep�res du visage 3D, l'est finalement g�n�r� est compar� avec les donn�es 3D AFLW2000-3D.

On a constat� que les deux n'ont des diff�rences, le montre la figure ci-dessous la plus grande diff�rence 8 r�sultats d'image marque (livre blanc est le r�sultat):

Les auteurs disent que la principale raison de la diff�rence est que les m�thodes pr�c�dentes de pipeline d'�tiquetage semi-automatique l'attitude complexe ne g�n�re pas de r�sultats pr�cis. Ainsi, les donn�es am�lior�es, ils AFLW2000-3D en ensembles de donn�es existants, LS3D-W cr�� (� grande �chelle 3D Faces in-the-Wild ensemble de donn�es), il contient un total d'environ 230000 pi�ces de l'image de l'�tiquette, et jusqu'� pr�sent la plus grande 3D face align�e ensemble de donn�es.

Apr�s les auteurs ont �valu� les performances des ensembles de donn�es LS3D-W de divers aspects. Les r�sultats montrent que leur r�seau a atteint ensemble de donn�es � performance de saturation �, et dans la composition, la r�solution et le nombre de param�tres d'initialisation du r�seau d'une r�sistance ultra-�lev�e (r�silience). Pour plus d'informations, voir le document.

Les auteurs disent que bien qu'ils ne sont pas concentr�s sur d'explorer quelques-uns des effets de l'attitude rare dans ces donn�es, mais aussi longtemps que il y a assez de donn�es, ils croient que le r�seau peut aussi se comporter comme bon.

Th�se: Nous r�solvons 2D visage 3D de l'alignement et quelle distance?

r�sum�

Dans cet article, un r�seau tr�s profond de neurones align� les donn�es existantes face 2D et 3D ensemble atteint pr�s du niveau de saturation de la performance. A cet effet, nous vous proposons de faire cinq contributions: (a) � combiner le plus de points de caract�ristiques faciales avanc�es (localisation historique) l'architecture et le plus r�sidus de modules avanc�s (bloc r�siduel), la premi�re fois que nous avons construit une base tr�s solide dans un jeux de donn�es 2D tr�s grandes des caract�ristiques du visage (ensemble de donn�es historique du visage) sur la formation, et �valu�s sur tous les autres ensemble de donn�es de points caract�ristiques du visage. (B) Nous allons cr�er une 2D � la marque de point caract�ristique de conversion 3D, et d'unifier tous les ensembles de donn�es existants, la cr�ation de loin le plus grand et le plus difficile LS3D-W de jeu de donn�es de points caract�ristiques du visage 3D (environ 230000 image). (C) Ensuite, on former un r�seau de neurones pour effectuer l'alignement de la face 3D (alignement de la face), et �valu� sur un nouvel ensemble de donn�es LS3D-W. Tous les facteurs � traditionnels � (d) Nous �tudions encore l'impact des performances align�es face, comme un grand geste (grande pose), l'initialisation et la r�solution, et l'introduction d'un des facteurs � nouveaux �, � savoir la taille du r�seau. (E) Notre �tude montre 2D et les r�seaux align�s face-3D ont atteint un niveau de performance tr�s �lev�, ce qui est susceptible d'�tre proche de propri�t�s de saturation de l'ensemble de donn�es utilis�. peuvent �tre t�l�charg�s � partir https://www.adrianbulat.com/face-alignment/ formation et le code de test et d'ensembles de donn�es.

Th�se: https: //arxiv.org/pdf/1703.07332.pdf
Github: https: //github.com/1adrianb/face-alignment

Et mod�le t�l�charger

2D-FAN : Https: //www.adrianbulat.com/downloads/FaceAlignment/2D-FAN-300W.t7
3D-FAN : Https: //www.adrianbulat.com/downloads/FaceAlignment/3D-FAN.t7
2D � 3D FAN : Https: //www.adrianbulat.com/downloads/FaceAlignment/2D-to-3D-FAN.tar.gz
3D-FAN profondeur : Https: //www.adrianbulat.com/downloads/FaceAlignment/3D-FAN-depth

Cliquez ici pour lire le message original pour voir les d�tails, esp�rons que vous pouvez rejoindre ~

Route de la soie

Apprenez � conna�tre la Chine

� La plus grande ensembles de donn�es de visage align� homme du monde �. ICCV 2017: de la r�solution de face alignement est pas loin