� Rapport acad�mique � Ali Baba Zhang Gang: g�n�rative contre r�seau et modifier les propri�t�s du visage humain

Ao�t 2018 Avril par l'Institut de Technologie de Beijing Learning Center Big Data Innovation et Intelligence Artificielle Alliance Group norme Acad�mie chinoise des sciences ont organis� conjointement le � 2018 profondeur l'apprentissage par renforcement: th�orie et applications � Symposium, du monde universitaire et sup�rieur des experts de l'industrie r�unit, part des recherches approfondies afin de renforcer les domaines d'apprentissage.

Confrontation avec le r�seau visage g�n�rative �diteur d'attributs

Zhang Gang Alibaba h�pital Dharma -AI Lab

Je suis dipl�m� en Juillet 2018 apr�s avoir travaill� dans Alibaba, la direction principale est sans pilote, puis m'a pr�sent� pour modifier les propri�t�s en face de ce faire un travail de quatre aspects.

D'abord pr�sent� le contexte et l'importance de l'�tude. Face � l'�diteur de propri�t� pour modifier les propri�t�s des images de visage humain en m�me temps pour faire face � l'identit� de l'invariance de garant et des informations d'attributs des domaines non li�s. Par exemple, la figure montre que l'on se d�barrasse des verres pour donner des chiffres, �tre conserv�s ailleurs, alors nous ne nous int�ressons, avec d'autres r�gions et r�gionales li�es � l'oeil, y compris fond, le front, la bouche, etc., doivent �tre conserv�s intacts. La premi�re est la recherche appliqu�e dans le divertissement, les zones sociales, telles que le blanchiment du portrait, par �ge, souriant, etc., et l'autre est sur le visage dans l'augmentation de la base de donn�es de reconnaissance faciale, j'ai partie DONE du travail du peuple est par GAN faire la base de donn�es de visage augment�e, et enfin d'am�liorer la pr�cision de la reconnaissance faciale.

Beaucoup de gens pensent que le travail est tr�s simple, consiste � modifier les propri�t�s du visage humain, pourquoi ne pas la formation du r�seau FCN? Le vrai probl�me est le manque d'images paires marqu�es, et ne peut donc pas �tre utilis� m�thode d'apprentissage directement supervis�. G�n�r� contre le r�seau a �t� propos� en 2014, son essence est un cadre de discrimination et g�n�rateur compos� de discriminateur est produit des images et des images r�elles devraient �tablir une distinction, le g�n�rateur est d'essayer de g�n�rer une image trompeuse discriminateur fou et enfin atteindre le discriminateur d'image g�n�r� g�n�rateur ne peut pas distinguer entre r�el ou g�n�r�, qui a atteint l'�quilibre final.

Les progr�s dans des domaines connexes pr�sentation prochaine, et un de nos travaux connexes est AcGAN, parce que le but de GAN est de g�n�rer une image r�elle, mais ne savent pas � la fin ce genre d'images g�n�r�es, AcGAN est d'utiliser un contr�le de l'�tiquette dans la fin Quel genre d'image est g�n�r�e. Builder entr�e ainsi que l'�tiquette C, discriminateur D tout en faisant ce qui pr�c�de deux t�ches: l'un est le classement vrai et faux, une �tiquette de classification C, et, finalement, pour atteindre un g�n�rateur de r�sultat �quilibr� est capable de g�n�rer C est contr�l� par un tr�s r�el image. homme GAN avec l'�diteur d'attributs de visage, premi�re consiste � mettre en avant IcGAN 2016, principalement pour faire de la formation en deux phases: un bruit de phase � travers la propri�t� C et Z, la formation d'un CGAN, mais cette fois que du bruit Z, notre objectif images d'entr�e et de contr�le vectoriel, la lutte antivectorielle et la commande de sortie des images de visage.

Une autre �tape est cod�e dans l'image par le Z du codeur, parce que la premi�re phase est � Z de l'image, et la seconde phase a pris, � son tour, par des images du visage retournent � Z. Ce travail semble tr�s travail, en fait, le plus grand inconv�nient est que le travail ne peut pas maintenir les informations d'identit� du visage. CycleGAN est un autre tr�s bien connu le travail, il a fait un travail image � l'image appari� g�n�rale Traduction, le point cl� est l'introduction de la fonction de perte de reconstruction pour assurer la coh�rence du contenu de l'image, les informations de contenu de l'image ne soit pas perdu.

D'autre part, il y a la perte de la fonction de confrontation, assurez-vous le visage sans lunettes deviennent les lunettes picture images visage humain, puis utilisez la fonction pour se pr�munir contre la perte traduit � un autre domaine. Un inconv�nient est l'impossibilit� de garantir CycleGAN propri�t� invariance zone sans rapport. M�me s'il y a une perte de reconstruction de la fonction, les r�sultats exp�rimentaux trouvent qu'il est difficile de garantir, en plus du spectacle du lieu ne soit pas modifi�.

StarGAN que CycleGAN un peu en avant, la conversion CycleGAN se fait entre deux domaines, ce qui signifie l'�dition multi-attributs, chaque attribut sont form�s � un GAN, StarGAN plus efficace parce qu'il a mis tous les attributs sont compress�s � modifier � l'int�rieur d'un r�seau, entr�e et CycleGAN est pas le m�me, il n'y a pas seulement des contr�les d'attributs d'image de visage humain C, D arbitre tout en faisant les deux t�ches: l'un est le classement vrai et faux, un attribut de classification C par dans cette confrontation de mani�re, le g�n�rateur final peut �tre contr�l� pour g�n�rer une propri�t� face images C.

Ensuite, il y a ResGAN, le g�n�rateur d'origine est une production directe d'images de visage humain, superpos� au-dessus de la carte originale, en fait, ce chiffre est le r�sultat de notre propre, mais l'effet de cette m�thode est relativement pauvre, il a �t� �galement une bonne direction , qui est, lorsque vous faites de retouche d'image, ou modifier les propri�t�s du visage doivent veiller � ce que la zone ne sont pas la propri�t� est pas modifi�e. La m�thode propos�e derri�re nous est �galement bas�e sur des recherches ant�rieures, tout en assurant l'attribut ind�pendamment de la r�gion ne sont pas modifi�s.

Afin de r�soudre le probl�me mentionn� ci-dessus, nous introduisons m�canisme de l'attention spatiale, dans la plupart des applications de cette classification d'images, segmentation. Notre attention a �t� fait le r�seau GAN Sagan a ajout�, comme indiqu� dans notre r�seau g�n�rateur G est compos� de deux parties: un r�seau d'attention spatiale (SAN) et le r�seau d'�dition propri�t� (AMN). Est seul responsable AMN de modification des propri�t�s, semblables au r�seau pr�c�dent CycleGAN et StarGAN. se concentre r�seau d'attention spatiale sur les zones qui doivent �tre modifi�s, et quels domaines doivent �tre ignor�s. Le masque est g�n�r� formules r�seau d'attention, cela ne peut �tre verres concern�s, puis mettre celui-ci sortir et faire le point au-dessus, le reste ne sera pas modifi� en partie pris directement � partir de l'original, cousu ensemble l'image finale est g�n�r�.

Nous faisons ce r�seau sagan principalement deux t�ches: l'un est le classement vrai et faux, est une classification des biens, prendre en compte l'efficacit�, parce que mes lunettes et verres entre la r�gion de l'attention est le m�me, nous avons �galement mis en place deux propri�t� r�ciproque, on porte des lunettes r�seau, un r�seau est de lunettes, un sourire est un r�seau, un r�seau est de garder le sourire, se refl�ter dans la m�me zone qui.

Ici localiser la zone de, modifier li�e � la propri�t� des propri�t�s du r�seau est seul responsable de la modification des propri�t�s, la formule finale, nous obtenons le g�n�rateur. Tout au long de l'exp�rience et aussi plus bien connu CycleGAN, StarGAN et ResGAN � faire une comparaison, le choix principal des yeux, de la bouche, le nez et la barbe, qui est la reconnaissance au sein d'un impact relativement important, mais aussi pour la reconnaissance de notre travail � faire. Les r�sultats de l'�valuation sont d'un point de vue visuel et la pr�cision de la classification des biens, dont deux sont faites de notre propre, on est MAE, un taux de reconnaissance faciale, sera d�crit en d�tail plus loin dans ces deux indicateurs.

Afin de tester l'efficacit� de notre approche, nous testons pour voir le r�seau d'attention spatiale � la fin pouvoir apprendre quelque chose, ainsi que les r�sultats finaux sur des ensembles de donn�es et CelebA LFW. La premi�re rang�e est modifi� verres, verres � une, une porte des lunettes, le masque est la sortie du r�seau de l'attention spatiale droite poids de figure, li� r�gion de r�ponse particuli�rement �lev�, la r�gion de la bouche bouche ferm�e Attention est li�e � Beard Beard est ajout� Enfin, l'ensemble du visage � sourire, car le m�canisme de sourire est plus complexe, leur visage tout peut �tre d�plac�.

Certaines personnes soup�onnent que nous ne sommes pas marqu�s avec des donn�es suppl�mentaires, est la formation masque r�seau, notre approche n'est pas marqu� dans le jeu de donn�es, similaire � la faible surveillance est �galement tr�s efficace. Le visage de chaque personne � c�t� d'une photo en noir est entr�e photos des images retouch�es et affichage de la diff�rence absolue, les effets visuels sont visibles dans des domaines non li�s non modifi�s. Notre approche est non seulement l'effet visuel est bon, mais seulement modifier une partie des lunettes li�es.

Ensuite, il y a la bouche et renferm�s, les effets visuels font �galement un meilleur travail. En fait, la barbe est plus difficile, car il est associ� avec le sexe et ensemble, l'ensemble de donn�es ne sont pas chez les filles image barbu, il est donc facile de devenir un homme de b�ton de femme � barbe, puis les hommes � devenir barbe femme. Que ce soit appliqu� � la femme � barbe ou moustache ne doit pas �tre le genre a chang�, le r�seau de l'attention de l'homme compare le travail dans ce cas, est le seul domaine de pr�occupation li� � la barbe, les autres ne vont pas modifier. propri�t� Sourire est impliqu� dans beaucoup de visage, nos r�sultats semble aussi mieux que d'autres m�thodes. Ce sont des effets visuels juste, seront derri�re les indicateurs quantitatifs r�els.

Quelle superficie est la propri�t� ne d�finit pas faire? Telle est la d�finition de de notre propre, est de d�finir les propri�t�s des verres et chauve, on n'a rien � d�finir la zone de la moiti� inf�rieure du visage ou de porter des lunettes parce que des lunettes, chauve seulement sur la moiti� du visage. Plus bouche, barbe, souriant, la prochaine moiti� du visage est concern�, quel que soit notre r�gion dans la premi�re moiti� du visage, puis ne rien faire � la r�gion du MAE pour, contre quatre m�thodes. Cet indicateur est plus le meilleur, les r�sultats dans le tableau suivant, sup�rieur par rapport aux autres trois m�thodes.

cat�gories d'attributs existent deux points: l'attribut cible doit �tre modifi�, le reliquat des biens ne peut �tre modifi�. Nous avons compar� cinq m�thodes, la derni�re mani�re est la vraie image, vous devez utiliser r�elle que les images. Nous avons choisi seulement les yeux d'attributs cibles, le sourire et l'�ge, qui est, de notre point de vue l'effet de la perte de classification est le meilleur et le plus proche de l'image r�elle. En fait, l'image r�elle est parce que nous ne sommes pas classification attribut pr�cision de certains ne sont pas particuli�rement �lev�, un peu plus de 90%.

La derni�re �tape consiste � am�liorer le taux de reconnaissance, et nous sommes quelques autres fa�ons de faire contraste, est une formation plus de 8000 personnes dans l'ensemble de la formation, ce qui est notre propre division, l'ensemble de test est le reste du peuple. La ligne solide rouge repr�sente la m�thode propos�e, la ligne en pointill� est de base, et plusieurs autres couleurs est StarGAN ResGAN, notre approche est beaucoup mieux qu'avant, cela prouve que notre m�thode peut am�liorer le taux de reconnaissance. Nous avons �t� la premi�re faite par un homme face base de donn�es sagan m�thode augment�e, ce qui est un bon point d'application.

Enfin regarder vers l'avenir, nous faisons contribution majeure de ce travail n'est pas li� au m�canisme par garant de l'attention des propri�t�s de la zone visage, cette m�thode peut �tre appliqu�e non seulement dans l'attribut visage peut �tre appliqu� � l'�diteur de propri�t� plus g�n�rale. � l'heure actuelle, nous travaillons � d�velopper l'attention doit �tre utilis� dans la r�alisation de l'image ci-dessus, est maintenant � faire principalement avec le GAN, si l'attention est de savoir si le r�seau est directement applicable � la r�gion est bloqu�e, puis directement sur la zone occlus r�alis�e en compl�te.

L'autre est que notre m�thode est tr�s efficace pour am�liorer le taux de reconnaissance, dans certains des millions et des milliards de donn�es de niveau fix�s pour ce spectacle que les attributs augment�e � faire, les r�sultats montrent peut am�liorer un ou deux points. Notre approche a aussi quelques inconv�nients, on nous ne pouvons pas exploiter la diversit� des m�thodes, telles que la diversit� se refl�te dans les diff�rentes cat�gories � la m�me personne portant des lunettes, on ne peut donner � cette personne au hasard portant des lunettes.

Ensuite, plus d'une propri�t� est impossible, essay� avant � face �diteur multi-attributs int�gr� dans notre approche, mais les r�sultats des tests finaux �taient pauvres, car plusieurs propri�t�s dans les besoins d'attention multi-attributs pour aller. Nous pouvons suivre le processus d'�dition des gens, les gens dans l'image est �dit� avec un m�canisme d'examen, pour voir comment l'effet d'un changement, l'effet est non seulement un autre changement, modifier la s�quence de la mani�re, l'avenir de notre travail peut �tre �tendu � se rapprocher de cette direction.

Pour un PPT complet, s'il vous pla�t r�pondre retour: rapport acad�mique

Photo fournie par Zhang

Derri�re le rapport acad�mique merveilleux, un groupe de talent acad�mique exceptionnel. Les gens disent que doivent se livrer � � vulgarit� � acad�mique, les pauvres ont besoin d'�tre en mesure de supporter la solitude, en fait ...... noyau monarque veut dire: tout sans m�me ah! Par exemple, 2018 Baidu appliquer imm�diatement pour une bourse - oui, le talent Baidu pour chaque IA a des �lites acad�miques � potentielles � pour fournir une ressources large de la plate-forme et de l'espace de d�veloppement, 200000 pour fournir un soutien financier de la recherche pour aider le corps exceptionnel des �tudiants coeur dans la recherche scientifique, se concentrer sur l'exploration scientifique.

Alors quoi, vous - la prochaine star acad�mique, appliquez rapidement vous inscrire d�s maintenant!

Pour r�imprimer, s'il vous pla�t laisser un message dans les coulisses, se conformer aux normes de r�impression

Route de la soie

Apprenez � conna�tre la Chine

� Rapport acad�mique � Ali Baba Zhang Gang: g�n�rative contre r�seau et modifier les propri�t�s du visage humain