Sur la base de visage Deformation (lien ci-joint) g�n�r� contre r�seau (GAN) de

Auteur: Rudra Raina

Traduction: Zhang Yihao

Comment� par: Wu Jin Di,

Cet article sur 2100 mots Suggestions de lecture 10 minutes.

Le pr�sent document d�crit les connaissances g�n�r�es contre r�seau (GAN), et l'utilisation qui transforment les visages des gens et explorer comment utiliser StyleGAN g�n�rer diff�rents attributs du visage (comme l'�ge, souriant, etc.).

contour

Jusqu'� tout r�cemment, j'ai commenc� � explorer le contenu de la profondeur de l'apprentissage, et rencontr� ces id�es int�ressantes et des projets dans la vision par ordinateur.

M�me avec mes connaissances limit�es et l'exp�rience, et j'esp�re que cela aide quelques-uns des autres d�butants int�ress�s par ce domaine et essayer de nouvelles choses passionnantes.

J'ai trouv� une grande cha�ne YouTube, appel� arXiv Insights (ou simplement AI, c'est une co�ncidence? Je ne pense pas). Dans ce canal, j'ai trouv� une vid�o tr�s int�ressante: comment g�n�rer r�seau contre le visage humain d�form�! Cet article est un r�sum� de la vid�o que j'ai appris de la connaissance, et j'esp�re que d'ici la fin vous avez une bonne compr�hension de cette id�e, et peut-�tre essayer vous-m�me.

La figure ci-dessus qui n'existe pas dans la vraie vie, ils sont g�n�r�s par ordinateur. Mes amis, c'est la puissance de GAN. Si cela a suscit� votre attention, s'il vous pla�t continuez � lire pour en savoir plus.

Partie I: Qu'est-ce que GAN

GAN a une t�che tr�s simple � faire, est de commencer � partir de z�ro pour g�n�rer des donn�es, et ces donn�es peuvent m�me tromper les humains.

Le mod�le est constitu� d'Ian Goodfellow et ses coll�gues en 2014 � l'invention, la composition des deux r�seaux de neurones (et discriminateur g�n�rateur), qui sont en concurrence les uns avec les autres, ce qui entra�ne un certain nombre de contenu r�el.

Le but d'utiliser deux r�seaux peut se r�sumer autant que possible d'apprendre la structure de base des donn�es d'entr�e, et utiliser ces connaissances pour cr�er un contenu similaire qui correspondent tous les param�tres pour adapter la m�me cat�gorie.

Comme indiqu� plus haut, l'entr�e est le visage humain, GAN exactement comment les �l�ves apprennent � face ou d'une personne adulte. Gr�ce � cette compr�hension, il va g�n�rer un visage au hasard, le visage de ces personnes peut �galement �tre vrai.

Jetons un coup d'oeil de plus pr�s:

La structure de base du GAN

Ce chiffre est un mod�le simplifi� de la structure de GAN, mais il capture l'essence compl�te du concept.

C'est ce qui se passe dans la prochaine it�ration de la GAN:

1. G�n�rateur

Le g�n�rateur de bruit al�atoire en tant que vecteur d'entr�e;
Le g�n�rateur multiple effectue une convolution transposable � l'�chantillonnage du bruit, g�n�rer l'image finale.

2. discriminateur

Il est d'obtenir entr�e al�atoire de l'�chantillon r�el du monde (�chantillon r�el) ou g�n�r�s des �chantillons d'image (faux �chantillon);
Comme son nom l'indique, discriminateur seulement faire une chose: la discrimination � vraiment �chantillon � ou entr�e � faux �chantillon �.

Comme les utilisateurs, nous savons qu'il est faux de l'�chantillon r�el ou d'�chantillons, et utiliser ces connaissances pour utiliser r�tropropagation (BP) perte de formation au discriminateur pour mieux faire son travail.

Mais nous savons tous, le g�n�rateur est un r�seau de neurones, afin que nous puissions toujours se propager � un �chantillon al�atoire de bruit, g�n�rateur aidant g�n�re une meilleure image. Ainsi, la discrimination et le g�n�rateur peuvent utiliser la m�me perte de fonction.

L'astuce consiste � �quilibrer ces deux r�seaux dans le processus de formation. Si cela est fait correctement, le discriminateur apprendre � distinguer m�me une petite exception, tandis que le g�n�rateur produira le plus d'apprendre la production r�elle.

compr�hension technique GAN des travaux:

Constructeur et discriminateur au minimum - le plus grand jeu.

G�n�rateur tenter de r�duire l'�cart entre l'image factice et l'image r�elle, � discriminateur tromper;
Discriminateur pour optimiser la compr�hension de l'image r�elle afin de distinguer les �chantillons de faux.

Dans l'image ci-dessus, D (x) est la probabilit� qu'une image juste � vrai �chantillon � de.

Il y a une autre fonction G (z) est la sortie du g�n�rateur, z est une variable d'entr�e cach�e al�atoire. Une probabilit� g�n�ration ont � vrai �chantillon � est calcul� par le discriminateur D (G (z)).

Pour discriminateur, nous esp�rons:

image �chantillon solide a correctement identifi� et donc D (x) doit �tre proche de 1;
Pendant ce temps, de m�me d'identifier correctement les fausses images, D (G (Z)) pour �tre proche de 1.

Pour Constructeur:

G�n�rateur et D (x) ind�pendamment de la pr�cision, seule la D (G (z)) doivent �tre identifi�s comme un �chantillon r�el, et donc il doit �tre proche de 1 que possible.

fonction objective de GAN

Seulement quand un bon �quilibre entre les deux r�seaux, est la base de cette fonction perte architecture GAN, nous pouvons obtenir un g�n�rateur haute performance et un discriminateur.

Pour ceux qui sont int�ress�s � en apprendre davantage sur le GAN:

Ceci est le lien vers l'article original de Ian Goodfellow.

https://papers.nips.cc/paper/5423-generative-adversarial-nets.pdf

Ceci est la s�rie � GAN-GAN (du d�but � la fin) � - �crit par Jonathan Hui aper�u dans l'un des meilleurs GAN de l'information et ses applications.

https://medium.com/@jonathan_hui/gan-gan-series-2d279f906e7b

Partie II: La partie int�ressante

Le principe du mod�le:

Apr�s g�n�rateur de formation, les variables cach�es qui comprennent parfaitement la structure sous-jacente de l'ensemble de donn�es.
Dans notre exemple, nous utiliserons le mod�le connaissent d�j� la structure du visage. Le mod�le a �t� d�velopp� par NVIDIA chercheurs StyleGAN.

https://en.wikipedia.org/wiki/StyleGAN

Notre objectif est d'utiliser cette structure et le manipuler pour produire des choses int�ressantes.

Vous devez savoir que le traitement d'image de domaine de pixels est tr�s lourd et difficile, donc nous allons traiter des images cach�es dans le vecteur.

Ensuite, nous sommes arriv�s au premier obstacle, comment faire? Pour une image donn�e, nous pouvons toujours trouver l'image latente correspondant au vecteur? N est repr�sent� ci-dessous:

processus:

Pour notre premier obstacle, la solution la plus efficace:

Faces de g�n�ration d'un g�n�rateur al�atoire;
Ces images sont utilis�es en tant que l'ensemble de donn�es, le potentiel de ResNet de formation de l'image source � l'aide du code vectoriel (estimation pr�liminaire);
Nous utiliserons ResNet par pr�-formation, peut trouver le code cach� � l'image de requ�te (estimation approximative);
Ensuite, l'image en tant que point de d�part, le calcul de la perte L2 � image originale �, et mettre � jour le code de vecteur implicite (lui-m�me g�n�rateur tout en fixant le poids de droite).

Ceci est la deuxi�me partie de la vid�o - mise � jour des estimations des codes cach�s

Dans la seconde moiti� de cette vid�o, en raison des estimations de code cach�es � l'image convergent vrai des requ�tes de code, la mise � jour difficile � observer.

modification � temps partiel

Eh bien, peut-�tre pas.

plan:

Nous avons besoin d'un autre ensemble de donn�es, et g�n�re ensuite � nouveau une base de donn�es al�atoire de visage.
Nous appliquons un classificateur pr�-form� pour obtenir la propri�t� des attributs tels que � genre �, � �ge �, � Sourire � et ainsi de suite.
Ceci est fait pour nous permettre de cartographier le code sous-jacent � la propri�t� d'image pour trouver le mode appropri�.
Nous devons comprendre le StyleGAN espace potentiel est un espace de 512 dimensions tr�s complexe.

espace cach� de StyleGAN

Ici, chaque point repr�sente une image, nous devons trouver un mod�le dans l'espace. Par exemple, dans une certaine direction dans l'espace, comment se d�placer pour changer l'image g�n�r�e?

On peut observer dans l'espace cach�, ces propri�t�s peuvent �tre facilement isol�s par � hyperplan lin�aire. �
L'avion �mul� long de la ligne nous fournira la propri�t� de changement de direction.

Enfin, je veux montrer un autre exemple, j'ai chang� l'attribut � �ge � Emma Watson images.

Voil� ce que j'essay� de lier d�p�t GitHub, la vid�o est la sortie r�elle.

https://github.com/rudraina/Face-Morph

Merci encore Arxiv Perspicacit� couvre des sujets int�ressants.

https://github.com/rudraina/Face-Morph

Allez, vous pouvez essayer vous-m�me.

Titre original:

Face Morphing � l'aide g�n�rative accusatoire r�seau (GAN)

Lien original:

https://medium.com/swlh/face-morphing-using-generative-adversarial-network-gan-c751bba45095

Editeur: Wang Jing

Comment� par: Lin Yilin

Introduction Traducteur

Zhang Yihao, Universit� Tongji Kenichi � la lecture, la direction de la recherche pour l'exploration de donn�es de trafic et de l'intelligence artificielle. L'�re des grandes donn�es, les donn�es et les algorithmes des �tats-Unis est difficile � exprimer avec peu de mots, mais l'analyse des donn�es � �crire avec la substance, efficace et accent sur l'innovation, comme dans le raisonnement. Une planification de transport blanc professionnel, d'explorer de nouveaux domaines de la planification des transports est l'exploration de donn�es et la base de l'analyse.

- FIN -

attention Tsinghua - donn�es Acad�mie des sciences de Qingdao plate-forme publique micro-canal officiel " donn�es d'envoi THU � Sisters et n � � Les donn�es envoy�es THU � Pour plus de conf�rences et de bien-�tre contenu de qualit�.

Route de la soie

Apprenez � conna�tre la Chine

Sur la base de visage Deformation (lien ci-joint) g�n�r� contre r�seau (GAN) de