GAN Study Guide: Demo g�n�r� � partir de l'entr�e aux principes de production

Auteur: HE la source de Master of Science informatique appliqu�e � l'Universit� Fudan, lire, direction de la recherche de l'intelligence artificielle et l'apprentissage de la machine.

R�seau formule de confrontation (de GAN) est le mod�le r�cent d'apprentissage profond chaud. Il suffit de lire r�cemment des documents disponibles dans ce domaine, j'ai couru un code d'GAN, puis �crit cet article pour introduire GAN.

Ce document est divis� en trois parties:

Le GAN d'origine introduire le principe de
Le m�me principe est tr�s important DCGAN
Tensorflow DCGAN comment ex�cuter le code g�n�r� animation avatar comme indiqu� dans le titre figure, ensemble de donn�es fournies.

GAN Pr�sentation g�n�rale Principe

En parlant de la premi�re � regarder le cours GAN papier Ian Goodfellow Daniel g�n�ratives accusatoires Networks (arXiv: https: //arxiv.org/abs/1406.2661), ce document consid�r� comme un pionnier dans ce domaine.

Le principe de base du GAN est en fait tr�s simple, ici pour g�n�rer une image comme un exemple. Supposons que nous ayons deux r�seaux, G (G�n�rateur) et D (discriminante). Comme son nom l'indique, leurs fonctions sont les suivantes:

G est une image g�n�r�e au r�seau, la r�ception d'un bruit al�atoire Z, le bruit g�n�r� par l'image, not�e G (z).
D est un r�seau de discrimination, de d�terminer une image est pas � r�el �. Ses param�tres d'entr�e sont x, x repr�sentant une image, la sortie D (x) repr�sente la probabilit� que x est l'image r�elle, si elle vaut 1, il repr�sente 100% de l'image r�elle, et la sortie est 0, il ne peut pas �tre de vrais repr�sentants images.

Au cours de la formation, le r�seau a g�n�r� objectif de G est d'essayer de cr�er des images r�alistes au r�seau de la discrimination D. tromper Le but est d'essayer de D G images g�n�r�es et des images r�elles sont ouvertes. Ainsi, G et D constituent un � processus de jeu. � Dynamique de

Quel est le r�sultat du dernier match? A l'�tat id�al, G peut g�n�rer une image � r�elle ones � suffisante G (z). D, il est difficile de d�terminer si l'image g�n�r�e G est pas le cas, et par cons�quent D (G (z)) = 0,5.

Pour que notre objectif est atteint: nous avons obtenu un mod�le g�n�ratif G, il peut �tre utilis� pour g�n�rer des images.

D'une mani�re g�n�rale un peu plus que le principe de base du GAN, comment utiliser le langage math�matique pour d�crire? Extrait th�se directe formule ici:

Une simple analyse de cette formule:

Compos� de formule deux ensemble. x repr�sente une image r�elle, z repr�sente le bruit d'entr�e du r�seau G, et G (z) repr�sente un r�seau G image g�n�r�e.
D (x) repr�sente le r�seau D pour d�terminer la vraie image est r�elle probabilit� (parce que x est vrai, donc D, cette valeur plus proche de 1, plus). Et D (G (Z)) est d�termin� si l'image g�n�r�e G r�elle probabilit� r�seau D.
Objectif G: mentionn� ci-dessus, D (G (z)) est le r�seau D G pour d�terminer si l'image r�sultante r�elle probabilit�, G g�n�r� devrait vouloir que leur image � pr�s possible du r�el. � Autrement dit, G d�sir� D (G (z)) aussi grande que possible, alors V (D, G) devient plus petite. Nous voyons donc que l'�quation est le premier symbole min_G.
L'objet de D: la capacit� plus forte � D, D (x) devrait �tre plus grande, D (G (x)) devrait �tre plus petite. Dans ce cas, V (D, G) devient grande. Donc, la formule est de faire le plus pour D (max_D)

En dessous de cette image tr�s bien d�crit ce processus:

Alors, comment la formation descente D et G avec un gradient stochastique? Le document donne �galement l'algorithme:

Une partie du cercle bo�te rouge ici est que nous voulons que l'attention suppl�mentaire. La premi�re �tape que nous formons D, D est l'espoir V (G, D) plus le meilleur, de sorte que le gradient est plus (croissant). La formation de la deuxi�me �tape G, V (G, D) le plus faible possible, il est soustrait gradient (descente). Le processus de formation en alternance.

DCGAN Pr�sentation g�n�rale Principe

Nous savons que la profondeur de l'apprentissage le meilleur mod�le pour les applications de traitement d'images est CNN, CNN et comment la combinaison GAN? DCGAN ce domaine est l'une des meilleures tentatives (papier Adresse: Repr�sentation Unsupervised apprentissage avec Deep convolutifs g�n�ratives accusatoires Networks)

principes DCGAN et GAN est le m�me, pas ici dans la r�p�tition. Il vient au-dessus du G et D ont �t� remplac�es par deux r�seaux de neurones convolutionnel (CNN). Mais pas directement pour elle, DCGAN convolution structurale r�seau de neurones a fait quelques changements pour am�liorer la qualit� et la vitesse de convergence de l'�chantillon, ces changements sont les suivants:

Annuler toute couche de mise en commun. r�seau G � l'aide de convolution Transpose (transpos�e couche convolutionnel) sur�chantillonn�e par le r�seau D a �t� ajout� � la place de la mise en commun de pas de convolution.
Ils sont utilis�s dans la normalisation des lots D et G
couche FC est supprim�e, de sorte que le r�seau devient r�seau complet de convolution
r�seau G RELU utilis� comme fonction d'activation, la derni�re couche � l'aide du tanh
D r�seau utilis� en tant que la fonction d'activation LeakyReLU

DCGAN un sch�ma d'un r�seau G:

DCGAN � tensorflow

Eh bien, il dit un principe de passe, a d�clar� le spot contenu partie int�ressante de la pratique suivante.

DCGAN l'auteur original de l'image g�n�r�e chambre LSUN avec DCGAN, ce n'est pas particuli�rement int�ressant. Avant l'Internet a vu un article "Chainer Yan I ra su Suites g�n�r� automatiquement - Qiita", est g�n�r� des portraits de dessins anim�s avec DCGAN, l'effet est le suivant:

Ceci est un contenu pratique tr�s int�ressant. Malheureusement, l'original est Chainer les gens utilisent ce cadre est pas grand-chose. Ici, nous sommes en tensorflow reproduire ce r�sultat.

Collect jeu de donn�es d'origine

Tout d'abord, nous avons besoin de beaucoup d'image Anime grouille de reptiles, l'original est sur ce site: en rampant. J'ai essay�, j'ai trouv� dans mon environnement de r�seau ne peut pas acc�der � ce site, j'ai donc �crit un reptile simple, monter un c�l�bre site de la galerie de dessin anim�: konachan.net - Konachan.com Fonds d'�cran anim�s.

Code reptile est le suivant:

les demandes d'importation

Le reptile probablement courir pour une journ�e, redescendit 120,000 images, quelque chose comme ceci:

Cela peut �tre vu � l'int�rieur de l'image la plupart des plus en d�sordre, ne peut pas �tre directement utilis� comme donn�es de formation, nous devons utiliser les bons outils, interception de formation avatar de caract�re.

interception Avatar

Comme l'image d'origine et l'interception, directement sur l'outil de base OpenCV github: nagadomi / lbpcascade_animeface.

emballage simple sous le code:

Interception des donn�es de caract�re Avatar:

Cela peut �tre utilis� pour former jusqu'�!

Si vous ne voulez pas commencer � partir de z�ro pour monter des images peut �tre utilis� directement, je re�ois de bonnes donn�es d'image (275m, environ plus de 50000 images), l'adresse disque r�seau Baidu: https: //pan.baidu.com/s/1eSifHcA, le code d'extraction: g5qa.

formation

DCGAN � tensorflow ont d�j� de bonnes roues artificielles: carpedm20 / DCGAN-tensorflow, nous utilisons directement les codes dessus.

Mais le code d'origine pour fournir un nombre limit� de bases de donn�es, comment former leurs propres donn�es? En model.py on trouve quelques lignes de code pour lire les donn�es:

�si config.dataset == 'mnist': donn�es_X, donn�es_y = self.load_mnist

Une telle logique de donn�es de lecture est tr�s claire, nous sommes dans le dossier fichier de donn�es puis l'anime cr�er un nouveau dossier, l'image directement dans ce dossier, vous pouvez sp�cifier -dataset l'anime de l'ex�cution.

Ex�cuter la commande (D�finition: Indique la taille de l'image r�sultante est 48x48, la taille de notre image est 96x96, a couru 300 �poque):

python main.py --image_size 96 --output_size 48 --dataset l'anime --is_crop vrai --is_train vrai --epoch 300

r�sultat

La premi�re �poque � la fin (seulement un peu aper�u):

5 apr�s les r�sultats d'�poque:

10�me �poque:

200 �poque, regarder de plus pr�s des photos sont vraiment assez r�els:

Ma carte sujet est g�n�r�e � partir de l'�poque 300e.

R�sum� et suivi

Une br�ve introduction sur le principe de la GAN et DCGAN. Tensorflow faire et comment utiliser une simple d�monstration de g�n�ration d'image.

Ian Goodfellow gamme pour un r�sum� GAN du ppt de travail, vraiment merveilleux, recommand� � exclusif | p�re GAN de pincements discours 2016 Regarder la sc�ne: une gamme compl�te d'interpr�tation du r�seau du principe de la confrontation et la g�n�ration future (ci-joint PPT)
document de synth�se GAN, inclure le code: https: //github.com/zhangqianhui/AdversarialNetsPapers.

Route de la soie

Apprenez � conna�tre la Chine

GAN Study Guide: Demo g�n�r� � partir de l'entr�e aux principes de production

GAN Pr�sentation g�n�rale Principe

DCGAN Pr�sentation g�n�rale Principe

DCGAN � tensorflow

R�sum� et suivi