Comment r�seau de neurones profond est de devenir un ma�tre de l'image?

2019-03-15 15:46:10

Pourquoi est-il si une �tude approfondie efficace est encore un myst�re.

Dans cet article, nous allons essayer d'utiliser des r�seaux de neurones pour dessiner l'image abstraite pour nous, alors interpr�ter ces images, afin d'avoir une meilleure compr�hension du myst�re de ce qui se passait � c�t�.

Apr�s avoir lu cet article, vous apprendrez � g�n�rer une image, comme indiqu� ci-dessous.

(Tout le contenu est inf�rieur � 100 lignes de code portable PyTorch Jupyter est venu avec :. Https: //github.com/paraschopra/abstract-art-neural-network)

Comment cette image est g�n�r�e?

Cette image est un cadre simple - r�seau de g�n�ration de motif complexe (CPPN) g�n�r�.

(Vous pouvez apprendre par cet article.)

Article, les auteurs ont g�n�r� image abstraite par les r�seaux de neurones �crits en JavaScript. Et cet article PyTorch les atteindre.

Proc�d� pour g�n�rer une image par le r�seau neuronal de sorte qu'ils sont �mis dans une image compl�te, par exemple, ce qui suit est appel� � g�n�rateur � Neural r�seau bruit al�atoire comme entr�e, et g�n�re l'image enti�re dans la couche de sortie (et largeur * hauteur).

Et toute la production des images diff�rentes, CPPN dans une position donn�e (en entr�e) de sortie de couleur de pixel.

Le non-respect de l'image ci-dessus et z r, les r�seaux sont de pixel d'attention coordonn�es x, y, et d�livre le pixel devrait �tre la couleur (indiqu�e par c). mod�le PyTorch du r�seau tel est le suivant:

classe NN (nn.Module):

�def __init __ (self):

�Super (NN, auto-) .__ init __ ()

�self.layers = nn.Sequential (nn.Linear (2, 16, polarisation = True),

�nn.Tanh (),

�nn.Linear (16, 16, polarisation = Faux),

�nn.Tanh (),

�nn.Linear (16, 16, polarisation = Faux),

�nn.Tanh (),

�nn.Linear (16, 16, polarisation = Faux),

�nn.Tanh (),

�nn.Linear (16, 16, polarisation = Faux),

�nn.Tanh (),

�nn.Linear (16, 16, polarisation = Faux),

�nn.Tanh (),

�nn.Linear (16, 16, polarisation = Faux),

�nn.Tanh (),

�nn.Linear (16, 16, polarisation = Faux),

�nn.Tanh (),

�nn.Linear (16, 16, polarisation = Faux),

�nn.Tanh (),

�nn.Linear (16, 3, polarisation = Faux),

�nn.Sigmoid ())

�def vers l'avant (self, x):

�self.layers de retour (x)

Notez qu'il accepte deux entr�es et trois sorties (valeurs RVB des pixels). Proc�d� de g�n�ration d'une image enti�re est entr�e � l'ensemble X, position Y de l'image souhait�e (taille sp�cifique), et la position X, Y sur les param�tres de couleur pour la couleur de sortie de r�seau.

r�seau de neurones exp�rimental

Peut-�tre, lorsque vous essayez d'ex�cuter le r�seau de neurones ci-dessus, vous allez g�n�rer l'image suivante:

Peut-�tre vous serez plein de questions: Pourquoi proposez-vous que peu importe ce que l'emplacement x, y, sortie r�seau est gris? Id�alement, cela ne devrait pas arriver, car si profond�ment ce r�seau. Modifiez la valeur d'entr�e devrait changer la valeur de sortie.

Lorsque chaque initialisation du r�seau neuronal, �tant donn� que les param�tres d'initialisation al�atoire (poids et des biais), qui sont susceptibles de g�n�rer une nouvelle image. Mais souvent, m�me apr�s quelques essais, vous obtenez ce des r�seaux de neurones sont gris. Pourquoi?

Certains pourraient dire, est la fonction d'activation sp�cifique utilis� des probl�mes -tanh. Tanh pluralit� de couches ult�rieures de s�quences possibles dans la couche de sortie (le gris repr�sentant toutes) de l'ordre de 0,5 � entr�e num�rique compress�. Toutefois, nous vous recommandons le d�but de l'article �galement utilis� tanh. Ce que nous avons fait �tait de convertir le blog �crit en JavaScript en utilisant les r�seaux de neurones � PyTorch sans apporter aucune modification.

O� se trouve la racine du probl�me?

Quand un nouveau r�seau de neurones est initialis�, PyTorch est comment initialiser les poids? Les forums d'utilisateurs, ils utilisent de -1 / sqrt (N) + 1 / sqrt (N) des nombres al�atoires pour initialiser les coefficients de pond�ration. O� n est un nombre de couches de connexions entrantes. Ainsi, pour la couche cach�e, si N = 16, les poids seront initialis�s entre -1/4 � +1/4. Ainsi, nous pouvons faire la conjecture suivante: produire une raison grise Suppose est parce que la gamme de poids est tr�s faible, et peu de changement.

Si tous les poids dans le r�seau entre -1/4 de +1/4, lorsqu'ils sont ajout�s ensemble et multipli�e par une entr�e, des effets similaires peuvent se produire dans le th�or�me de la limite centrale.

Th�or�me central limite (CLT) Preuve: Dans certains cas, l'ajout de variables al�atoires ind�pendantes, m�me si la variable d'origine lui-m�me est normalement distribu�, ils sont convenablement normalis�es et ont �galement tendance � �tre normalement distribu�s (officieusement connu sous le nom � cloche courbe � ).

Rappelez-vous comment calculer la valeur de la couche suivante.

Dans notre exemple, la premi�re couche pr�sente deux valeurs d'entr�e (x, y), le second neurones de couche cach�e 16. Par cons�quent, chaque neurone dans la seconde couche des deux valeurs obtenues par un poids, les valeurs de poids entre -1/4 � +1/4. Ces valeurs sont additionn�es puis, apr�s avoir d�marr� la fonction d'activation tanh, � livrer � la nouvelle valeur de la troisi�me couche.

Or, d�s le d�but de la seconde couche, il y a 16 entr�es � transmettre � chacun des 16 neurones dans la troisi�me couche. Supposons que ces valeurs exprim�es chacune par z, la valeur de la troisi�me couche de chaque neurone est le suivant:

Ceci est notre supposition une autre. En raison de la petite variance du poids (-1/4 � +1/4), la valeur de z (� savoir, entr�e x, y par le poids, alors la fonction tanh) ne change pas trop (donc similaire). Donc, cette �quation peut �tre consid�r�e comme:

Pour chaque neurone, la valeur la plus probable de -0,25 � 0,25 en poids 16 et le droit est �gal � z�ro. M�me dans la premi�re couche, et n'est pas proche de z�ro, le r�seau des huit �quations eu suffisamment de possibilit�s en fin de compte produire une valeur proche de z�ro. Par cons�quent, quelles que soient les valeurs d'entr�e (x, y) sur la fa�on d'acc�der � la fonction d'activation brute (poids multipli� par l'entr�e compl�te) est toujours proche de z�ro, tanh cartes � z�ro (et donc la valeur de toutes les couches suivantes reste nul).

tanh axe x est l'entr�e, y est l'arbre de sortie. Notez que 0 � 0 cartes.

Gris Quelle raison? En effet, la fonction en forme de S (la derni�re fonction d'activation de la couche) prend z�ro � cette valeur d'entr�e, et des cartes � 0,5 (repr�sentant gris, 0 repr�sentant le noir et blanc pour 1).

Notez comment la fonction en forme de S mis en correspondance avec les valeurs d'entr�e 0 � 0,5.

Comment fixer un gris?

�tant donn� que la cause profonde de petits changements de poids, notre �tape suivante consiste � augmenter. Modifier la fonction d'initialisation par d�faut, des poids assign de -100 � +100 (au lieu de -1/4 � +1/4). Maintenant, ex�cutez le r�seau de neurones, nous pouvons obtenir:

Wow! Certains sont maintenant une des taches de couleur gris.

Maintenant, avec quelques progr�s. Notre hypoth�se est correcte. Mais l'image r�sultante est pas encore bien la structure. Il est trop simple.

Le r�seau de neurones est r�alis� en multipliant l'entr�e avec les poids � la surface, en les poussant � travers tanh, la couleur de sortie finale en fonction de s-forme. �tant donn� que nous avons fix� des poids, vous pouvez modifier l'entr�e � l'image de sortie est plus int�ressante? Bien s�r.

Notez que l'image ci-dessus est g�n�r� lorsque les x d'entr�e, y comme les coordonn�es des pixels originaux � partir de 0,0 � extr�mit� 128128 (qui correspond � la taille de l'image). Cela signifie que notre r�seau n'a jamais �t� un nombre n�gatif en entr�e, et � cause de ces grands nombres (tels que x, y peut �tre 100100), la fonction tanh soit obtenir un tr�s grand nombre (il est comprim� � +1), ou pour donner un tr�s petit nombre (qui est aplati � -1). Ceci est la raison pour laquelle nous voyons la combinaison simple des couleurs primaires (par exemple, 0,1,1 R, G, cyan sortie B que vous voyez dans la figure ci-dessus).

Comment rendre l'image plus int�ressante?

Comme au d�but de l'article mentionn� dans l'article, nous allons normaliser x et y. Par cons�quent, nous ne prenons pas x, mais l'entr�e (x / image_size) -0,5. Cela signifie que la plage de valeurs de x et y est de -0,5 � 0,5 (sans tenir compte de la taille de l'image). Cela a donn� lieu � l'image suivante:

Il y a des progr�s!

Fait int�ressant, une image dans la ligne de front a �t� de plus en plus vers le coin inf�rieur droit (en raison de valeurs x, y augmentent). Ici, �tant donn� que les valeurs x, y sont standardis�es, et contient maintenant un nombre n�gatif, de sorte que ces lignes se d�veloppent uniform�ment vers l 'ext�rieur.

Cependant, l'image est encore assez belle.

Comment rendre l'image plus int�ressante?

Si vous regardez attentivement, vous trouverez au milieu de l'image semble avoir plus que le bord de la structure. Ce sont les math�matiques de Dieu nous donne � penser que nous devrions aller chercher magnifi�e aux �tats-Unis.

Il y a trois fa�ons un centre agrandi de l'image:

� G�n�rer une grande image. �tant donn� que les coordonn�es de pixels sont normalis�es, nous pouvons simplement lancer un r�seau de neurones pour g�n�rer une image plus grande. Ensuite, nous pouvons zoomer � travers la partie centrale d'outils de retouche d'image, jetez un oeil � ce que nous avons trouv�.

* X et entr�es y multipli� par une petite quantit� (facteur d'�chelle) qui r�aliseraient effectivement les m�mes r�sultats avec la m�thode pr�c�dente (et �viter de gaspiller nos calculs ennuyeux dans d'autres r�gions).

� Etant donn� que la sortie est r�-�tablie en multipliant le droit d'entr�e, afin de pouvoir �tre r�duite par la valeur des autres valeurs de poids diminu�, passant de -100 � + 100 + 3, -3 et ainsi au lieu de r�duire les valeurs d'entr�e (et se rappeler de ne pas trop r�duit. PENSER si les poids seront de l'ordre de -0,25 � 0,25 gris il?).

Quand on utilise le second proc�d� de x et y est multipli�e par 0,01, il y avait:

Lorsque la troisi�me m�thode est initialis� et le poids est compris entre -3 et +3, ce qui est l'image que nous obtenons:

Ouvrez encore votre esprit?

plus d'exp�riences

Amorcer un changement du poids normal (moyenne 0 et d'�cart type 1), et g�n�re une pluralit� d'images (le chiffre est d�s le d�but de l'initialisation al�atoire).

Lors de l'enl�vement de la totalit� de la couche cach�e (entr�e de mappage de sortie seulement):

0 couche cach�e

Lorsque conservant une seule couche cach�e (au lieu de la valeur par d�faut 8 couche cach�e):

Une couche cach�e

En doublant le nombre de couches cach�es � 16 couches:

16 couche cach�e, chaque neurone 16

Comme vous pouvez l'imaginer, le nombre de couches cach�es, l'image devient de plus en plus complexe. Si la couche n'est pas doubl�, mais le nombre de couches reste inchang� (8), mais le nombre de neurones dans chaque couche double (16-32), ce qui se passe? Nous obtenons:

8 couche cach�e, chaque neurone 32

Notez que, bien que dans les deux cas, le nombre total des poids du r�seau sont semblables, mais le r�seau comportant deux couches plus que chaque pixel du double r�seau de neurones. repr�sentation des pixels dans ces domaines, la fonction de changement rapide, donc si on fait un zoom plus loin, vous trouverez plus de structure. Pour la m�me mais le nombre de couches de chaque double r�seau de neurones, qui fonctionne lissent tout � fait aussi � �volutivit� � est faible.

Bien s�r, qui sont tous des r�seaux de neurones profonds plus expressif autre fa�on de dire.

la complexit� de la fonction de calcul cro�t de fa�on exponentielle avec la profondeur.

C'est ce que nous voyons. th�or�me d'approximation g�n�rale qui, en th�orie, un r�seau de neurones est assez grand, m�me s'il y a une couche cach�e, vous pouvez repr�senter toutes les fonctions. En pratique, cependant, plus le r�seau, plus compliqu� l'entr�e � la cartographie de sortie.

exp�rience tr�s int�ressante mais Pointless

Si l'on prend le nombre de neurones dans chaque couche est de 8 � 128 (le nombre d'�tages augmente).

Nerve - Pollock!

Si nous partons de chaque couche cach�e neurone 128, et comme celui-ci dans les couches suivantes, ils sont progressivement r�duits de moiti�.

self.layers = nn.Sequential (nn.Linear (2, hidden_n, polarisation = True),

�nn.Tanh (),

�nn.Linear (128, 64, polarisation = Faux),

�nn.Tanh (),

�nn.Linear (64, 32, polarisation = Faux),

�nn.Tanh (),

�nn.Linear (32, 16, polarisation = Faux),

�nn.Tanh (),

�nn.Linear (16, 8, polarisation = Faux),

�nn.Tanh (),

�nn.Linear (8, 4, polarisation = Faux),

�nn.Tanh (),

�nn.Linear (4, 3, polarisation = Faux),

�nn.Sigmoid ())

Nous obtenons:

Cela semble mieux que d'autres, plus � naturelle �.

Il y a beaucoup d'exp�riences que vous pouvez faire et obtenir une image int�ressante, vous pouvez essayer plus de l'architecture, et le niveau d'activation.

Millet Mix3 a cass� un grand inventaire, r�el graphique de la machine + temps et de lieu de conf�rence pour commencer

Pr�c�dent

Temps de conscience: sept ans et demi avant d'utiliser des graphiques DX12 soudainement vieux!

Prochain

: Apr�s: 10 Blues jette le ballon pour 2

: Le nouveau d�tail de d�tail en ligne de feu! Lynx 618 Blowout la consommation de chauffage urbain dans tout le pays en train de rattraper la semaine d'or

: balle AC Milan 3-0 Cagliari, Paqueta � l'enfant, Pia Turk a bris�

: Les utilisateurs mobiles ne peuvent pas demander un nouveau riz de la carte et les anciens utilisateurs ne peuvent pas tourner? A l'int�rieur d'une photo avec vous secret

: Barcelone 0-0 Athletic Bilbao, la rencontre de la ligue Liang Lianping

: Pourquoi la plupart des gens jouent maintenant LOL Polar Fuzion il? Action de l'utilisateur inattendu

: cha�ne bloc D�cennie: 2019 les tendances des stocks

: La moiti� - Peabody 0-0 Barcelone, racine Teershite aux portes s�curis�es encore

: Une fois que les rayons d'artefact super SU ROOT, utilisateurs: comparer les masques

: La moiti� -AC Milan 2-0 Cagliari, balle Paqueta � l'enfant

: secteur Notebook "8848", HP a annonc� un ordinateur portable en cuir pleine, surprise, prix

: Une lecture de texte: Qu'est-ce qu'une cha�ne de Markov? Que peut-on faire?