gradient visualisation mont�e convolutif r�seau neuronal

Note de Lei Feng r�seau AI Technology Review: L'auteur Chen Zhongming, Lei Feng r�seau AI Technology Review sa lib�ration autoris�e.

Pourquoi mon mod�le de r�seau CNN choses sont form�s surajustement? Les param�tres ont �t� modifi�s � plusieurs reprises ne fonctionneront pas, � la fin est un �chantillon d'un probl�me ou un probl�me avec les d�finitions du mod�le de r�seau? Il n'y aurait pas de probl�me?

CNN chaque mod�le de r�seau de couche d'apprentissage est quelles sont les caract�ristiques? Pourquoi certaines personnes disent que la premi�re couche est la caract�ristique d'information de bord extrait du noyau de convolution, certaines personnes disent que la premi�re couche de base de convolution est extrait fonction de la couleur? Les deux ont en fin de compte est ou ce qui se passe?

couches r�seau CNN et peut ensuite perdre de maintenir le m�me taux de pr�cision et la perte de celui-ci? couches Soustraire peuvent r�duire les param�tres r�seau, j'ai eu la m�moire GPU n'est pas tr�s grand, r�seau trop grand cadrerait, ne veulent pas acheter un GPU ne peut �tre couche retaill�s, il n'y a pas grand Dieu peut me apprendre comment faire fonctionner ah?

Plusieurs fois, nous rencontrons les probl�mes ci-dessus, et par ou�-dire ont commenc� � souffler se vanter des gens aveugles Baba. Avant cela, m�me je ne sais pas le r�seau VGG16 deux derni�res block5 de conv2, la formation block5 de conv3 durer presque ne se composent beaucoup de texture. Le saviez-vous? Je ne sais pas si vous pouvez apprendre avec moi, je suis un d�butant dans la CNN nationale n'a pas encore commenc� � fosse de saut avant trop populaire, et a �t� fosse profonde. ing fosse abandonn�e. . . .

R�cemment �crit � propre o� un outil de l'entreprise pour analyser le mod�le de r�seau CNN form�, comme indiqu� ci-dessous: A partir du premier graphique, nous pouvons voir cette image il y a certains mod�les de poisson rouge poisson rouge, comme beaucoup de queue de poisson, alors il y a beaucoup d'�chelles interm�diaires, une image tr�s �trange, mais ne tiennent rien contre cette image, car il est suppos� que vous mettez cette image jet� par mod�le de donn�es VGGNet IMAGEnet pratiqu� dans le camp d'entra�nement pour la probabilit� de poisson rouge est certainement 99% vous essayez plus de 100 fois pour voir si elles sont des poissons rouges.

De m�me, la figure 2, les trois plans, les r�sultats sont comme �a, m�me mon arts lib�raux �cole papier soeur pour voir ces chiffres yaya appel�s, quel est ce, d�go�tant, comment les trois premiers, mais il est un peu comme un oiseau il est pas un oiseau. Oui, nous aimons � ces r�seaux de neurones d�go�tant images. La plus �vidente les caract�ristiques plus d�go�tant.

La visualisation a �t� obtenue par convolution ascension du gradient Figure

visualisation graphique de synth�se On suppose Convolution x, nous voulons faire de cette image composite peut �tre x neurones correspondants (convolution) ayant la valeur la plus �lev�e d'activation. Cette image composite obtenue par le noyau de convolution est le volume de la base ou � caract�ristiques de texture recherchent �, � veulent voir �. C'est quand nous voulons trouver une image � travers le r�seau CNN, la propagation du noyau de convolution sp�cifi�, cette image peut faire le meilleur score du noyau de convolution.

Pour la synth�se de cette image, nous commen�ons par un d�but d'une image al�atoire de bruit, chaque valeur de pixel d'une couleur s�lectionn�e au hasard.

Ensuite, nous utilisons cela comme un bruit d'entr�e CNN figure de r�seau de propagation vers l'avant, alors acc�der � la i-i�me couche de la j-i�me convolution activation noyau a_ij (x), puis de faire un delta calcul r�seau back-propagation a_i (x ) / delta x du gradient, enfin, nous convolution du bruit de gradient est mis � jour mod�le de bruit de la figure. L'objectif est de modifier les valeurs de couleurs pour chaque pixel pour augmenter l'activation du noyau de convolution, en utilisant ici une m�thode de remont�e de gradient:

Ce qui est le taux d'apprentissage de remont�e gradient itselong. Le proc�d� ci-dessus est r�p�t� jusqu'� ce que l'image x i-i�me couche permet au noyau j-i�me convolution ayant une valeur d'activation ult�rieure.

Pour la mise en uvre sp�cifique, nous devons d�finir une fonction de perte, la fonction de perte sera utilis�e pour maximiser une convolution donn�e la valeur d'activation du noyau. Pour la perte en fonction des objectifs d'optimisation, nous pouvons comprendre � la fin ce genre d'images peut faire ce noyau de convolution pour obtenir une meilleure valeur d'activation.

Maintenant, nous utilisons le Keras arri�re pour remplir cette fonction de perte, gradients (perte, variables) pour la perte de retour de gradient de fonction par rapport aux variables.

start_time = time.time

# La perte est l'activation du neurone pour la classe choisie

perte = layer_output

# On calcule le gradient de l'image d'entr�e WRT cette perte

grades = K.gradients (perte, input_img)

# Cette fonction retourne la perte et Grads donn� l'image d'entr�e

# Ajouter �galement un drapeau pour d�sactiver la phase d'apprentissage (dans notre cas d'abandon)

iterate = K.function ( , )

np.random.seed (1337) pour la reproductibilit� #

# Nous partons d'une image grise avec un peu de bruit al�atoire

input_img_data = np.random.normal (0, 10, (1,) + model.input_shape )

# (1,) pour l'axe de traitement par lots

Notez qu'il ya un petit gradient calcul� de trick-- de l'op�ration de r�gularisation L2, de sorte que le gradient est pas trop petit ou trop grand, ses avantages est d'�tre la proc�dure de remont�e de gradient lisse.

Fonction de fonctionner avec les param�tres de transmission d'extr�mit� arri�re instancier une classe de retour Fonction Keras. Ceci correspond � un objet en fonction de la fonction est utilis�e, l'�quivalent de la surcharge d'op�rateur du support, en tant que sorties = self.train_function (entr�es).

La fonction perte iterate_fun vient d'�tre d�finie, peut maintenant atteindre progressivement la valeur d'activation calcul�e en fonction du gradient d'augmentation du noyau de convolution.

# Nous courons ascension de gradient pour 1000 �tapes

for i in range (1000):

loss_value, grads_value = iterate ( ) # 0 pour la phase de test

input_img_data + = grads_value * learning_rate # Appliquer le d�grad� � l'image

print ( 'valeur de la perte actuelle:', loss_value)

# D�coder l'image d'entr�e r�sultante et l'ajouter � la liste

img = deprocess (input_img_data )

kept_images.append ((img, loss_value))

end_time = time.time

imprimer ( '% d Filtre trait�s% ds s% (class_index, end_time - start_time))

Enfin, la sortie d'image comme indiqu� ci-dessous, qui est la t�te? Ou la t�te de mouton? Vous ne trouvez pas le IMAGEnet de connexion Je ne sais pas ce que la t�te. Mais cette m�thode est que nous essayons de faire quelque chose avec les noyaux convolution d'image d'entr�e veulent voir, �tre compl�t�e par des pertes en hausse et les noyaux de convolution de couche de gradient sur l'image originale entr�e en remplissant les d�tails convolution obtenir visuelle carte nucl�aire.

Tous convolution visuelle figure

noyau de convolution de visualisation est la plus partie int�ressante de cet exemple, il est ma partie pr�f�r�e. En analysant le noyau de convolution de mod�le de r�seau CNN, nous verrons � la fin de chaque couche noyau est extraite convolution quel type de contenu, les caract�ristiques de texture. Lorsque nous comprenons la signification derri�re elle extrait les caract�ristiques mod�le CNN, vous pouvez avoir assez de confiance pour modifier les param�tres de convolution r�seau de neurones CNN.

Ici, nous allons utiliser VGG16 mod�les de r�seau ont �t� form�s � base de convolution syst�matique de chaque Visualize couche r�seau est de voir la couche CNN par d�composition de la couche de l'extraction de caract�ristiques d'entr�e � la fin est ce.

Le r�sultat final de l'ex�cution comme indiqu� ci-dessous, pour compl�ter le noyau de convolution de couleur principale de codage Block1_Conv1, direction, etc., au noyau de convolution Block2_Conv2 plus beaucoup plus texture et la direction du grain diff�rent de Block1_Conv1, la couleur et plus exprim� riche et vari�, et on peut le voir au bord de certaines performances in�gales.

Avec plus de mod�le continu r�seau VGG16, la direction de la couleur et la texture de la composition de base, de g�n�rer progressivement la texture sp�ciale. Lors de la saisie Block3_Conv1, la direction et la performance des couleurs commence devient faible, ont commenc� � appara�tre des caract�ristiques de texture plus complexes (circulaire, en spirale, polygonale, comme une vague forme en combinaison), � laquelle vous pouvez voir clairement la texture Block5_Conv1 Plus particuli�rement, convolution avec la croissance du cyberespace l'information nucl�aire et l'�mergence de fonctionnalit�s plus sophistiqu�es et complexes.

noyau Convolution est de plus en plus complexe, car ils ont commenc� � int�grer de plus en plus de l'�tendue spatiale de l'information, l'information pr�sent�e et a exprim� enrichi.

Apr�s un lecteur attentif peut trouver la tentative r�elle: il y aura une petite quantit� de noyau de convolution visuelle est vide ou le m�me que dans la m�me couche de convolution, ce qui signifie que l'op�ration de convolution et v�rification ult�rieure sans effet pratique, par DropOut le noyau de convolution pour r�duire la quantit� de calcul et de r�duire la possibilit� de overfitting r�seau.

De plus, il y aura une partie du noyau de convolution par rotation et visualis� la traduction, pour obtenir un autre noyau de convolution visuelle. Ceci est une direction de recherche tr�s int�ressant, nous pourrions �tre en mesure de remplacer potentiellement autre couche r�seau du noyau de convolution en trouvant une m�thode de invariance par rotation, comprimant ainsi le nombre de noyau de convolution. Surprenant que m�me pour un niveau relativement �lev� de filtre, tels que Block4_Conv1 par rotation, translation pour obtenir le m�me noyau de convolution visuelle est toujours valide.

Mais conv3 block5 dernier, apr�s le code de la pratique, nous constatons qu'il n'y a que le noyau 512 convolution 65 convolution perte de noyau est de 0, qui est, le reste du noyau de convolution ne peut plus continuer � l'information d'extrait sur la fonction de la texture de grande dimension c'est ainsi la m�me chose? Pourquoi est-ce pas? Ceci est aussi le ResNet ou GoogleNet pour am�liorer VGGNet peuvent parfois pas tous les r�seaux CNN noyau de convolution (neurones) peuvent participer r�seau informatique, jouer un r�le dans l'extraction de caract�ristiques dimensionnelle. Le montre la figure ci-dessous couche saut ResNet fa�on, parce que VGG de conv3 block5, block5 conv2 ont commenc� � appara�tre un noyau de convolution beaucoup d'aucune utilit�, et block4 conv3 il y a beaucoup d'informations utiles peuvent �tre transmises en arri�re.

Avec l'analyse visuelle du mod�le de r�seau CNN, nous comprenons plus profond�ment d�tails par �tape sur le fonctionnement du r�seau de neurones convolution CNN, plus pr�cis�ment ce qui est texture extrait pr�sente des informations. Si vous avez l'�nergie, vous pouvez �galement sp�cifier afficher vos propres mains d'abandon des neurones leur convolution r�seau de neurones overfitting pourquoi, comment peut couper le r�seau. Ce processus est tr�s int�ressant, mais aussi un processus d'essai humain de patience.

CNN comprennent vraiment visuelle

Deux fonctions principales convolution r�seau neuronal CNN que: 1) l'entr�e d'une combinaison de l'image du noyau de convolution visuo-spatiale, le niveau des composants de d�couplage. 2) par l'entr�e de donn�es de la carte hi�rarchique noyau de convolution dans un espace g�om�trique diff�rente.

Certaines personnes pr�tendront convolution r�seau de neurones CNN par la pens�e hi�rarchique du d�couplage d'entr�e d'image, un processus qui simule le cortex visuel humain, afin d'obtenir un effet sophistiqu�. Mais le fait est-ce vraiment? Du point de vue scientifique, cela ne signifie pas que nous sommes vraiment une fa�on de r�soudre le probl�me de la vision par ordinateur, nous utilisons simplement une approche math�matique pour l'�chantillonnage d'entr�e de donn�es d'image et cartographie l'espace g�om�trique. la science m�me est tellement expliqu�, mais leur r�alit� n'a pas r�fut� le cortex visuel fonctionne pas de cette fa�on.

Bien que l'�tude ne peut pas exprimer la profondeur de l'intelligence r�elle, mais sans doute son efficacit� est tellement incroyable qu'aucun autre algorithme ne peut �galer au cours des derni�res ann�es, et dans certains cas m�me d�pass� la pr�cision de la pr�diction de l'humanit�! Nous ne regardons pas en avant � des algorithmes d'apprentissage de notre fa�on de penser, mais plut�t d'embrasser les math�matiques, avec sa fa�on particuli�re au service de l'humanit�, continuent � d�couvrir, continuer � cr�er et de continuer � mener dans le domaine de la simulation num�rique!

r�f�rences:

Yosinski__2015__ICML_DL__Understanding_Neural_Networks_Through_Deep_Visualization

Comment les r�seaux de neurones convolutionnel voient le monde

Adresse: https: //blog.keras.io/how-convolutional-neural-networks-see-the-world.html

Lei Feng r�seau AI Technology Review.

Route de la soie

Apprenez � conna�tre la Chine

gradient visualisation mont�e convolutif r�seau neuronal

CNN comprennent vraiment visuelle