r�seau profondeur math�matique derri�re le secret de Deep Web

Cet article est une compilation de technologie blog AI Yanxishe, le titre original:

Plongez en math�matiques derri�re les r�seaux profonds

Auteur | Piotr Skalski

Traduction | gris dans l'apprentissage, D�sillusion

Relecture | sauce poire finale Fan | soeur d'ananas

Lien original: l

https://towardsdatascience.com/https-medium-com-piotr-skalski92-deep-dive-into-deep-networks-math-17660bc376ba

La premi�re partie du myst�re du r�seau de neurones

Aujourd'hui, nous avons beaucoup avanc�, des biblioth�ques et des cadres sp�ciaux, tels que Keras, tensorflow ou PyTorch, plus besoin de se soucier de la matrice de poids total de la taille, mais ne pas besoin de se rappeler certains d'entre nous avons d�cid� d'utiliser la formule de sa fonction d'activation. En g�n�ral, nous avons juste besoin d'essayer un r�seau de neurones, m�me si une structure est des r�seaux de neurones tr�s complexes, et la n�cessit� d'importer seulement quelques lignes de code peuvent �tre accomplies. Cela permet de gagner du temps et simplifier notre recherche de failles dans notre travail. Cependant, une compr�hension en profondeur du r�seau de neurones est termin�e dans le cadre de notre choix, ou d'ajuster les param�tres ou super grande aide sur la t�che d'optimisation.

Faites attention : Merci de l'aide de Jung Yi Lin, vous pouvez �galement lire la version chinoise de cet article. Je vous offre un code source visuelle utilis� pour cr�er cette utilisation de l'article sur GitHub.

introduction

Apprenez r�seau plus de neurones. J'ai d�cid� de tirer en point l'heure d'�t� l'apprentissage en profondeur sur les math�matiques. Je compte aussi �crire un article sur le dernier conseil d'�tude afin d'aider les autres � comprendre certains saccad�s et des concepts difficiles. Je l'ai �crit cet article pour ceux qui sont moins bonnes � l'alg�bre lin�aire et le calcul sont tr�s sympathiques, mais comme le titre l'indique, ce sera �troitement li� � un article math�matique.

formation de visualisation d�finie 1. La figure.

� titre d'exemple: nous allons r�soudre le probl�me afin de d�terminer l'ensemble des donn�es de classification binaire, comme le montre la figure 1 ci-dessous. Si deux classes diff�rentes qui formeront deux cercles - cet ensemble est tr�s peu pratique dans de nombreux algorithme ML classique, mais quelques petits r�seaux de neurones, mais peut avoir de tr�s bons r�sultats. Pour r�soudre ce probl�me, nous allons utiliser le r�seau de neurones n'a --5 la structure Figure II de couches enti�rement connect�es ayant un nombre diff�rent d'unit�s. Pour la couche cach�e, nous utiliserons Relu comme fonction d'activation et la Sigmod comme la couche de sortie. Ceci est une structure assez simple, plut�t que assez compliqu� d'�tre un besoin pour un exemple de notre bien pens�.

Figure 2. L'architecture de r�seau de neurones

solution KERAS

Tout d'abord, nous utilisons une de la biblioth�que d'apprentissage de la machine la plus populaire --KERAS d'abord propos� une solution.

de keras.models importer s�quentielle de keras.layers Dense d'importation model = Sequential model.add (Dense (4, input_dim = 2, l'activation = 'Relu')) model.add (Dense (6, = activation 'Relu')) model.add (Dense (6, = activation 'Relu')) model.add (Dense (4, = activation 'Relu')) model.add (Dense (1, activation = 'sigmo�de')) model.compile (perte = 'binary_crossentropy', optimiseur = 'adam', m�triques = ) model.fit (X_train, y_train, �poques = 50, verbeux = 0)

Comme �a. Comme je l'ai mentionn� dans l'introduction, certaines importations ajouter quelques lignes de code suffit pour cr�er une presque 100% capable et form� du mod�le de classification pour notre ensemble d'�chantillons de test. Notre t�che est finalement d�finie en fonction de l'hyper-param�tres (le nombre de couches, le nombre de neurones dans les couches, le nombre de fois ou la fonction d'activation) pour s�lectionner la structure du r�seau de neurones. Maintenant, nous allons jeter un regard sur le processus de formation derri�re elle. Oh ...... J'ai cr�� une interface visuelle fra�che dans le processus d'apprentissage. J'esp�re que vous ne serez pas lu, il est difficile de dormir.

Figure 3. cours de formation appropri�s affichage visuel

Qu'est-ce qu'un r�seau de neurones?

R�pondons � la question: Qu'est-ce qu'un r�seau de neurones? La m�thode de construction d'un programme informatique qui est une inspiration biologique, pour apprendre � trouver et connexion de donn�es s�par�e. Comme le montre la figure II. Logiciel de r�seau est � neurone � est d�fini cascadable, d'une mani�re qui leur permet de communiquer ensemble.

Un seul neurone

Chaque neurone re�oit un ensemble de valeurs x (num�rot�es de 1 � n) en entr�e et calcule les valeurs pr�dites de Y ^. X est la valeur de la concentration en fonction de la formation du vecteur de l'une de la quantification des �chantillons de m. Le plus important est que chaque unit� a son propre ensemble de param�tres, le processus d'apprentissage n�cessite g�n�ralement le changement de poids (vecteurs de colonne de poids) et B (valeur d'�cart), le calcul de l'�l�ment neuronal � chaque it�ration du vecteur x les valeurs moyennes pond�r�es en fonction de son vecteur de courant de poids w, et en ajoutant l'�cart, le r�sultat final du calcul de la fonction d'activation non lin�aire g. Je mentionnerai quelques-uns des plus populaires sur la fonction d'activation dans les sections suivantes.

couche unique

Maintenant, le regard de laisser la petite place, pensez � la mani�re dont le calcul de la totalit� de la couche de r�seau de neurones. Nous utiliserons notre connaissance des principes au sein d'un seul neurone, vectorisation la couche ensemble, ces calculs seront int�gr�s dans l'�quation de la matrice. L'�quation sera �crit dans la couche s�lectionn�e, afin d'unifier le symbole . Soit dit en passant, l'indice i marquer les neurones de la couche d'index.

5, une seule couche

Une �valuation plus importante: lorsque l'on �crit l'�quation comme une seule unit�, nous utilisons le x et y ^, qui sont des vecteurs de colonne et la valeur pr�dite de la valeur caract�ristique, lorsque nous sommes pass�s � la repr�sentation de la couche, en g�n�ral, nous avons utilis� le vecteur a - le vecteur peut activer la couche respective. Ainsi, x serait vecteur couches peuvent �tre activ�es 0-- couche d'entr�e, chaque neurone d'effectuer des calculs similaires sont les suivants:

Pour plus de clart�, nous allons �crire l'�quation comme la deuxi�me couche:

Comme vous pouvez le voir, pour chaque couche, nous devons effectuer de nombreuses op�rations sont tr�s similaires, donc en fait, pour cette efficacit� du cycle est pas �lev�, donc nous allons vectoris�e pour acc�l�rer l'op�ration, tout d'abord, nous vecteurs seront empil�s horizontalement dans un vecteur de N * 1.

Nous chaque poids w transpos� pour former une preuve W, de m�me, nous biaiser les couches empil�es de chaque neurone, de mani�re � cr�er un vecteur B vertical, rien ne nous emp�che maintenant construire une �quation matricielle, il afin que nous puissions une fois que toutes les couches de neurones sont calcul�es. Ecrivons les dimensions de la matrice et le vecteur que nous utilisons.

Des exemples de la pluralit� de vecteurs

Nous avons cr�� cette �quation comporte donc des jusqu'� pr�sent un seul exemple. r�seau de neurones dans le processus d'apprentissage, vous utilisez g�n�ralement de grandes quantit�s de donn�es, jusqu'� des millions. Ainsi, l'�tape suivante sera un vecteur d'une pluralit� d'exemples. Supposons que nous avons un ensemble de donn�es d'entr�es de m, chaque entr�e a nx caract�ristique, d'abord, nous allons chaque vecteur x vertical, a et z sont combin�es, cr�ent s�par� X, A et Z de la matrice. Ensuite, nous r��crivons la mise en page pr�c�dente de l'�quation, en tenant compte de la matrice nouvellement cr��e.

Quelle est la fonction d'activation, et pourquoi nous avons besoin de le faire?

fonction d'activation est l'un des �l�ments cl�s du r�seau de neurones, compos�s s'ils sont absents, nous nous retrouvons avec des r�seaux de neurones pour la fonction lin�aire du. Par cons�quent, le r�seau de neurones sera une fonction lin�aire directe. Notre mod�le sera �galement manque d'�volutivit� diversifi�e, ce qui conduit � m�me pas aussi bonne que la r�gression logistique.

des �l�ments non lin�aires ayant des fonctions complexes telles qu'une plus grande souplesse et la plasticit� dans le processus d'apprentissage. La principale raison pour laquelle nous avons choisi la fonction d'activation est qu'il a un impact significatif sur la vitesse d'apprentissage, la figure 6 montre une fonction d'activation commune. � l'heure actuelle, couche cach�e le plus populaire devrait �tre fonction Relu, mais nous utilisons encore parfois sigmo�de, en particulier dans la couche de sortie. Lorsque vous traitez avec la classification binaire, le mod�le que nous voulons revenir � la valeur comprise entre 0 et 1.

. La figure 6. Le plus populaire et les d�riv�s de ceux-ci la fonction d'activation de la Fig.

La perte de fonction

Pierre angulaire du processus de d�veloppement de l'apprentissage en profondeur peut dire est la valeur de la perte. En g�n�ral, la perte de la fonction de l'�cart entre l'id�al et la r�alit� de nos valeurs est repr�sent�e. Dans notre exemple, nous utilisons une entropie crois�e binaire, mais selon le probl�me, on peut aussi utiliser une autre fonction. Nous utilisons la fonction repr�sent�e par la formule suivante, vous pouvez voir les variations de la valeur du processus d'apprentissage � la figure 7. Il montre comment la valeur de la fonction de perte de chaque it�ration est r�duite alors que la valeur exacte est augment�e.

Figure 7. Changement dans le processus d'apprentissage et la valeur pr�cise des valeurs de perte

Comment les r�seaux de neurones apprennent?

En fait, le processus d'apprentissage est de minimiser la perte de valeur, et en changeant la valeur du param�tre W. Pour atteindre cet objectif, nous utilisons l'int�grale et le gradient de descente algorithme pour trouver une valeur minimale de la perte de la fonction. Dans chaque it�ration est calcul�e la valeur de la d�riv�e partielle de la fonction de perte de chaque partie du r�seau de neurones. Pour ceux qui ne sont pas tr�s bons � ce calcul, je dirais simplement, le d�riv� a la capacit� de la fonction pente bien d�crite. Puisque nous savons comment changer les variables pour se d�placer sur la carte.

Afin de former une compr�hension intuitive de la fa�on dont il fonctionne sur une descente de gradient (attirer votre attention � nouveau) J'ai pr�par� un petit sch�ma visuel. Vous pouvez voir toutes les �tapes que nous allons vers le point le plus bas d'un point al�atoire. Il fonctionne de la m�me fa�on dans nos r�seaux de neurones - sont chaque it�ration du gradient pour nous montrer la direction que nous devrions aller. La principale diff�rence est que dans notre mod�le de r�seau de neurones, nous avons plus de param�tres � prendre en compte. Mais ... comment peut-on calculer la d�riv�e totale de celui-ci?

Dans la figure 8. La descente de gradient r�el

R�tropropagation

Tout comme nous avons besoin, il est un r�tropropagation nous permet de calculer l'algorithme de gradient tr�s complexe, on peut r�gler les param�tres du r�seau de neurones selon la formule suivante.

Dans l'�quation ci-dessus, repr�sente un taux d'apprentissage - un param�tre super, vous pouvez contr�ler les param�tres de performance de r�glage. S�lectionnez le taux d'apprentissage est cruciale - si l'on en g�n�ral trop faible. Notre r�seau de neurones apprendra tr�s lentement, si l'on est trop �lev�, nous ne pouvons pas atteindre le minimum. d�riv�e partielle dW W et b et db sur la fonction de perte, on utilise la m�thode de calcul de la cha�ne. W est la taille de la matrice dW et db. La figure 9 montre la s�quence des op�rations du r�seau de neurones. Nous voyons clairement comment propager avant et ensemble de travail pour optimiser la fonction de perte.

Figure 9. Vers l'avant et propagation

conclusion

J'esp�re que je l'ai expliqu� les math�matiques produites dans le r�seau de neurones. Lors de l'utilisation du r�seau de neurones, au moins une compr�hension de base de ce processus est tr�s utile. Je pense que ces choses que je parlais sont les plus importants, mais ils ne sont que la pointe de l'iceberg. Je vous sugg�re fortement d'essayer de vous pr�parer pour un tel petits r�seaux de neurones, sans l'utilisation d'un cadre de haut niveau, que Numpy.

Si vous r�ussissez cette lecture, f�licitations. Ceci est certainement pas un simple article. Si vous aimez cet article, s'il vous pla�t Suivez-moi sur Twitter et moyennes entreprises, et de voir d'autres projets sur lesquels je travaille, comme GitHub et Kaggle. Cet article est la deuxi�me de la s�rie � myst�re des r�seaux de neurones �, et d'autres articles si vous avez pas la chance de lire. Soyez curieux! Lei Feng r�seau

Je veux continuer � voir les articles liens et r�f�rences connexes? Lei Feng r�seau

Cliquez sur le lien pour ouvrir la presse ou cliquez sur [profondeur math�matique du r�seau derri�re le secret de la profondeur du r�seau]:

https://ai.yanxishe.com/page/TextTranslation/1161

AI Yanxishe contenu passionnant mis � jour quotidiennement, la visualisation de contenu plus excitant: Lei Feng r�seau

R�alisation de l'algorithme g�n�tique en Python

Comment l'apprentissage profond appliqu� � l'image de drone de d�tection cible

l'apprentissage de la machine et l'apprentissage en profondeur grand PK! Classement des insectes qui est plus forte?

Python pointe avanc�e: coup� en deux avec une seule ligne de l'empreinte m�moire de code

En attendant vous interpr�tez:

Route de la soie

Apprenez � conna�tre la Chine