Algorithme | principe de r�alisation de la figure montre un mouvement r�seau de neurones convolution � deux dimensions

Figure: pixabay

Maintenant, l'ampleur et de l'importance des applications de r�seau de neurones convolutionnels dans le domaine de l'intelligence artificielle peuvent �tre d�crits comme allant de soi. Afin de permettre � tout le monde une compr�hension claire du type de convolution, je peux aper�u rapide des diff�rents types de convolution et ses avantages. Par souci de simplicit�, je suis seulement pr�occup� par la convolution � deux dimensions.

1, convolution (Convolutions)

Tout d'abord, nous devons d�finir quelques couches de convolution de param�tres.

La figure 1 noyau de convolution de dimension de taille 3, les �tapes 1

Taille du noyau: la taille du noyau d�finit la convolution de vision. 3-- choix commun est � deux dimensions, � savoir 3x3 pixels.

�tape: d�finir un pas � pas lors du d�placement de l'image du noyau. Bien que sa valeur par d�faut est g�n�ralement 1, mais on peut utiliser deux �tapes, similaires au maximum de l'image de l'�chantillon mis en commun.

padding: comment d�finir le traitement de remplissage de trame �chantillon. A (moiti�) maintenant une taille de rembourrage de sortie de convolution spatiale est �gale � la taille d'entr�e, et si le noyau est sup�rieur � 1, de ne pas ajouter la convolution va �liminer une partie des limites.

les canaux d'entr�e et de sortie: couche de convolution n�cessite un certain nombre de canaux d'entr�e (I), et calculer un certain nombre de canaux de sortie (O). Ces param�tres peuvent �tre calcul�s par la couche requise I * O * K, o� K est le nombre �gal � la valeur du noyau.

2, l'expansion de convolution (dilat�e Convolutions) (et convolution Mingelusi)

Convolution extension de convolution introduire une autre couche sont appel�s param�tres de rapport d'expansion. Cela d�finit la valeur de l'espacement entre les noyaux. Le taux d'expansion du noyau 23x3 noyau 5x5 aura le m�me champ de vision, alors que seulement neuf param�tres. Imaginer l'utilisation d'un noyau de 5x5 et de supprimer chaque espacement de ligne et de colonne.

La figure 2 convolution � deux dimensions, le taux de croissance de 2 � 3 noyaux, pas de remplissage

Il permet au syst�me d'offrir une gamme plus large d'observation au m�me co�t de calcul. Expansion dans convolution en temps r�el des zones divis�es particuli�rement populaires. Si vous avez besoin d'une plus grande plage de visualisation, et ne peut pas se permettre plus noyau ou plus convolution, envisager de l'utiliser.

3, convolution de transposition (Transpos�e Convolutions) (�galement connu sous le nom circonvolution enroul�e du segment ou la d�convolution)

Certaines personnes utilisent d�convolution ce nom, ce n'est pas particuli�rement pertinent, car il n'est pas une d�convolution. Pour aggraver les choses d�convolution existe, mais il est rare dans la profondeur de champ d'�tude. Le processus de d�convolution r�elle est invers�e convolution. Imaginer l'entr�e d'image � une seule couche de convolution. Maintenant sortie pour �tre plac� dans une bo�te noire, et l'image d'origine est sortie � nouveau. La bo�te noire �tait une op�ration de d�convolution. Ceci est la convolution math�matique de la couche d'inversion.

Convolution est transpos� d'une mani�re similaire � celle de la r�solution spatiale et il est suppos� d�convolution produit une couche est le m�me. Cependant, les op�rations math�matiques m�me a eu lieu les valeurs sont diff�rentes. La transposition est de convolution effectue classiques de la couche de convolution, mais il reprendra sa transformation spatiale.

La figure 3 dimensions convolution pas de rembourrage, les �tapes 2 et 3 core

Sur ce point, vous pouvez vous sentir confus, alors regardons un exemple sp�cifique. L'image est amen� � une couche de convolution 5x5. Son rythme est r�gl� sur 2, rembourrage d�sactiv�, le noyau est 3x3. Le r�sultat est une image 2x2.

Si nous voulons inverser ce processus, nous avons besoin de math�matiques pour g�n�rer contre neuf valeurs de pixels de chacune de nos entr�es. Apr�s cela, nous avons mis le rythme de 2 pour parcourir l'image de sortie. Ce sera une d�convolution.

La figure 4 transpos�e convolution � deux dimensions pas de remplissage, les �tapes 2 et 3 core

Les op�rations telles Transposer ne seront pas la convolution. La seule chose commune est qu'il assure que la sortie sera une image d'un 5x5, alors que toujours effectuer une op�ration de convolution normale. Pour y parvenir, nous devons effectuer une belle rembourrage sur l'entr�e.

Comme vous pouvez l'imaginer maintenant, cette �tape ne revient pas sur le processus d'en haut. � l'exclusion d'au moins la valeur.

Il est seulement dans le pass� sur la base de l'op�ration de convolution de r�solution spatiale et � la reconstruction. Cela peut ne pas �tre une inversion math�matique, mais pour l'architecture COdeurDECodeur, il est toujours tr�s utile. De cette fa�on, nous pouvons �voluer la combinaison d'image convolu�e, plut�t que deux processus distincts s�par�ment.

4, une convolution s�parable (s�parable Convolutions)

Dans une convolution s�parable, on op�ration noyau peut �tre divis� en plusieurs �tapes. Nous convolution y = conv (x, k), o� y est l'image de sortie, x est l'image d'entr�e, k est le noyau. Cette �tape est tr�s simple. Ensuite, nous supposons k peut �tre calcul� par l'�quation suivante: k = k1.dot (K2). Cela fera une convolution s�parable, parce que nous pouvons faire une convolution � deux dimensions de k1 et pour atteindre les k2 m�mes r�sultats, plut�t que k convolution � deux dimensions faire.

5 la figure Sobel filtres X et Y

Nous noyau habituellement Sobel pour le traitement d'image, par exemple. Vous pouvez et .T noyau obtenu en multipliant le m�me vecteur. Lorsque vous effectuez la m�me op�ration, vous avez seulement besoin de six au lieu de neuf param�tres.

L'exemple ci-dessus montre que l'on appelle l'espace convolution s�parable, pour autant que je sache, ce n'est pas dans l'apprentissage en profondeur. Je veux juste vous assurer que lorsque les autres luttaient pour fonctionner, vous ne serez pas si confus. Dans un r�seau de neurones, nous utilisons habituellement quelque chose appel� r�seau de neurones de convolution s�parable de profondeur.

Ceci effectue une convolution spatiale, tout en maintenant des canaux s�par�s, la profondeur de convolution. � mon avis, afin d'approfondir la compr�hension, il peut �tre utilis� comme un exemple de mod�le.

Supposons une convolution 3x3 dans une couche sur un 16 canaux d'entr�e et 32 voies de sortie. Il doit se produire dans chacun des canaux 16 par un noyau 3x332 est travers�e pour produire une cartographie 512 (16x32) caract�ristique. Ensuite, nous avons mis en correspondance avec la synth�se d'une grande somme par les caract�ristiques de chaque carte du canal d'entr�e. �tant donn� que nous pouvons le faire 32 fois, donc nous obtenons le canal de sortie d�sir� 32.

Ainsi, pour le m�me exemple, la profondeur de la performance de convolution s�parable et comment est-il? Nous parcourons les 16 canaux, chacun avec un noyau 3x3, fonction carte 16 peut �tre donn�e. Maintenant, avant de faire des op�rations de fusion, nous allons parcourir les 16 cartes de fonction, contenant chacun 321x1 convolution, puis seulement par ce d�but ajoutant. Cela conduit � l'd�crite ci-dessus 4608 (16x32x3x3) oppos�e aux param�tres 656 (16x3x3) + 16x32x1x1 param�tres.

Cet exemple est une impl�mentation sp�cifique d'une profondeur de convolution s�parable, dans lequel le multiplicateur est un soi-disant profonde. Ceci est de loin le plus commun de ces param�tres de calque.

Nous faisons cela parce que l'espace d'hypoth�ses et informations d�taill�es peuvent �tre d�coupl�s. Par comparaison, les performances du mod�le Xception, vous pouvez trouver cette th�orie semble �tre valide. En fait, le dispositif mobile peut �galement �tre utilis� dans une profondeur de convolution s�parable. Parce que leurs param�tres peuvent �tre utilis�s efficacement.

5 r�sum�

Jusqu'� pr�sent, on peut dire pour l'introduction du type de r�seau de convolution prendra fin. J'esp�re vous aider � un bref regard sur cette question. Et la prochaine, nous allons vous montrer quelques animations de convolution pour vous aider � faire cette �tape profonde compr�hension.