[New Ji-won EXAMEN en Yann LeCun � l'apprentissage profond est mort � En vertu de la d�claration �tonnante, le concept de la programmation diff�rentiables suscit� l'inqui�tude g�n�ralis�e. L'apprentissage machine c�l�bre blogueur Colah (Christopher Olah) perspectives d'apprentissage en profondeur apr�s 30 ans en 2015, il a fait r�f�rence � la programmation diff�rentiables. Il a exprim� l'apprentissage profond du point de vue de l'un des trois (repr�sentation) point de vue, que la profondeur de l'�tude �tait d'�tudier les liens entre l'optimisation et la programmation fonctionnelle, mais la programmation est la programmation fonctionnelle diff�rentiables et l'optimisation de l'intersection naturelle, tr�s simple et �l�gante digne d'une �tude plus approfondie.

� l'heure actuelle, l'apprentissage en profondeur est un outil tr�s efficace. Mais cet outil est que nous avons d�couvert par hasard, comme un champ, il n'y a pas vue unifi�e ou une compr�hension commune. En fait, dans ce domaine, il existe plusieurs expressions concurrentes!

En regardant en arri�re, je pense que dans 30 ans, nous verrons un apprentissage en profondeur tr�s diff�rente.

Etude approfondie 30 ans plus tard: vues Neuroscience, avis et caract�risation des probabilit�s et statistiques point de vue, qui gagnerait?

Si nous croyons 30 ans, nous pouvons �tre d'une mani�re tr�s diff�rente de regarder la profondeur de l'apprentissage, donc cela soul�ve une question int�ressante:

Jusque-l�, nous allons apprendre � regarder la profondeur?

Bien s�r, personne ne peut vraiment conna�tre l'avenir que nous comprenons ce domaine. Mais la chose int�ressante est que nous pouvons maintenant faire certains sp�culent.

� l'heure actuelle, il y a trois d�clarations sont en concurrence les uns avec les autres, nous avons l'intention de devenir la cl� pour comprendre la profondeur de l'apprentissage. Il y a des principes biologiques de tirage L'expression des neurosciences . Il existe des donn�es et convertir le centre naturel du collecteur est suppos� �tre Repr�sentation (repr�sentation) expression . Enfin, il y a d�clarations probabilistes , Le r�seau de neurones interpr�t�e comme variables cach�es (variables latentes). Ces d�clarations ne sont pas mutuellement exclusives, mais leur fa�on de penser � la profondeur de l'apprentissage, mais tr�s diff�rent.

La pr�sentation sera repr�sent�e � cet article �tend une nouvelle r�ponse: �tude approfondie et la recherche est le lien entre l'optimisation et la programmation fonctionnelle.

Dans cette perspective, l'�tude approfondie de l'expression repr�sent�e par la th�orie correspondant au type (th�orie de type) fonction de programmation. Selon cette th�orie, l'apprentissage en profondeur � l'intersection des deux domaines que nous connaissons, les deux r�gions ont beaucoup de recherche, ils sont si beaux, si naturel, dans mon esprit math�maticiens je peux presque croire que ce description de la r�alit� sous-jacente.

Ceci est une id�e inf�r�es. Je ne dis pas que cela est vrai, mais de sugg�rer que ce soit cr�dible, imagine la profondeur pleinement de l'apprentissage se d�place dans cette direction. Il convient de noter: Mon argument principal est lorsque vous effectuez sur l'esth�tique, plut�t que le fait que la d�monstration. Je veux montrer que c'est une id�e naturelle et �l�gante, elle couvre nous parlons de l'apprentissage en profondeur.

L'optimisation et la composition fonction

Unique dans la profondeur de l'apprentissage est qu'il est l'�tude approfondie des r�seaux de neurones - r�seau de neurones multicouches. Dans le processus � plusieurs niveaux, le mod�le se plier progressivement donn�es, plier en facile � r�soudre une forme de t�che donn�e.

Les d�tails de ces couches changeront tous les temps en temps. Reste constante est une couche de s�quence.

Chaque couche est une fonction de la sortie, on applique sur la couche pr�c�dente. Dans l'ensemble, ce r�seau est une cha�ne de fonction complexe (une cha�ne de fonctions compos�s). Cette fonction complexe de la cha�ne a �t� optimis� pour effectuer des t�ches.

Tout ce que je sais mod�le d'apprentissage profond implique l'optimisation des fonctions complexes. Je pense que c'est le cur de la recherche actuelle.

Cela repr�sente un nombre entier

A chaque niveau, le r�seau de neurones convertit les donn�es en une autre forme, pour le rendre plus facile d'atteindre la t�che. Nous appelons ces donn�es sont converties en � repr�senter � (repr�sentation).

Repr�sente entier (Repr�sentations) (types) correspondent.

informatique entier (type) est un type de donn�es de base, nous voulons dire que certaines donn�es de n bits est int�gr�. De m�me, l'�tude de la profondeur repr�sente (repr�sentation) fait r�f�rence � un moyen d'incorporation des donn�es dans le collecteur dimension n.

Comme les deux fonctions que si elles sont compatibles avec le type d'ensemble de talents en tant que composite, combinaison � deux couches aussi seulement en accord avec leur repr�sentation. Les donn�es dans la mauvaise repr�sentation du r�seau de neurones est d�nu� de sens. Pendant la formation, la couche voisine n�gociera leur repr�sentation � livrer, la performance du r�seau d�pend du r�seau de donn�es dans la repr�sentation souhait�e.

Suivie d'une couche derri�re f f. f f repr�sentation de sortie est entr�e.

Dans une architecture de r�seau de neurones tr�s simple, seule la s�quence lin�aire de couches. Elle repr�sente les besoins de la couche de sortie pour correspondre � la couche suivante repr�sentant l'entr�e.

Mais beaucoup r�seau de neurones a une structure plus complexe. Pour un exemple tr�s simple, imaginons un r�seau de neurones avec une vari�t� d'entr�es similaires, il effectue un certain nombre de t�ches connexes. Il peut avoir besoin d'image RVB et l'image en niveaux de gris en entr�e. Peut-�tre un peuple photos comme entr�e, et ensuite essayer de pr�dire l'�ge et le sexe de l'image humaine. Depuis l'entr�e de type similaire et type de t�che, il est pr�f�rable de remplir toutes ces t�ches dans un mod�le, de sorte que les donn�es de formation peuvent jouer un r�le. En cons�quence, une pluralit� de couche d'entr�e est mis en correspondance � une repr�sentation, et une pluralit� de repr�sentation de sortie par le m�me mappage.

Peut-�tre que ce cas est trop artificiel, mais les diff�rents types de donn�es mis en correspondance avec la m�me repr�sentation pourrait atteindre des r�sultats remarquables. Par exemple, en tra�ant les mots de deux langues dans une repr�sentation, nous pouvons trouver la traduction correspondante du mot, et ces mots ne sont pas connus au d�but. En cartographiant les images et les mots pour exprimer la m�me, on peut classer les images jamais vu une classe d'ordinateur!

Et il repr�sente un nombre entier de l'apprentissage et de la profondeur en fonction de la programmation des blocs de construction de base, respectivement. D�crit la profondeur de l'apprentissage, � savoir, un collecteur (manifold) et repr�sent� (repr�sentation), au centre de laquelle est pli�e dans un r�seau de neurones exprimant une nouvelle repr�sentation de donn�es. Il est connu entre la g�om�trie, la logique, la topologie et des liens de programmation fonctionnelle montre que le lien entre la repr�sentation enti�re et peut avoir une importance fondamentale.

correspondance �tonnante RNN, CNN et d'autres mod�les et fonctions: l'apprentissage profondeur et la programmation fonctionnelle

Un aper�u important derri�re les r�seaux de neurones modernes est que de nombreuses copies d'un neurone peuvent �tre utilis�s dans les r�seaux de neurones.

Dans la programmation, la fonction abstraite est la cl�. Nous pouvons �crire le code une fois et l'utiliser au besoin, ce qui �limine la n�cessit� d'un code r�p�t�. Cela permet non seulement de r�duire consid�rablement la quantit� de code que nous devons �crire et � maintenir et � acc�l�rer le processus de d�veloppement, mais r�duit �galement le risque d'introduire des erreurs et de faire nos erreurs � trouver plus probable.

Dans un r�seau de neurones en utilisant des copies multiples des m�mes neurones dans diff�rents endroits, en fait, l'�quivalent d'appeler une fonction � plusieurs reprises dans le programme. Parce que le contenu est moins � apprendre, mod�le d'apprentissage plus rapide, vous pouvez apprendre � mieux mod�liser. Cette technique est aussi appel�e � poids Bind � (de nouage de poids), il est essentiel que nous avons r�cemment vu de l'�tude approfondie des performances exceptionnelles.

Bien s�r, nous ne pouvons pas simplement mettre une copie des neurones dans tous les sens. Afin de rendre un mod�le utile que vous devez avoir les principes d'utilisation, l'utilisation de certaines donn�es structurelles. Dans la pratique, il existe certains mod�les sont largement utilis�s, tels que la couche cyclique et une couche de convolution.

Le mod�le de r�seau de neurones seulement les fonctions d'ordre sup�rieur, qui est la fonction d'argument. Une situation similaire a �t� largement �tudi� dans la programmation fonctionnelle. En fait, beaucoup de ces mod�les de r�seau correspondent � des fonctions communes, telles que la fonction double. La seule diff�rence est que normalement ils ne sont pas re�us en fonction de l'objet, mais re�oit module de r�seau de neurones.

Cycle codant r�seau neuronal (RNN) est fonction de pliage. RNN est souvent utilis� pour recevoir une liste de longueur variable, comme la phrase d'entr�e.

codant pour la fonction de pliage = RNN

G�n�rer fonction r�seau de neurones r�current est de se d�rouler. R�seau de neurones permettent de g�n�rer RNN utilis� pour g�n�rer une liste de sortie, comme un mot dans une phrase.

g�n�ration de fonctions d�pliage = RNN

RNN fait pour g�n�rer la cartographie cumulative (carte Accumuler). Lorsque nous pr�disons selon l'ordre, souvent les utiliser. Par exemple, dans la reconnaissance vocale, nous pourrions en fonction du contexte du pass�, pr�voir des clips audio chaque ph�nom�ne pas de temps.

cartographie cumulative = RNN

Deux voies RNN Est une variante relativement obscure, je voudrais mentionner ici. Sur le plan de la programmation fonctionnelle, comme ils sont comme une fermeture � glissi�re, deux carte de d�placement accumul� deux c�t�s r�unis, pour le cas o� le pass�, et s�quence de pr�vision de l'avenir.

La liaison accumulation de carte de d�placement autour bidirectionnel = RNN

r�seau neuronal convolutif (CNN) est une application de la variante. fonction de mappage commune est appliqu�e � chaque �l�ment. r�seau neuronal convolutif est �galement concevable d'un �l�ment adjacent, l'application d'une fonction de chaque �l�ment autour d'un widget.

Mapping = convolution couche de fen�tre

Dans le r�seau de neurones convolution � deux dimensions, ce qui est particuli�rement importante.

R�seau convolution � deux dimensions

les r�seaux de neurones r�currents (les � TreeNets �) est une g�n�ralisation fonction de pliage . Ils abaissent le traitement de la structure de donn�es, principalement pour le traitement du langage naturel, de sorte que le r�seau de neurones calcule l'arbre analyse syntaxique.

Catamorphisme = TreeNet

L'exemple ci-dessus illustre le mod�le de r�seau de neurones est commun en fonction naturellement facile correspondant au programme.

Un nouveau programme, la programmation diff�rentiables: programmation fonctionnelle et de l'optimisation d'intersection naturelle

Ces motifs (pattern) peuvent tous �tre combin�s ensemble pour construire un module de r�seau plus grand. Comme les blocs de construction de base, une combinaison de ces proc�dures sont les fonctions, qui contient un grand nombre de r�seaux de neurones. programmes fonctionnels fournissent une structure de haut niveau, et dans lequel la partie flexible est un bloc de construction, d'effectuer les t�ches r�elles peuvent apprendre dans le cadre fourni par la fonction d'application.

Sutskever et al. (2014) par le codeur et le g�n�rateur RNN RNN regroup�s pour effectuer la t�che de traduire l'anglais vers le fran�ais. En termes de programmation fonctionnelle, ils se replient essentiellement phrase en anglais, puis g�n�rer un d�pliage de traduction en fran�ais.

Vinyals et al (2014) avec un r�seau de convolution et ledit g�n�rateur g�n�re RNN Fig. Essentiellement, le syst�me est trait� avec une image d'entr�e du r�seau de convolution, puis vecteur de r�sultat se d�rouler, une description des phrases de g�n�ration d'image.

Ces mod�les sont consid�r�s comme une nouvelle diff�rentiables de programmation fonctionnelle.

Vous �crivez une programmation fonctionnelle tr�s approximative d'un flexible, des modules d'apprentissage, vous d�finissez �galement la proc�dure comportement correct, et lui donner beaucoup de donn�es. Ensuite, vous appliquez une descente de gradient ou d'autres algorithmes d'optimisation. Le r�sultat final est que vous obtenez un syst�me puissant, on ne sait pas comment construire directement le syst�me, mais il peut g�n�rer une carte image de classification.

Ceci est la programmation fonctionnelle et l'optimisation de l'intersection naturelle, je pense qu'il est tr�s beau.

�pilogue

Je pense que cette id�e est vraiment beau. En outre, c'est un article tr�s �trange, publier, je me sens un peu maladroit. En plus de son enthousiasme, je fis sans soutenir une id�e sp�culative. Pour �tre honn�te, bas�e sur un point de vue objectif, je sais, je l'ai mentionn� plus haut, cette id�e est fausse, la plupart des id�es non test�es sont fausses. Mais il peut aussi �tre raison, mais je pense que mentionner la valeur.

De plus, je ne suis pas la bonne personne pour explorer cette direction, ce qui n�cessite le m�me type du point de vue de la th�orie (th�orie du type homotopie) pour analyser le r�seau de neurones, je n'ai pas l'arri�re-plan pertinent. Cependant, cette id�e a besoin de plus en plus largement discut�. Par cons�quent, je dois de publier cet article sur.

Enfin, j'esp�re que cet article inspirera une discussion plus approfondie et � la r�flexion sur l'apprentissage.

D'ailleurs, si je ne peux pas sp�culer, �crire un blog, quelle signification at-il? J'esp�re pouvoir trouver le bon �quilibre entre son enthousiasme et de l'incertitude.

Adresse originale: http: //colah.github.io/posts/2015-09-NN-Types-FP/

Route de la soie

Apprenez � conna�tre la Chine

� �tude approfondie peut �tre programm� pour remplacer le diff�rentiel? � En regardant les r�seaux de neurones et la programmation fonctionnelle apr�s 30 ans

Etude approfondie 30 ans plus tard: vues Neuroscience, avis et caract�risation des probabilit�s et statistiques point de vue, qui gagnerait?

L'optimisation et la composition fonction

Cela repr�sente un nombre entier

correspondance �tonnante RNN, CNN et d'autres mod�les et fonctions: l'apprentissage profondeur et la programmation fonctionnelle

�pilogue