Google chef d'uvre: automatique am�lior�e r�tropropagation algorithme, la vitesse du train, puis mettre � jour!

Ji-won nouveau rapport

Source: Google AI

Editeur: Xiao Qin, trois pierres

[Introduction de nouveaux Zhi Yuan ] Grand Dieu Geffery Hinton est l'inventeur de l'algorithme de propagation inverse, mais il a �galement exprim� des doutes sur le dos de propagation, je pense que la propagation de retour est clairement pas la fa�on dont le cerveau fonctionne, afin de promouvoir le progr�s technologique, il doit y avoir une nouvelle m�thode a �t� invent�e. Google plus que les chercheurs du cerveau ont pr�sent� aujourd'hui les derniers articles publi�s Backprop Evolution, nous proposons une m�thode de d�couverte automatique inverser la propagation de nouvelles variantes de l'�quation, qui a trouv� une nouvelle �quation, la formation plus rapide que l'arri�re-standard propagation temps de formation est plus courte.

Documents Adresse:

https://arxiv.org/pdf/1808.02822.pdf

algorithme de r�tropropagation propos� par le dieu Geoffrey Hinton est la pierre angulaire de la profondeur de l'apprentissage.

En 1986, Geoffrey Hinton et co-auteur d'un document: les repr�sentations d'apprentissage par les erreurs de r�tropropagation, apr�s 30 ans, l'algorithme de r�tropropagation est devenu le cur de cette vague d'explosion de l'intelligence artificielle.

Mais l'ann�e derni�re, Hinton a d�clar� dans une interview qu'il propagation algorithme pour inverser " Des doutes s�rieux � Cela devrait Compl�tement abandonn� r�tropropagation, tout recommencer . Hinton estime que le mode inverse de la transmission ne fonctionne cerveau, nous ne devons �videmment pas le cerveau pour marquer toutes les donn�es. Afin de promouvoir les progr�s, il doit y avoir une nouvelle m�thode a �t� invent�e.

Bien que Hinton, ainsi que de nombreux chercheurs doivent encore pr�senter de nouvelles, il peut remplacer la m�thode de propagation, mais r�cemment, l'apprentissage de la machine recherche automatiquement moyen d'obtenir beaucoup de succ�s, variantes de l'algorithme r�tropropagation Il a �galement �t� de plus en plus de recherches.

Universit� technique de Berlin, plus que les chercheurs de Google cerveau articles r�cemment publi�s �Evolution Backprop est propos� d�couverte automatique de nouvelles variantes �quation r�tropropagation M�thode. Les chercheurs ont utilis� un langage sp�cifique, de domaine sera mis � jour la liste originale des �quations d�crivant la fonction.

Plus pr�cis�ment, les chercheurs ont utilis� une m�thode bas�e sur l'�volution de d�couvrir de nouvelles r�gles de communication qui peuvent optimiser leurs performances apr�s quelques g�n�ralisation de la formation d'�poque. Ils ont trouv� des nouvelles �quations, leur la formation plus rapide, le temps de formation est plus courte que la propagation standard arri�re, et de m�me lorsque les crit�res de convergence r�tropropagation .

g�n�rer automatiquement des �quations de r�tro-propagation

algorithme de r�tropropagation est l'un des plus importants algorithmes d'apprentissage automatique. Il a �t� mis sur l'�quation r�tropropagation variantes fait une tentative, et atteint un certain degr� de succ�s (par exemple, Bengio et al (1994) ;. Lillicrap et al (2014) ;. Lee et al (2015) ;. N�kland (2016); Liao et al (2016)) .. Mais en d�pit de ces tentatives, les changements d'�quations r�tropropagation et n'ont pas �t� largement utilis�s en raison de ces changements il y a peu d'am�lioration dans l'application pratique, et parfois m�me causer des dommages.

Affect� par la r�cente apprentissage automatique pour rechercher automatiquement des m�thodes inspir�es par le succ�s obtenu, nous vous proposons un g�n�rer automatiquement des �quations de r�tro-propagation M�thode.

A cet effet, nous proposons une Langues sp�cifiques au domaine (Langue sp�cifique du domaine), une formule math�matique pour d�crire ces fonctions � la liste initiale, et bas�e sur l'utilisation de �volution (Bas�e-Evolution) fa�on de d�couvrir de nouvelles r�gles de communication. Apr�s la formation de plusieurs �poque, la condition de recherche est de maximiser la g�n�ralisation. Nous avons trouv� la norme r�tropropagation et l'effet est �galement plusieurs variantes de l'�quation. De plus, dans un temps de formation relativement courte, ces types de variations peuvent am�liorer la pr�cision. Cela peut �tre utilis� pour am�liorer l'algorithme Hyperbande comme prendre des d�cisions fond�es sur la pr�cision du processus de formation.

R�tropropagation

Figure 1: le r�seau de neurones peut �tre vu comme une certaine figure de calcul. La figure d�finir l'avant (vers l'avant du graphique) de concepteurs de r�seaux, et l'algorithme de propagation inverse d�finit implicitement un calcul figure param�tre de mise � jour. La principale contribution de cette �tude est d'explorer comment utiliser l'�volution pour trouver un r�tropropagation plus efficace que la mise � jour de carte de calcul de param�tres standard.

Parmi eux,

L'entr�e du r�seau, sur l'indice de la couche,

Il est le poids de la matrice de poids de la couche. Afin d'optimiser le r�seau de neurones, nous devons calculer les pertes

Les d�riv�es partielles, qui, avec la matrice de pond�ration

Connexes. algorithme de propagation arri�re en utilisant la r�gle de la cha�ne cette quantit� peut �tre calcul�e. Pour calculer l'activation cach�e

d�riv�e partielle, � appliquer une s�rie d'op�rations:

Une fois calcul�, vous pouvez mettre � jour le poids est calcul� comme:

1, le r�seau de neurones peut �tre exprim�e comme sur la Fig. Vers l'avant et vers l'arri�re calcul sur la Fig. . �tant donn� une carte de calcul avant d�fini par le concepteur du r�seau, l'algorithme de r�tropropagation d�finit un calcul inverse pour la mise � jour des param�tres de la figure. Cependant, il est possible de trouver une carte de calcul inverse am�lior�, entra�nant une meilleure g�n�ralisation.

R�cemment, m�thode de recherche automatique pour l'apprentissage machine d�j� obtenu de bons r�sultats dans une vari�t� de t�ches, ces m�thodes impliquent la carte de calcul, en se fondant sur le dos de propagation pour d�finir le point de vue inverse appropri�e avant modification. En revanche, dans ce travail, notre souci est de modifier le tableau de calcul inverse et utiliser la recherche pour trouver une meilleure m�thode d'�quations, une nouvelle r�gles de formation.

m�thode

Afin de trouver des moyens d'am�liorer les r�gles de mise � jour, nous utilisons des algorithmes �volutifs pour rechercher l'espace de l'�quation de renouvellement possible (mise � jour �quation) est. Dans chaque it�ration, le nombre de mutations dans l'�quation de mise � jour du contr�leur �volutive envoy�e pour �valuer le bassin de travailleurs. Chaque travailleur en utilisant l'�quation de la variation de la r�ception de former le r�seau de neurones � une structure fixe, et de v�rifier l'exactitude du rapport obtenu au contr�leur.

L'espace de recherche

Inspir� par Bello et al. (2017), nous utilisons le langage sp�cifique � un domaine (langage sp�cifique au domaine, DSL) pour le calcul de l'�quation d�crite. Chaque �quation est repr�sent�e par DSL

qui

Il est possible que le nombre d'op�rations,

Sont des fonctions d'une variable,

Il est une fonction binaire. Collection de fonctions d'appartenance et de la fonction binaire est sp�cifi�e manuellement, mais chaque fonction de s�lection d'op�rande et s�lectionn�e par le contr�leur. Des exemples de chaque composant sont les suivantes:

Op�rande (op�randes): W (poids de la matrice de poids actuel de la couche),

(Matrice de Gauss),

(De

Pour gaussienne de la cartographie matrice al�atoire),

(Hidden activer la propagation vers l'avant),

(Inverse de propagation).

Fonctions d'une variable

fonction binaire

Dans lequel, l'indice de la couche en cours. Voir l'ensemble complet d'exp�riences en utilisant du papier Annexe A.

Les r�sultats obtenus quantit�

Dans l'�quation 1 est utilis�e en tant que, ou utilis�es de mani�re r�cursive plus tard dans l'�quation

. Dans l'exp�rience, nous avons explor� l'�quation par son fonctionnement binaire 1-3. Ce DSL est simple, mais l'�quation peut repr�senter un complexe, comme un r�tropropagation standard, alignement de r�troaction, ainsi que l'alignement de r�troaction directe.

Les algorithmes �volutionnaires

�volution contr�leur (Contr�leur Evolutionary) pour maintenir un ensemble d'�quations ont �t� trouv�s. Dans chaque it�ration, les pr�formes de contr�leur un des �l�ments suivants: 1) la probabilit� p de l'affaire, le contr�leur de comp�titivit� optimal de N trouv�s lors de la recherche dans une �quation de s�lection al�atoire, 2) la probabilit� 1-- lorsque p, le dispositif de commande s�lectionne de fa�on al�atoire un de l'autre �quation de la population d'�quation.

Le dispositif de commande alors k mutations (mutation) � une �quation s�lectionn�e, o� k est extrait de la distribution de la classification. Ces mutations k chacune des s�lectionnant simplement un des composants de l'�quation al�atoire uniforme (par exemple, un op�rande, une fonction unaire, ou une fonction binaire), puis les autres composants similaires qui change de mani�re al�atoire. Certaines mutations peuvent conduire � l'�quation math�matique possible, dans ce cas, le contr�leur red�marre le processus de mutation jusqu'� ce qu'il r�ussisse. N, le classement et la distribution p k est l'algorithme ultra-param�tre.

Pour cr�er la population initiale, nous �chantillon al�atoire simple de N �quations de l'espace de recherche. En outre, dans certaines de nos exp�riences, on part d'une petite partie de l'�quation pr�d�finie (g�n�ralement normale ou une variante de l'�quation de propagation inverse r�troaction �quation align�s). A partir de la capacit� existante de l'�quation d'�volution est bas�e sur la m�thode d'apprentissage par renforcement a l'avantage.

Exp�riences et r�sultats

Dans cette m�thode, pour L'�valuation de la s�lection de chaque nouveau mod�le de l'�quation Il est un cadre important. r�seau plus large et plus profond serait plus r�aliste, mais il faut plus de temps pour le train, alors que la formation du plus petit mod�le plus rapide, mais ne peut pas conduire � mettre � jour la promotion du r�seau. Nous avons �quilibr� � l'aide de larges ResNets (WRN), ces deux normes, la couche de WRN 16, la largeur du multiplicateur de 2, et centr�es sur les donn�es d'apprentissage ICRA-10.

Recherche de base et la g�n�ralisation

Dans la premi�re recherche, le contr�leur propose une nouvelle WRN de formation du r�seau d'�quations 16-2 �poque 20, et il y a dans le cas avec ou sans formation dynamique de SGD. La nouvelle �quation 100 pour v�rifier l'exactitude avant la collecte, puis test� selon diff�rents sc�narios:

(A1) en utilisant la formation 20 WRN �poque 16-2, la copie des param�tres de recherche;

(A2) en utilisant une formation 20 �poque WRN 28-10, il sera �tendu � un plus grand mod�le (param�tre WRN 28- 10 est WRN 10 fois 16-2);

(A3) � l'aide WRN de formation 100 �poque 16-2, essai �tendu � un m�canisme de formation plus longue.

Les r�sultats sont pr�sent�s dans le tableau 1:

Tableau 1: R�sultats exp�rimentaux

De A1 � A3, pr�sente deux �quations meilleures performances dans chaque r�glage, ainsi que deux dans tous les milieux ont montr� une bonne �quation. 4 montre la personnalit� meilleure B1 �quation, tous les r�sultats sont plus de cinq fois la pr�cision de test moyenne. La ligne de base est la r�tro-propagation de gradient. Mieux que 0,1% des r�sultats de performance de base sont indiqu�s en gras. nous utilisons

spectacle

Augmenter le nombre de formation de recherche

Avant la recherche a �t� trouv� au d�but de la formation nouvelle �quation fonctionne bien, mais pas mieux que dans la convergence de r�tropropagation. Ce dernier r�sultat pourrait �tre d� � un d�calage entre la recherche et le m�canisme d'essai, parce que la recherche en utilisant l'�poque 20 � former sous-mod�le, et le m�canisme de test utilise �poque 100.

Un programme de suivi correspondent � ces deux m�canismes. Dans la deuxi�me exp�rience de recherche, 100 chaque �poque la formation sous-mod�le. Pour compenser l'utilisation d'�poque plus de formation r�sultant de l'augmentation des temps d'exp�rimentation, l'utilisation de petits r�seaux (WRN 10-1) comme mod�le d'enfant. Utiliser un mod�le plus petit est acceptable, parce que la nouvelle �quation tend � �tre �tendu � un plus grand, des mod�les plus r�alistes tels que (A2).

Les r�sultats du tableau 1 (B1) et (A3) est similaire � celui obtenu de meilleurs r�sultats se trouvent sur la r�gle de mise � jour de SGD, mais les r�sultats ont l'�lan et la ligne de base tout � fait SGD. (A3) et (B1) montrent la similitude des r�sultats, la principale source d'erreurs de diff�rence de temps de formation ne peut pas �tre. En outre, SGD a pour l'�quation dynamique nouvelle et diff�rente est presque constante.

r�sum�

Dans ce travail, nous proposons une �quation de substitution peut trouver automatiquement la m�thode de propagation standard arri�re. L'utilisation d'un contr�leur �volutif (travail �quations composante spatiale), et d'essayer de maximiser le r�seau de formation de g�n�ralisation. les r�sultats pr�liminaires donnent � penser que pour une sc�ne particuli�re, il y a une �quation de performance de g�n�ralisation mieux que la ligne de base, mais pour trouver une meilleure performance dans les �quations sc�ne g�n�rale doivent faire plus de travail.

New Ji-won AI MONDE 2018 Assembl�e de billets Early Bird []

En solde!

New Ji-won aura lieu le 20 Septembre AI Conf�rence mondiale des 2018 � Beijing National Convention Center, a invit� l'apprentissage machine parrain, en mettant l'accent sur le professeur de l'intelligence artificielle � la CMU Tom Mitchell, Maike Mark Si-Tiger, Zhou Zhihua, un grand Cheng Tao, Chen Yiran AI et d'autres dirigeants et le destin de l'humanit�.

Le site officiel de l'Assembl�e g�n�rale:

Maintenant jusqu'au 19 Ao�t, Ji-won nouveau num�ro d'�dition limit�e de billets Early Bird communication �troite avec le leader mondial de l'IA, l'intelligence artificielle, t�moin de l'industrie mondiale � pas de g�ant.

Billets de ligne active lien:
billet de ligne active de code � deux dimensions:

Route de la soie

Apprenez � conna�tre la Chine

Google chef d'uvre: automatique am�lior�e r�tropropagation algorithme, la vitesse du train, puis mettre � jour!