Auteur: Pen

[New Ji-won EXAMEN Aujourd'hui, le site officiel a annonc� IPSC le meilleur article IPSC 2018, un total de trois. Ces documents continuent � discuter apr�s avoir �t� la r�ception de l'IPSC, y compris la nouvelle variante propos�e de l'algorithme Adam, traitent de la question de l'image sph�rique de CNN, le cadre d'apprentissage pour apprendre l'adaptation continue et ainsi de suite. Ce document apporte une interpr�tation d�taill�e.

[R�pondre] IPSC meilleur papier Ji-won nouvelle page de dialogue micro-canal, t�l�charger 3 ICLR 2018 meilleur papier.

Discussion sur la convergence de l'algorithme et sa m�thode am�lior�e d'Adam

Une m�thode d'optimisation stochastique r�cemment propos�e a �t� appliqu�e avec succ�s aux t�ches de formation du r�seau de neurones, comme RMSPROP, ADAM, ADADELTA, NADAM et ainsi de suite. Ces m�thodes sont bas�es sur une mise � jour de l'algorithme de gradient, lors d'une mise � jour, l'utilisation de la moyenne mobile exponentielle de la racine carr�e de la place du gradient de l'histoire du zoom. Selon l'observation que dans de nombreuses applications, telles que l'espace de sortie est relativement large, ces algorithmes ne peuvent pas converger vers la solution optimale, ou un point critique dans les probl�mes non convexes. Il est prouv� que la cause de l'�chec de la convergence est que l'algorithme utilise des moyennes mobiles exponentielles. Cet article a cit� un exemple simple de prouver que m�me un simple probl�me d'optimisation convexe, Adam ne peut converger vers la solution optimale, et d�crit les principaux probl�mes dans le pass�, l'analyse Adam des algorithmes existent dans le texte. L'analyse montre En combinant ces algorithmes et gradient historique de � la m�moire � long terme �, il peut r�soudre les probl�mes de convergence, et une nouvelle variante de l'algorithme Adam ne peut pas seulement r�soudre le probl�me des bracelets, des performances de l'exp�rience peuvent ligne de laminage.

La contribution de cette �tude:

Par un simple probl�me d'optimisation convexe PR�SENT�ES et Adam utilis� TMSprop D�m�nagement exponentielle Comment est la t�te moyenne � la convergence. Et l'analyse de texte peut �tre �tendu � la m�thode que Adadelta et NADAM une autre mobile exponentielle jeu moyen.

Afin d'assurer la convergence de l'algorithme, tel qu'il est utilis� ici gradient historique de la � m�moire � long terme. � A propos de Adam et a soulign� la convergence de la preuve de l'existence dans le pass�, le papier et Kingma probl�me Ba (2015). Pour r�soudre ce probl�me, cet article propose une variante de l'algorithme Adam, l'algorithme dans le cas de l'histoire gradient de � la m�moire � long terme �, et n'a pas augment� la complexit� temporelle de l'algorithme et de la complexit� de l'espace. De plus, l'analyse est �galement donn� algorithme la convergence d'Adam Kingma et Ba (2015).

Les exp�riences montrent que l'algorithme fournit une variante d'Adam, les r�sultats montrent, Dans certains des probl�mes communs en mati�re d'apprentissage de la machine, variante de la performance de cet algorithme est similaire ou mieux que l'algorithme original.

Les r�sultats:

Comme repr�sent� sur la. Figure 1, dans un simple probl�me de convexe � une dimension, Adam et comparer la performance de AdamSRAD, inspir�e de la non-convergence. La figure deux r�glage de premi�re ligne pour le dernier est r�gl� pour al�atoire.

Figure 1

, Dans la r�gression logistique, la comparaison des performances Adam pr�compensation r�seau de neurones et AMSGRAD CIFARNET et 2 sur la figure. La rang�e sup�rieure montre la ADAM et AMSGRAD dans la r�gression logistique (panneau avant deux) et les performances des r�seaux de neurones feedforward (droit) = 1 dans la couche cach�e. Dans la rang�e du bas, les deux chiffres compare la formation Adam et arabes AMSGRAD et d'essais, et sur la base CIFARNET ont �t� compar�s.

Figure 2

r�seau de neurones � convolution sph�rique (Spherical CNNs)

r�seau de neurones convolutionnel (CNN) peut �tre une bonne affaire d'images en deux dimensions. Cependant, l'image sph�rique traitement demande croissante. Par exemple, les v�hicules a�riens sans pilote, des robots, des v�hicules autonomes, r�gression mol�culaire, des mod�les m�t�orologiques et climatiques mondiaux, la gamme compl�te des probl�mes de traitement visuel. Le plan de projection sph�rique tel qu'une entr�e de signal d'approche na�ve convolutif r�seau de neurones est vou�e � l'�chec, comme repr�sent� sur la Fig. 1, la distorsion spatiale caus�e par une telle projection conduit � CNN poids ne peut pas �tre partag�e.

Figure 1

Cet article d�crit comment construire des modules sph�riques CNN. Nous avons propos� l'op�ration par Fourier g�n�ralis�e (FFT) groupe de convolution rapide (corr�lation crois�e) de. CNN sch�matique sph�rique �tre r�alis�e par une transform�e de Fourier de la mani�re suivante:

Les r�sultats:

mod�le de formation officiel utilis� ici des indicateurs pour �valuer les propositions et par rapport aux trois pr�c�dents meilleurs mod�les de chaque cat�gorie, et les r�sultats sont pr�sent�s dans le tableau 1. En plus de pr�cision et F1 @ N, il est class� troisi�me mod�le propos�, il est dans une position de leader sur chacun des autres indicateurs. Le principal concurrent, Tatsuma_ReBGG et Furuya_DLAN utilisation des fonctionnalit�s et l'architecture de r�seau con�u sp�cifiquement pour t�che SHREC17. Compte tenu du mod�le d'architecture d'entr�e et lossy le mod�le de t�che propos�e dans cet article utilis� agnostique, a d�clar� la performance de mod�le peut �tre interpr�t� comme un fort soutien empirique pour l'efficacit� de la sph�re CNN.

Tableau 1

2. RMSE comme un indicateur, la m�thode propos�e par rapport � d'autres m�thodes, comme le montre le tableau 2. Comme on peut le voir dans le tableau, l'algorithme propos� est sup�rieur � toutes les m�thodes � base de noyau et de l'algorithme de formation MLP dans la matrice sur le Coulomb de tri. Seul MLP peut �tre bas�e sur la formation de Coulomb matrice al�atoire pour obtenir de meilleurs r�sultats. Cependant, l'�chantillon complet de dispos�es de fa�on al�atoire que N cro�t de fa�on exponentielle, de sorte que cette m�thode est peu susceptible d'�tre �tendue sur une grande donn�es.

Tableau 2

conclusion

Cet article d�crit la CNN sph�rique, et l'�valuation de l'algorithme propos� sur deux probl�mes d'apprentissage importants. En outre, le document d�finit S2 et SO (3) de corr�lation crois�e, et l'analyse de leurs propri�t�s, de mani�re � r�aliser un algorithme de corr�lation g�n�rique RRT. Les r�sultats des exp�riences num�riques ont confirm� la stabilit� et la pr�cision de l'algorithme est toujours valable m�me dans la profondeur du r�seau. De plus, nous avons d�montr� sans la n�cessit� d'exigences sup�rieures �lev�es sur les caract�ristiques et les cas de transfert de mod�le, CNN sph�rique peut �tre efficacement �tendu � toute la rotation, et se rapprocher de la plus avanc�e identification du mod�le en trois dimensions et aspects mol�culaires de rendement �nerg�tique r�sultats.

Semblable identification du mod�le 3D tels des t�ches en trois dimensions, nous pensons que peut �tre �tendu � roto groupe SO3 traduction SE3 pour obtenir de nouvelles am�liorations. Le d�veloppement de CNN est sph�rique une premi�re �tape importante dans cette direction. Peut-�tre, ce sc�nario d'application importants sph�riques CNN pour faire face � toute la gamme des probl�mes de vision. Bien que dans les bases de donn�es publiques, les donn�es d'image omnidirectionnelle est tr�s faible, mais Dans les drones, des robots et des v�hicules autonomes, la popularit� de la gamme compl�te du capteur pour faire ce travail rev�t une importance particuli�re.

Une adaptation continue par l'apprentissage de yuans dans un environnement fixe et non comp�titif

Capacit� d'apprendre et d'adapter � l'exp�rience limit�e dans des environnements non stationnaires est une �tape importante menant � une v�ritable ordinateur intelligence artificielle. Cet article pr�sente Une adaptation continue � apprendre � apprendre � cadre . En concevant un �l�ment d'algorithme d'apprentissage bas� gradient � adapter aux changements dynamiques et sc�nario contradictoire. En outre, le document a �galement con�u l'environnement concurrentiel bas� sur multi-agents (multi-agents) de: RoboSumo et d�finit la capacit� d'adaptation d'it�rations jeu pour une performance soutenue � adapter aux diff�rents aspects du syst�me de test. Les exp�riences montrent qu'un yuan plus fort que l'�tude de base de la capacit� d'adaptation de la r�action en �tat quelques-shot et adapt� pour r�aliser l'apprentissage et de la concurrence multi-agents.

Trois mod�les utilis�s dans les exp�riences que l'agent (agent), la figure 1. (A) FIG. Ils diff�rent anatomiquement: nombre de jambes, la position, et les restrictions � la cuisse et au genou. La figure 1 (b) indique un environnement de mouvement non stationnaire. Le couple appliqu� � la jambe par une couleur rouge changement dynamique Le facteur d�cisif. (C) est utilis� pour indiquer l'environnement concurrentiel RoboSumo.

Figure 1

Les r�sultats:

La figure suivante montre un processus it�ratif contiennent plus de tours pour adapter au jeu, un agent avec ses rivaux. Si elle gagne plus de manches dans un tour (utilisez la couleur pour indiquer la victoire ou la d�faite), il a gagn� une victoire. agent et leurs adversaires peuvent changer leur tactique en permanence.

Figure 2

2. Dans l'it�ration du jeu, le nombre de tours et les r�sultats pr�sent�s dans le. La figure 3 pour �tudier l'adversaire peut �tre vu sur la figure, lorsque le nombre d'it�rations de chacun plus de 50 fois par l'adaptation de la technologie � la piste devient le probl�me de � l'apprentissage tout en testant �, en plus, il peut rivaliser avec une formation quand les adversaires ont jamais vu auparavant. Dans les quelques coups et un deux syst�mes d'apprentissage standard sont presque identiques yuans apprendre les r�sultats des strat�gies d'adaptation. Ceci sugg�re que les strat�gies de m�ta-apprentissage en formation peuvent apprendre un type particulier de biais, pour lui permettre d'obtenir de meilleurs r�sultats d'une exp�rience limit�e, mais elle limite aussi la possibilit� d'utiliser plus de donn�es.

�Figure 3

[] Joignez-vous � la communaut�

Ji-won nouvelles technologies AI + industrie du recrutement communautaire, a accueilli les �tudiants + industrie de la technologie AI a atterri int�r�t, plus Little Helper Micro Signal: aiera2015_1 dans le groupe, si elle est approuv�e seront invit�s dans le groupe, assurez-vous de modifier le groupe apr�s avoir rejoint la communaut� remarques (nom - soci�t� - emploi, groupe professionnel d'examen plus rigoureux, s'il vous pla�t comprendre).

Route de la soie

Apprenez � conna�tre la Chine

IPSC 2018 Meilleur papier �pais cuit! nouvel algorithme Adam, CNN sph�rique et autres int�r�ts

Discussion sur la convergence de l'algorithme et sa m�thode am�lior�e d'Adam

r�seau de neurones � convolution sph�rique (Spherical CNNs)

Une adaptation continue par l'apprentissage de yuans dans un environnement fixe et non comp�titif