� Perc�e � la consommation de calcul d'apprentissage profond de 95%, la recherche de hachage KDD2017 pour acc�l�rer l'�volution des r�seaux de neurones

Ji-won nouveau rapport

Rice University (Universit� Rice) de informaticien am�ricain de trouver rapidement les donn�es en utilisant largement les technologies utilis�es pour r�duire consid�rablement la quantit� de calcul n�cessaire � l'apprentissage en profondeur, ce qui permet d'�conomiser du temps et de l'�nergie.

informaticiens Rice University ont adopt� l'utilisation g�n�ralis�e de la technologie de donn�es rapide pour r�duire la quantit� de calcul, ce qui r�duit le temps et l'�nergie n�cessaire � l'apprentissage en profondeur, ce qui est une forme puissante d'apprentissage machine informatique.

� Il peut �tre appliqu� � toute architecture d'�tude approfondie et ses comp�tences sont sous-lin�aire �volutivit�, qui est, plus l'utilisation des r�seaux de neurones, sera plus de ressources informatiques d'�conomie d'�nergie, � Rice University Computer Science professeur adjoint, premier auteur de l'�tude Anshumali Shrivastava dit.

�tude para�tra � la r�union KDD 2017, la r�union aura lieu en Ao�t � Halifax la Nouvelle-�cosse. Cette �tude vise � r�pondre � la Google, Facebook et Microsoft, ces brouillage de vouloir construire l'un des plus pressants besoins de la formation et le d�ploiement du r�seau de neurones � grande �chelle de profondeur de g�ants de la technologie. Ils esp�rent utiliser la profondeur de l'apprentissage pour r�pondre � la demande croissante de produits, tels que des v�hicules autonomes, la traduction et e-mail de r�ponse intelligente.

Shrivastava et Rice University �tudiant dipl�m� Ryan printemps prouv� que la technologie � hachage � (Hashage) est une v�ritable m�thode d'indexation des donn�es peut r�duire consid�rablement le co�t de calcul de l'apprentissage en profondeur. � Hash � implique l'utilisation de la fonction de hachage intelligent pour convertir les donn�es en d�cimales g�rables, appel� un hachage. Hash est stock� dans une table qui fonctionne comme juste un index d'un livre papier.

� Notre approche est un hybride de deux technologies: une variable intelligente localit� sensible et hash un clairsem�s afin que nous puissions inverser la propagation de grandes quantit�s sans r�duire la pr�cision, ce qui r�duit la consommation de calculs n�cessaires .Spring dit. � par exemple, dans des essais � petite �chelle, nous avons constat� que dans les m�thodes standard, peut �tre contr�l�e � 1% de la perte de pr�cision, calculer la consommation d'�nergie sera r�duite de 95%. "

Apprentissage en profondeur des blocs de construction de base d'un r�seau de neurones artificiels. Bien que les ann�es 1950, des neurones biologiques ont d'abord �t� d�couvert, cependant, neurone artificiel est seulement fonctions et �quations math�matiques, en fonction de la grande quantit� de donn�es peuvent �tre transform�es en sortie.

Dans l'apprentissage de la machine, tous les neurones sont feuille de papier propre � vide � �tat commence � devenir une technologie sp�cifique (sp�cialis�e) dans le processus de formation. Au cours de la formation, le r�seau est � donn� � beaucoup de donn�es, chaque donn�e d'identification des neurones sont devenus un expert dans un mod�le sp�cifique. Au plus bas niveau, les neurones ex�cutent des t�ches les plus simples. Par exemple, dans les applications photo-identification, les bords inf�rieurs des neurones peuvent reconna�tre des objets claires ou fonc�es. La sortie du neurone est transmis aux neurones dans la couche r�seau, ces neurones fouillaient sa fa�on unique, ils ont reconnu les caract�ristiques.

Seules plusieurs couches du r�seau de neurones peuvent apprendre � reconna�tre des visages humains, toutes sortes de chiens, des panneaux d'arr�t et autobus scolaire.

Shrivastava a dit: � l'ajout de neurones � chaque r�seau peut am�liorer son expression (puissance expressive), et combien nous voulons que ce r�seau n'a pas de limite sup�rieure. �

Selon les rapports, Google tente de former un a 137 milliards de neurones du r�seau. En revanche, la formation et le d�ploiement de ces r�seaux ont besoin de puissance de calcul est limit�e.

Shrivastava a dit que la plupart des algorithmes d'apprentissage machine sont actuellement utilis�s il y a 30-50 ans, d�velopp� dans la conception ne tient pas compte de la complexit� des calculs. Cependant, l'arriv�e des grandes donn�es pour la p�riode de calcul, les ressources �nerg�tiques et de la m�moire pour, il y a une limite fondamentale, et � notre laboratoire ax� sur faire face � ces limites. �

Ledit ressort que, dans la profondeur des r�seaux � grande �chelle, le calcul et l'efficacit� �nerg�tique apportera plus de hachage.

Spring a dit que parce qu'ils utilisent de grandes donn�es sparsity inh�rente, de sorte que les �conomies d'�nergie augmenteront � mesure que la taille du r�seau augmente. � Supposons un r�seau profond a un milliard de neurones, pour une entr�e donn�e - est activ�e seulement quelques neurones - comme une image d'un chien.

En termes de donn�es scientifiques, que l'on appelle la parcimonie (parcimonie), mais pr�cis�ment � cause de la raret� des �conomies d'�nergie sera leur approche avec l'expansion de la taille du r�seau augmente.

� Ainsi, les r�seaux de neurones 1000, nous pouvons �conomiser 95%, bas� sur la d�duction math�matique, un milliard de neurones dans le r�seau, nous pouvons �conomiser 99%. �

Original: https: //phys.org/news/2017-06-scientists-slash-deep.html#jCp

Ryan printemps (� gauche) et Anshumali Shrivastava.

hachage al�atoire �volutive, l'apprentissage en profondeur durable

Le document � est atteint par �volutive de hachage al�atoire, l'apprentissage en profondeur durable � (�volutive et durable apprentissage en profondeur par r�partition al�atoire Hashage), KDD 2017 a �t� re�ue par voie orale.

Bien que cela peut �tre la version r�vis�e par des pairs du document est de pr�senter � l'KDD tenu par des informations en ligne, nous pouvons voir la pr�publication du papier (adresse arXiv � la fin du t�l�chargement Spring: https: //arxiv.org/pdf/1602.08194. pdf).

Ce qui suit est un r�sum� du document.

Afin de se concentrer sur l'apprentissage des donn�es complexes du cadre de l'apprentissage de la profondeur actuelle est de plus en plus. Ces cadres doivent �tre une �norme multiplication de matrice pour former des millions de param�tres. En revanche, une autre a montr� une tendance � la hausse est l'�tude de la profondeur dans les syst�mes embarqu�s de faible puissance. calcul de la matrice de corr�lation afin de former et de tester le r�seau et pour la profondeur et l'angle est calcul�e � partir de la consommation d'�nergie est aspect tr�s co�teux. Nous pr�sentons une nouvelle technique bas�e sur Hashage, r�duit consid�rablement la quantit� de calcul n�cessaire formation et tester le r�seau de neurones. Notre approche combine les deux notion r�cemment propos�, � savoir l'abandon d'adaptation et de recherche interne maximale (MIPS) Al�atoire Hashage, noeud de choix efficace dans le r�seau avec le plus actif.

Cette nouvelle profondeur dans l'algorithme d'apprentissage (le nombre de sensiblement moins) noeuds creuses en cours d'ex�cution, avant la r�duction du co�t total du calcul de l'�tape de propagation et apr�s. Par cons�quent, notre algorithme, tout en maintenant une moyenne de 1% de la pr�cision du mod�le d'origine, en utilisant seulement 5% de la multiplication totale.

Hachant l'algorithme de r�tropropagation la base des documents pr�sent�s, une mise � jour d'attribut unique est toujours rare. Et parce que la mise � jour de gradient clairsem�e, notre algorithme est tr�s appropri� pour parall�le h�t�rog�ne et la formation. Gr�ce � l'�valuation exp�rimentale rigoureuse sur plusieurs jeux de donn�es r�elles, nous montrons que l'algorithme propos� a l'�volutivit� et la durabilit� (haute efficacit� �nerg�tique).

ANN hachage al�atoire de visualisation

Figure 1: vu le nombre de param�tres du r�seau de neurones est suppos� bas rang n�cessite naturellement moins de la figure.

Figure 2: le r�seau de neurones hachage al�atoire de visualisation. construire une table de hachage, le proc�d� est appropri� pour chaque couche cach�e (premi�re it�ration) hachage de r�tablissement. utiliser cette couche fonction de hachage al�atoire Hash faire la couche d'entr�e. Cette couche de table de hachage de requ�te, obtenir les ensembles de donn�es d'activation AS. seulement faire propager vers l'avant et vers l'arri�re sur les neurones actifs. AS poids et mettre � jour la table de hachage.

56 performances du processeur central Intel Xeon ES-2697 Comparaison

Figure 7 Un r�seau en utilisant notre m�thode standard (de hachage al�atoire) et des isom�res � l'aide de algorithme du gradient stochastique, le noyau 56 sur la performance comparative processeur Intel Xeon ES-2697. Nous, � son tour ont �t� test�s sur MNIST, noRb, Convex et ensembles de donn�es Rectangles. Les valeurs initiales de tous les r�seaux sont cr��s �gaux.

Figure 8 : New Method (LSH-5%) avec le temps d'horloge de paroi h�t�rog�ne algorithme du gradient stochastique par �tape (par �poque) obtenu. Nous avons un r�seau avec une couche cach�e de trois couches, � son tour, test� sur MNIST, noRb, Convex et ensembles de donn�es Rectangles. Sur Rectangles Convex et moins des ensembles de donn�es suppl�mentaires, parce que pas assez est disponible dans tout le cours d'�chantillons de formation. exp�rience standard seulement 5% de la quantit� de calcul de r�seau.

En savoir plus, voir la pr�publication papier (adresse: https: //arxiv.org/pdf/1602.08194.pdf)

Route de la soie

Apprenez � conna�tre la Chine

� Perc�e � la consommation de calcul d'apprentissage profond de 95%, la recherche de hachage KDD2017 pour acc�l�rer l'�volution des r�seaux de neurones