Sec | Mise au point � de compression de l'information �, IBM joindre les mains MIT R�interpr�tation de la th�orie � goulot d'�tranglement d'information �

Venez avec des moyens efficaces pour �valuer l'information mutuelle et la mise en place du cluster � compression de l'information. �

AI Technology Review par: Affecter le d�veloppement de l'apprentissage en profondeur pour apporter l'intelligence artificielle de peut �tre d�crit comme r�volutionnaire, mais le champ est encore il y a beaucoup de questions en suspens, y compris des questions telles que la non-explication. L'informaticien � goulot d'�tranglement d'information � � l'Universit� h�bra�que et un neurologue Naftali Tishby, qui a propos� la th�orie, essayez de r�soudre une s�rie de probl�mes de r�seaux de neurones, car il a �t� soulev� l'inqui�tude largement r�pandue dans les milieux d'Amnesty International. Par ailleurs, effectuer des recherches pour analyser cette th�orie, afin de pouvoir r�soudre certains probl�mes dans le r�seau de neurones, les r�sultats pertinents publi�s dans l'Institut IBM blog site officiel, AI Technology Review compil� comme suit IBM Research.

Alors que le nombre croissant de travaux de recherche pour la th�orie des r�seaux de neurones, mais nous devons apprendre la profondeur de la compr�hension du comportement macroscopique il y a encore beaucoup de lacunes. Par exemple, la repr�sentation interne de l'�volution est tir�e par les facteurs qui pendant la formation, l'apprentissage comment caract�riser les propri�t�s et enti�rement former le r�seau de neurones pour faire face � la pr�sence d'informations et d'autres questions, il n'a pas �t� r�solu. De plus, notre compr�hension du r�seau de neurones La plupart proviennent de la sp�culation et le manque de preuves.

th�orie � goulot d'�tranglement d'information � tentatives pour r�soudre ces probl�mes. Comme MIT- IBM Watson AI Lab r�sultats des deux c�t�s une coop�ration �troite, nous (ICML) Actes 2019 Conf�rence internationale de l'apprentissage machine � �valuation approfondie du flux d'information de r�seau de neurones � (Estimating flux d'information Deep Neural Networks) et de math�matiques exp�rience point de vue de la th�orie � goulot d'�tranglement information � est analys�e, ce qui est particuli�rement concentr� ses pr�visions de ph�nom�ne � de compression de l'information �.

th�orie du � goulot d'�tranglement d'information �

th�orie du � goulot d'�tranglement de l'information � (Schwartz-Ziv et Tishby 2017 articles publi�s, etc., voir r�f�rence) ont tent� d'expliquer les probl�mes li�s � la compression de l'information de g�n�ralisation du r�seau de neurones, le concept fait r�f�rence � l'�tude du codage d'entr�e du r�seau de neurones, l'entr�e et les couches cach�es X lorsque l'information mutuelle entre T (Fig. 1) une augmentation rapide du processus de formation, apr�s la t�che d'apprentissage non associ� informations non pertinentes est �cart�e (fig. 2) dans le r�seau neuronal, l'information mutuelle diminue lentement (compression). Chaque couche successive est consid�r� en entr�e de compression constant. La preuve d�finitive que cette sortie de l'information non pertinente, vous pouvez faire le classificateur effet de g�n�ralisation mieux, car dans ce cas, quand a �t� donn� une nouvelle entr�e avait jamais vu auparavant, le r�seau de neurones pour extraire uniquement les informations pertinentes sans �tre trompeur des informations non pertinentes.

Figure 1: Profondeur des r�seaux de neurones � action directe (hypoth�tique)

Figure 2: Informations Bottleneck. La figure montre la trajectoire au cours de formation de cinq couche cach�e information mutuelle

Bien que ce soit une vision un peu plus attrayant, mais malheureusement, lorsque le r�seau est d�terministe, lorsque l'information mutuelle entre les couches d'entr�e et cach� T X ne d�pend pas de param�tres r�seau (Dans la pratique, presque tous les r�seaux de neurones sont d�terministes). Pour r�soudre ce probl�me, le traitement pr�c�dent travail de binning (quantification) et l'information mutuelle est calcul� (pour �tre mis en cellule couche cach�e de l'entropie discr�te) par chaque neurone, nous arrivons � l'information de valeur estim�e mutuelle. La figure 3 montre la forte corr�lation avec la taille du bac calcul�, confirmant ainsi qu'il est pas sur l'information mutuelle calcul�e.

Figure 3: la discontinuit� bin estim�e

le bruit et l'�valuation de l'information mutuelle Neural Network

Lorsque le r�seau est d�terministe, lorsque l'information de l'information non r�ciproque, et lorsque le r�seau est al�atoire lorsque l'information mutuelle d'information riche. On d�finit donc le r�seau de neurones bruit de Z (fig. 4) est form�e en ajoutant un bruit gaussien � la sortie de chaque neurone. Ce bruit est pr�sent � la fois les r�seaux de neurones de formation et d'essai, de sorte que les informations relatives � l'�valuation mutuelle de sens. Dans ce cas, nous vous proposons un moyen efficace d'�valuation de l'information mutuelle, il peut acc�l�rer converge vers l'information mutuelle minimax optimale est authentique (ne d�pend pas du bac).

Figure 4: Bruit r�seau de neurones

La grappe en tant que facteur de compression d'entra�nement

Notre papier par la transmission d'informations sur une classification unique des neurones et le canal du bruit li� capable de d�velopper une intuition math�matique que la compression de l'information (strictement observ�e dans les r�seaux al�atoires ou l'utilisation binning pour estimer l'incertitude dans le r�seau) devrait normalement �tre le regroupement est caus�e par la repr�sentation interne. Plus pr�cis�ment, que, dans le T de caract�risation cach�, l'application du m�me type Y diff�rent entr�e X de couches cach�es plus proches les uns des autres.

�valuer l'exp�rience de ce sujet, consultez Schwartz-Ziv, les donn�es et les mod�les Tishby propos� dans son document 2017, le mod�le en utilisant une fonction tangente hyperbolique (tanh) pour activer enti�rement connect� 12-10-7- 5-5-4-3-2 architecture de la classification binaire d'entr�e 12 dimensions. La figure 5 montre les r�sultats de l'�cart type du bruit additif 0,005 (pr�cision de 97% du test), ce qui indique l'information mutuelle estim�e pour chaque p�riode de formation, la relation entre la perte de formation / d'essai et de l'�volution de repr�sentation interne. information mutuelle mont�e et la chute correspondante de la caract�risation de chaque couche �tendue ou le degr� de polym�risation. Par exemple, quand une courbe de Gauss commence � d�vier de l'autre le long d'une (voir partie sup�rieure de la premi�re couche cach�e 5 diagramme de dispersion caract�ris�), avant 28 l'�poque, l'information mutuelle a eu une tendance croissante, � environ 80 �poque, ils commencent � la polym�risation, l'information mutuelle diminue. Comme la formation progresse, la saturation de l'unit� de tangente hyperbolique pouss� dans le coin oppos� d'une fonction gaussienne du cube, ce qui r�duit en outre l'information mutuelle.

Figure 5: le processus de formation I (X; Y) compression. La rang�e sup�rieure montre le diagramme de dispersion finale �poques caract�ris� couche cach�e s�lectionn�es en fonction de l'�tiquette � code couleur pour la classe

Comme le montre la figure 6, nous utilisons des poids des r�gles de normalisation orthogonales (Ciss� et al papier 2017), non seulement peut �liminer cette compression, en fait, la g�n�ralisation am�lior�e. Caract�risation de la polym�risation plus cach� ainsi que les informations qui compression directe correspondant � la manquant. Nous avons men� d'autres exp�riences dans ce domaine, donc effectivement confirm� la compression de l'information est caus�e par le regroupement.

Figure 6: �limination compression en utilisant orthogonal normalis�

autre Important

Caus�e par le concept de regroupement de � compression � est importante pour deux raisons. Tout d'abord, il prend le myst�re � compression de l'information �, et avec une formule plus sp�cifique au lieu. En second lieu, il ouvre la porte � p�le de recherche directe, le cluster peut ne pas souffrir de l'information mutuelle relative au nombre estim� de dimensions extr�mes � mal�diction � (Nous montrons que la complexit� �chantillon cro�t de fa�on exponentielle dans le nombre de dimensions). En fait, une m�thode de mesure (initiale), nous avons pu �tendre � l'ensemble du cluster du r�seau de neurones de convolution pour classer pour les t�ches de num�risation num�rique MNIST, similaire � celle observ�e dans le comportement � de compression � dans le processus de formation.

De plus, au contraire de la th�orie � goulot d'�tranglement information �, nous avons constat� que la compression n'est pas n�cessaire pour la g�n�ralisation, cependant, d'encourager l'utilisation des comprim�s (regroupement g�om�trique) est en mesure de promouvoir de meilleures probl�mes de performance de g�n�ralisation reste � r�soudre est .

Document: Estimating flux d'information dans les r�seaux de neurones profonds
Auteurs: Ziv Goldfeld, van den Berg Ewout, Kristjan Greenewald, Igor Melnyk, Nam Nguyen, Brian Kingsbury, Iouri Polyanskiy

r�f�rences:

via: https: //www.ibm.com/blogs/research/2019/06/deep-neural-networks/

fin

2019 Sommet mondial sur l'intelligence artificielle et robotique

2019 Nian 12 Juillet � 14 , Organis� par la F�d�ration chinoise Computer (CCF), Lei Feng r�seau et l'Universit� chinoise (Shenzhen) co-parrain� par Hong Kong, Shenzhen, Institut de recherche sur l'intelligence artificielle et robotique de Co 2019 Sommet mondial sur l'intelligence artificielle et robotique (D�sign� par CCF-GAIR 2019) Shenzhen sera le rideau officiel.

D'ici l�, le laur�at du prix Nobel JamesJ. Heckman, acad�micien �tranger, pr�sident du haut du monde, bien connu Fellow, un certain nombre d'invit�s poids lourds seront personnellement Zuozhen , Pour discuter de l'intelligence artificielle et sur le terrain complexe de situation de survie de la robotique, la production, l'investissement et ainsi de suite.

a pr�sent� aujourd'hui limit� trois mille yuans billets code de r�duction, les billets pour le prix initial de 1999 yuans, ouvrez l'un des liens suivants peuvent �tre utilis�s, apr�s seulement coupons 999 yuans, limit�e 3, premier servi, jusqu'� �puisement du stock.

https://gair.leiphone.com/gair/coupon/s/5d0763011a53f

https://gair.leiphone.com/gair/coupon/s/5d0763011a2f6

https://gair.leiphone.com/gair/coupon/s/5d0763011a01e

Cliquez sur Lire l'original Voir: comment le syst�me beaucoup de recommandation plus professionnel � conna�t � les demandeurs d'emploi? IBM a introduit le syst�me de recommandation de dialogue interactif

Route de la soie

Apprenez � conna�tre la Chine

Sec | Mise au point � de compression de l'information �, IBM joindre les mains MIT R�interpr�tation de la th�orie � goulot d'�tranglement d'information �

le bruit et l'�valuation de l'information mutuelle Neural Network

La grappe en tant que facteur de compression d'entra�nement

autre Important