Discutez en t�te-�-t�te avec Geoffery Hinton

Lei Feng.com AI Technology Review Press: Lors de la conf�rence Google IO 2019 de cette ann�e, il y a eu une session au cours de laquelle Geoffery Hinton, le "parrain de l'apprentissage en profondeur" et l'un des laur�ats du prix Turing 2018, a �t� invit� � parler d'universitaires et non- sujets acad�miques. L'ensemble du processus �tait facile, juste parler de divers sujets, mais M. Hinton �tait aussi acad�mique que jamais. AI Technology Review de Lei Feng.com a organis� le contenu de l'interview en fonction de la lecture vid�o comme suit. Il y a des raccourcis mineurs.

Mod�rateur : Bonjour, je m'appelle Nicholas Thompson, journaliste pour Wired. Aujourd'hui, nous avons une conversation en t�te-�-t�te avec Geoffery Hinton. En parlant de Hinton, il y a deux choses que j'admire chez lui. La premi�re, bien s�r, c'est qu'il est tr�s pers�v�rant. M�me si tout le monde dit que ses id�es sont terribles, il insiste pour croire en lui et insiste pour le faire. D'autres "mauvaises id�es" ont �t� encourag�es par lui, moi y compris. La deuxi�me chose est que j'ai �t� manager pendant la majeure partie de ma vie, et je peux dire que j'ai collectionn� une vari�t� de titres de poste, et quand j'ai vu le profil de Hinton, son titre ne pouvait pas �tre plus m�diocre -- Google Engineering Fellow (Google Engineering Fellow) uniquement. Invitons-le sur sc�ne.

Hinton : Merci, ravi d'�tre ici.

Pourquoi s'en tenir aux r�seaux de neurones

Mod�rateur : Alors commen�ons. Je me souviens qu'il y a environ 20 ans, vous avez commenc� � �crire certains des premiers articles percutants, et les gens l'ont lu et ont pens�: "Eh bien, c'est une id�e intelligente, mais nous ne pouvons pas concevoir un ordinateur comme celui-l�." Parlez � tout le monde des raisons pour lesquelles vous avez persist� et pourquoi vous avez tant cru que vous aviez trouv� quelque chose d'important�?

Hinton : Le premier � vous corriger, c'�tait il y a 40 ans. Il me semble que le cerveau ne peut pas fonctionner autrement, il ne peut qu'apprendre les forces et les faiblesses des connexions. Eh bien, si vous voulez construire une machine capable de faire des choses intelligentes, vous avez deux options devant vous, la programmer ou la laisser apprendre. �videmment notre intelligence humaine n'est pas programm�e par les autres, elle ne peut donc qu'�tre � apprenante �. Il n'y a qu'une seule possibilit�.

Mod�rateur�: Alors, pouvez-vous expliquer le concept de ��r�seau de neurones�� tout le monde�? La plupart d'entre vous devraient le savoir, mais nous aimerions quand m�me entendre vos premi�res r�flexions et comment cela s'est d�velopp�.

Hinton : Tout d'abord, vous avez des unit�s de traitement tr�s simples, qui peuvent �tre consid�r�es comme de simples formes de neurones. Ils acceptent les signaux entrants, dont chacun a des poids, et ces poids peuvent varier, et c'est le processus d'apprentissage. Ensuite, ce que fait le neurone est de multiplier d'abord la valeur du signal entrant par le poids, de les additionner tous ensemble pour obtenir une somme, et enfin de d�cider s'il faut transmettre la somme�; par exemple, si la valeur est suffisamment grande, elle est transmise, non assez S'il est grand ou n�gatif, il ne sera pas transmis. C'est si simple. Vous connectez simplement des milliers de ces unit�s avec des milliers de milliers de fois les poids, apprenez ces poids et vous pouvez faire n'importe quoi. La difficult� r�side uniquement dans la fa�on d'apprendre les poids.

Mod�rateur�: Quand avez-vous commenc� � sentir que cette approche est similaire au fonctionnement du cerveau humain�?

Hinton�: Les r�seaux de neurones ont �t� con�us � l'origine pour ressembler au cerveau humain.

Mod�rateur�: Par exemple, � un moment donn� de votre vie, vous commencez � comprendre comment fonctionne le cerveau humain, peut-�tre � l'�ge de 12�ans, peut-�tre � 25�ans, alors quand avez-vous commenc� et comment�? Vous avez d�cid� de concevoir un r�seau de neurones apr�s le cerveau humain ?

Hinton�: Cela a �t� d�cid� presque d�s que vous avez compris comment fonctionne le cerveau humain. L'id�e m�me de faire cette recherche est d'imiter les connexions du cerveau humain, puis d'essayer d'apprendre le poids de ces connexions. Je ne suis pas vraiment le fondateur de cette id�e, Turing a eu la m�me id�e. Bien que Turing ait apport� de grandes contributions au d�veloppement de l'informatique standard, il pense que le cerveau humain est un appareil sans structure claire, et que les poids de connexion sont tous des valeurs al�atoires, et qu'il suffit ensuite d'utiliser l'apprentissage par renforcement pour modifier ces poids. il peut tout apprendre. Il a estim� que le meilleur mode de "sagesse" �tait celui-ci. Il y en a beaucoup d'autres qui ont des id�es similaires.

Mod�rateur : Vos recherches dans ce domaine vous ont rendu c�l�bre dans les ann�es 1980, mais depuis, quand d'autres chercheurs ont-ils commenc� � abandonner cette direction ? Toi seul a pers�v�r�.

Hinton�: (Pause) Il y a toujours eu un petit groupe de personnes qui ont insist� pour croire et persister jusqu'� ce jour, en particulier dans le domaine de la psychologie. Cependant, le c�t� informatique peut insister un peu moins, car dans les ann�es 1990, le jeu de donn�es sur le terrain �tait tr�s r�duit, et l'ordinateur n'�tait pas si rapide.A cette �poque, d'autres types de m�thodes sont apparues, comme les machines � vecteurs de support. (SVM). ), ils fonctionnent mieux dans ces conditions et sont moins affect�s par le bruit. Cela a commenc� � �tre frustrant, et bien que nous ayons d�velopp� le backprop dans les ann�es 80 et que nous pensions que cela r�soudrait tous les probl�mes, nous ne pouvions pas comprendre "pourquoi cela ne r�solvait aucun probl�me" � l'�poque. Plus tard, nous avons appris que rendre les r�seaux de neurones puissants n�cessite une �norme quantit� de donn�es et de puissance de calcul, mais personne ne le savait � l'�poque.

Mod�rateur�: Quelle �tait la raison pour laquelle vous pensiez que cela ne fonctionnait pas bien � l'�poque�?

Hinton�: Nous pensions que c'�tait parce que l'algorithme n'�tait pas bon, que la fonction objectif n'�tait pas bonne, etc. J'ai moi-m�me depuis longtemps l'id�e que c'est parce que nous faisons un apprentissage supervis� et que nous devons �tiqueter beaucoup de donn�es�; alors ce que nous devrions faire est un apprentissage non supervis�, � partir de donn�es non �tiquet�es. Mais en fin de compte, nous avons d�couvert que la raison principale �tait l'�chelle.

Mod�rateur�: Cela semble int�ressant, mais c'est en fait juste un manque de donn�es, mais vous pensiez qu'il y avait suffisamment de donn�es, mais vous ne les avez pas bien �tiquet�es -- vous cherchez la mauvaise question, n'est-ce pas�?

Hinton�: Je pensais qu'il �tait faux d'"utiliser des donn�es �tiquet�es". La plupart du processus d'apprentissage humain n'utilise aucune �tiquette, il mod�lise simplement la structure des donn�es. En fait, je le crois toujours. Je pense qu'� mesure que les ordinateurs deviennent de plus en plus rapides, �tant donn� un ensemble de donn�es suffisamment volumineux, l'apprentissage non supervis� doit �tre effectu� en premier�; une fois l'apprentissage non supervis� termin�, moins d'apprentissage � partir de donn�es �tiquet�es.

Mod�rateur : Dans les ann�es 1990, vous avez continu� � faire des recherches dans le milieu universitaire et � publier des articles, mais vous n'avez pas r�ussi � r�soudre de plus en plus de probl�mes. Avez-vous d�j� pens� � l'�poque, que j'en ai assez et que je vais faire autre chose ? Ou �tes-vous simplement d�termin� � continuer?

Hinton : Il s'agit de s'y tenir, c'est tout � fait possible. Vous voyez, le cerveau humain apprend en changeant ces connexions, nous avons juste besoin de l'�tudier et de l'imiter. Il peut y avoir de nombreuses fa�ons diff�rentes d'apprendre la force de ces connexions, le cerveau en utilise une, mais d'autres m�thodes sont �galement possibles. Cependant, vous devez toujours trouver un moyen d'apprendre les poids de connexion. Je n'ai jamais dout� de cela.

voir l'espoir

Mod�rateur�: � quel moment a-t-il sembl� que cela fonctionnerait�?

Hinton : Dans les ann�es 1980, l'une des choses qui d�rangeait vraiment les gens �tait que si vous concevez un r�seau de neurones avec beaucoup de couches cach�es (couches interm�diaires), vous ne pouviez pas les former. Les r�seaux de neurones peuvent �tre form�s pour certaines t�ches tr�s simples, telles que la reconnaissance des polices manuscrites, mais pour la plupart des r�seaux de neurones profonds, nous ne savons pas comment les former. Vers 2005, j'ai eu quelques id�es pour l'entra�nement non supervis� des r�seaux de neurones profonds. Plus pr�cis�ment, � partir de votre entr�e, disons quelques pixels, apprenez quelques d�tecteurs de caract�ristiques qui, apr�s les avoir appris, peuvent � peu pr�s expliquer pourquoi ces pixels sont comme ils sont. Ensuite, vous prenez ces d�tecteurs de caract�ristiques comme donn�es, les prenez comme entr�e et apprenez un autre lot de d�tecteurs de caract�ristiques, et vous pouvez expliquer pourquoi ces d�tecteurs de caract�ristiques sont li�s. Ensuite, apprenez-le couche par couche. Il est int�ressant que vous puissiez prouver math�matiquement qu'� mesure que vous apprenez de plus en plus de couches, vous n'obtenez pas n�cessairement un meilleur mod�le de donn�es, mais vous saurez comment votre mod�le actuel se compare. Chaque fois que vous ajoutez une nouvelle couche, vous obtiendrez de meilleurs r�sultats de comparaison.

Mod�rateur�: Pouvez-vous en dire plus�?

Hinton�: Lorsque vous obtenez un mod�le, vous demandez�: "�Dans quelle mesure le mod�le correspond-il aux donn�es�?" Vous pouvez alimenter le mod�le avec des donn�es et lui demander�: " Pensez-vous que les donn�es correspondent � ce que vous pensez�? Ou vous sentez-vous surpris�? " Vous pouvez faire quelques mesures de cette �tendue. L'effet que nous voulons est d'obtenir un bon mod�le qui examine ces donn�es et dit : ��Eh bien, tout cela m'est familier��. Il est g�n�ralement difficile de calculer avec pr�cision la familiarit� d'un mod�le avec les donn�es, mais vous pouvez calculer les hauts et les bas relatifs entre un mod�le et un mod�le, ce qui consiste � comparer les r�sultats. Ensuite, nous montrons que plus vous ajoutez de couches de d�tecteurs de caract�ristiques suppl�mentaires, plus le nouveau mod�le se familiarise avec les donn�es. (Remarque de l'AI Technology Review de Leifeng.com�: pour les d�tails techniques sp�cifiques de cette partie, veuillez vous reporter � la conf�rence de Hinton sur les r�seaux de croyances profondes au NIPS 2007 pdf)

Mod�rateur�: C'�tait bien d'avoir une telle id�e de mod�lisation en 2005. Quand votre mod�le a-t-il commenc� � produire de bons r�sultats�? Sur quelles donn�es faites-vous l'exp�rience�?

Hinton : C'est un ensemble de donn�es de chiffres manuscrits, tr�s simple. � cette �poque, les GPU (unit�s de calcul graphique) ont commenc� � se d�velopper rapidement et les personnes qui faisaient des r�seaux de neurones ont commenc� � utiliser des GPU vers 2007. J'avais un tr�s bon �l�ve � l'�poque. Il utilisait le GPU pour trouver des routes sur des images a�riennes. Une partie du code qu'il a �crit � l'�poque a ensuite �t� utilis�e dans la d�tection de phon�mes de la parole par d'autres �tudiants, �galement � l'aide de GPU. Ce qu'ils faisaient � l'�poque, c'�tait la pr�-formation, l'ajout d'�tiquettes apr�s la pr�-formation, puis la r�tropropagation. Cette approche a non seulement produit un r�seau de neurones profond et pr�-form�, mais a �galement eu un bon r�sultat apr�s r�tropropagation. Il a vaincu de nombreux autres mod�les dans le test de reconnaissance vocale � l'�poque. L'ensemble de donn�es est TIMIT, qui est petit, et notre mod�le est un peu mieux que les meilleurs r�sultats du milieu universitaire � l'�poque, et un peu mieux que ceux d'IBM. C'est le d�but, l'am�lioration n'est pas grande.

Ensuite, d'autres ont rapidement r�alis� qu'un peu plus de raffinement de cette approche pourrait donner d'excellents r�sultats, apr�s que tous les mod�les standard qu'elle a battus � l'�poque ont mis 30 ans � le faire. Mes �tudiants sont all�s chez Microsoft, IBM, Google apr�s l'obtention de leur dipl�me, et Google a rapidement d�velopp� cette technologie en un syst�me de reconnaissance vocale au niveau de la production. En 2009, il y a eu les premiers r�sultats, et en 2012, il est venu au syst�me Android, et le syst�me Android �tait tr�s en avance sur la reconnaissance vocale.

Mod�rateur : A cette �poque, vous aviez cette id�e depuis 30 ans, et vous avez enfin obtenu un r�sultat qui est reconnu par le public, et c'est aussi mieux que d'autres chercheurs, comment vous sentez-vous ?

Hinton : Je suis vraiment heureux qu'il ait finalement atteint le stade de la r�solution de probl�mes pratiques.

Mod�rateur�: Donc, apr�s avoir d�couvert que les r�seaux de neurones pouvaient bien r�soudre les probl�mes de reconnaissance vocale, quand avez-vous commenc� � essayer de r�soudre d'autres probl�mes�?

Hinton : Eh bien, apr�s cela, nous avons commenc� � exp�rimenter cette approche sur divers probl�mes. La premi�re personne � utiliser les r�seaux de neurones pour la reconnaissance vocale a �t� George Dahl, qui a ensuite utilis� les r�seaux de neurones pour pr�dire si une mol�cule se connecterait � quelque chose et agirait comme une th�rapie. Il y avait un concours pour le faire � l'�poque, et il a juste utilis� des m�thodes standard de reconnaissance vocale pour pr�dire l'activit� des mol�cules de m�dicament, et vient de remporter le concours. C'est un signe tr�s positif que l'approche des r�seaux de neurones semble avoir un haut niveau de g�n�ralit�. � ce moment-l�, un de mes �tudiants a d�clar�: "Geoff, je pense que l'utilisation de cette m�thode pour la reconnaissance d'images fonctionnera �galement bien, Li Feifei a �galement cr�� un ensemble de donn�es appropri�, et il y a un concours ouvert, nous devons l'essayer. ". Nous venons de participer et avons obtenu des r�sultats bien meilleurs que les m�thodes de vision par ordinateur standard. (AlexNet a remport� la premi�re place dans le 2012 ImageNet Visual Recognition Challenge ILSVRC de loin mieux que la deuxi�me place, l'�quipe SuperVision dans l'image ci-dessous)

Mod�rateur : J'ai mentionn� beaucoup de cas r�ussis, comme la mod�lisation de mol�cules chimiques, la parole, les images, etc. Y a-t-il des cas d'�chec ?

Hinton�: Les �checs sont temporaires, comprenez-vous�?

Mod�rateur�: Alors, y a-t-il des domaines qui r�ussissent particuli�rement bien rapidement et d'autres qui sont plus lents�? J'ai l'impression que les t�ches essentielles des organes de perception humaine, telles que le traitement du signal visuel et le traitement du signal vocal, sont les premi�res � �tre conquises, n'est-ce pas�?

Hinton : Pas exactement, la perception l'a d�pass�, mais il y avait aussi des choses comme le contr�le du mouvement qui ne s'am�lioraient pas autant. Les humains ont un contr�le moteur tr�s �lev� et facile, et il est clair que notre cerveau est con�u pour le contr�le moteur. Ce n'est qu'aujourd'hui que les performances des r�seaux de neurones dans le contr�le moteur ont commenc� � rattraper les technologies pr�c�dentes. Les r�seaux de neurones finiront par rattraper leur retard, mais de petites victoires ne font que commencer. Je pense que le raisonnement et la d�rivation abstraite, les choses que les humains apprennent enfin � faire, seront aussi les choses les plus difficiles � apprendre pour les r�seaux de neurones.

Mod�rateur : Vous dites toujours que les r�seaux de neurones peuvent tout g�rer finalement ? (rire)

Hinton�: Eh bien, nous, les humains, sommes des r�seaux de neurones. Tout ce que nous pouvons faire, un r�seau de neurones peut le faire.

Mod�rateur : Oui, mais le cerveau humain n'est pas forc�ment la machine informatique la plus performante au monde. Existe-t-il des machines plus efficaces que le cerveau humain ?

Hinton : Philosophiquement, je ne suis pas contre l'id�e qu'il existe une mani�re compl�tement diff�rente de proc�der. Par exemple, si vous commencez par la logique, vous essaierez d'�tudier la logique automatique, et vous d�velopperez des machines automatiques de d�monstration de th�or�mes particuli�rement puissantes�; si vous commencez par le raisonnement, et ensuite vous voulez faire de la perception visuelle par le raisonnement, peut-�tre que cette m�thode est faisable aussi. Cependant, ces m�thodes n'ont finalement pas donn� de bons r�sultats. Je ne suis pas philosophiquement oppos� � d'autres fa�ons de proc�der. Ce n'est que maintenant que nous savons que le cerveau, c'est-�-dire le r�seau de neurones, peut effectivement le faire.

Comprenons-nous les r�seaux de neurones ? comprendre notre cerveau?

Mod�rateur�: Maintenant, je veux poser une question sous un autre angle, c'est-�-dire que nous ne comprenons pas parfaitement le fonctionnement des r�seaux de neurones, n'est-ce pas�?

Hinton�: C'est vrai, nous ne savons pas vraiment comment fonctionnent les r�seaux de neurones.

Mod�rateur�: Il est difficile de raisonner sur le fonctionnement des r�seaux de neurones � partir des r�sultats. C'est la cl� de notre manque de compr�hension des r�seaux de neurones, n'est-ce pas�? Parlons-en en d�tail. Et �videmment j'ai la question suivante juste apr�s : si nous ne savons pas comment ils fonctionnent, comment pouvons-nous obtenir de bons r�sultats lorsque nous les construisons ?

Hinton�: Si vous regardez les syst�mes de vision par ordinateur actuels, la plupart d'entre eux n'ont qu'une propagation vers l'avant et aucune connexion de r�troaction. Une autre caract�ristique des syst�mes de vision par ordinateur actuels est qu'ils sont tr�s sensibles aux erreurs contradictoires. Par exemple, si vous avez une image d'un panda, apr�s avoir l�g�rement modifi� quelques pixels dedans, il nous semble toujours qu'il ressemble � un panda, mais l'ordinateur syst�me de vision va Soudain, j'ai pens� que c'�tait une dinde. �videmment, cette fa�on de modifier les pixels doit �tre soigneusement con�ue, ce qui induit en erreur ou trompe le syst�me de vision par ordinateur. Mais le fait est que c'est toujours un panda aux yeux des humains, non affect�.

Donc, au d�but, nous pensions que les syst�mes de vision par ordinateur bas�s sur des r�seaux neuronaux fonctionneraient plut�t bien, mais lorsque nous avons d�couvert que des modifications (attaques) contradictoires comme celle-ci pouvaient faire l'affaire, tout le monde a commenc� � s'inqui�ter un peu. Je pense qu'une partie de ce probl�me est due au fait que le r�seau n'est pas capable de reconstruire � partir de repr�sentations de haut niveau. Maintenant, certains chercheurs essaient de faire un apprentissage discriminatif, qui consiste � apprendre de nombreuses couches de d�tecteurs de caract�ristiques, puis le but ultime est de modifier les poids des diff�rents d�tecteurs de caract�ristiques pour obtenir de meilleurs r�sultats. R�cemment, notre �quipe � Toronto a �galement fait quelques d�couvertes, Nick Frost a d�couvert que si vous introduisez un processus de reconstruction, cela rend le r�seau plus stable contre les attaques adverses. Je pense donc que dans le syst�me visuel humain, le processus d'apprentissage implique la reconstruction. Et nous, les humains, en plus de la vision, avons beaucoup de processus d'apprentissage avec la reconstruction, nous sommes donc beaucoup plus stables face aux attaques adverses.

Mod�rateur�: En d'autres termes, pensez-vous que la connexion back-to-front dans le r�seau de neurones peut vous aider � tester le processus de reconstruction des donn�es�?

Hinton : Oui, je pense que c'est tr�s important.

Mod�rateur�: Alors, les sp�cialistes du cerveau ont-ils le m�me point de vue�?

Hinton�: Les sp�cialistes du cerveau s'accordent tous � dire que si la voie de signalisation sensorielle passe par deux zones diff�rentes du cortex c�r�bral, il doit y avoir une connexion inverse. Ils ne sont tout simplement pas d'accord sur le r�le de cette connexion. Son r�le peut �tre l'attention, il peut �tre pour l'apprentissage, il peut �tre pour la reconstruction, et il peut m�me �tre les trois.

Mod�rateur : Nous ne comprenons donc pas enti�rement le r�le de la connexion invers�e. Alors maintenant, vous voulez construire une connexion inverse dans le r�seau qui joue un r�le de reconstruction, est-ce raisonnable de le faire ? Bien que vous disiez vouloir imiter le cerveau, vous n'�tes pas s�r que le cerveau soit vraiment comme �a.

Hinton : Je n'ai absolument aucune inqui�tude � ce sujet. Apr�s tout, je ne fais pas de neurosciences computationnelles et je n'essaie pas de trouver un bon mod�le du fonctionnement du cerveau humain. Tout ce que je fais, c'est regarder le cerveau et dire : "Puisqu'il fonctionne bien, c'est l� que nous pouvons chercher de l'inspiration lorsque nous voulons faire fonctionner quelque chose d'autre." Nous nous inspirons donc des neurosciences, de la science du cerveau, mais pas de la mod�lisation des nerfs c�r�braux. L'ensemble de notre mod�le de r�seau neuronal, les neurones utilis�s dans notre mod�le, s'inspire des nerfs du cerveau humain�: les neurones ont de nombreuses connexions, et ces connexions peuvent changer de poids.

Mod�rateur�: Cela semble int�ressant. Donc, si je fais aussi de l'informatique, j'�tudie aussi les r�seaux de neurones, et puis je veux faire mieux que Hinton, une option est de construire des connexions back-to-front bas�es sur d'autres mod�les de science du cerveau, et cette fois je peux choisir pour le faire fonctionner pour l'apprentissage.

Hinton : Si cela conduit � de meilleurs mod�les, alors vous avez vraiment une chance de r�ussir.

Mod�rateur�: Sujet suivant, puisque nous avons dit que les r�seaux de neurones peuvent r�soudre divers probl�mes, est-il possible que les r�seaux de neurones captent et reproduisent les cerveaux humains, tels que les �motions...

Hinton : (l'interrompant directement) Impossible.

Animateur�: Les r�seaux de neurones peuvent-ils �tre utilis�s pour reconstruire l'amour et la conscience�?

Hinton : C'est bien, tant que vous comprenez ce que ces choses signifient. Apr�s tout, nous, les humains, sommes aussi des r�seaux de neurones. La conscience est quelque chose qui m'int�resse particuli�rement en ce moment, mais beaucoup de gens ne savent pas vraiment de quoi ils parlent quand ils disent le mot. Il existe de nombreuses d�finitions diff�rentes de cette chose, et � mes yeux, cela devrait �tre un terme scientifique. Il y a 100 ans, si vous demandiez � quelqu'un ce qu'�tait la "vie", il aurait probablement r�pondu "il y a une force vitale active dans ce qui est vivant, et quand ils meurent, cette force vitale va avec. Donc la diff�rence entre vivant et mort C'est juste s'il y a ce genre de vitalit�. Maintenant qu'on ne parle pas de vitalit�, on pense que c'est un concept pseudo-scientifique. M�me apr�s avoir �tudi� la biochimie et la biologie mol�culaire, vous commencerez � r�primander la notion de force vitale, car vous comprenez d�j� ce qu'est la vie. Je pense que notre compr�hension de la "conscience" passe par le m�me processus. Le terme a d�j� �t� propos� pour expliquer les ph�nom�nes spirituels qui, selon nous, ont une signification importante. Mais une fois que nous comprenons vraiment ce qu'est la conscience, le contenu de cette "signification importante" n'a plus d'importance, nous pouvons clairement expliquer ce que faire les choses fait qu'une personne se sent "consciente" et pourquoi, �tre �galement capable d'expliquer toutes les diff�rentes sens du mot.

Mod�rateur : Il n'y a donc aucune �motion qui ne puisse �tre cr��e, et aucune pens�e qui ne puisse �tre cr��e. Tant que nous comprenons parfaitement le fonctionnement du cerveau, th�oriquement, il n'y a rien que le cerveau humain puisse faire qui ne puisse �tre bien fait. r�seau reproduit?

Hinton : Vous savez quoi, ce que vous venez de dire me rappelle une chanson de John Lennon, les paroles sont tr�s similaires.

Mod�rateur�: Avez-vous une confiance � 100�% en ces derniers�?

Hinton�: Non, pas � 100�%. Je suis bay�sien et je suis confiant � 99,9 %.

Mod�rateur�: Eh bien, qu'en est-il des 0,1�% restants�?

Hinton : Il est possible que notre monde entier soit un grand simulateur, et rien de tout cela n'est vrai.

Mod�rateur : Ce n'est pas impossible. Ainsi, gr�ce � vos recherches en informatique, avons-nous d�couvert quelque chose de nouveau sur le cerveau ?

Hinton : Je pense que ce que nous avons appris au cours de la derni�re d�cennie, c'est que si vous avez un syst�me avec des centaines de millions de param�tres et une fonction objective, comme cloze, il peut fonctionner mieux qu'il n'y para�t, c'est bien mieux.

La plupart des gens qui font de l'IA traditionnelle penseront, ou m�me une personne ordinaire pensera que pour un syst�me avec des milliards de param�tres, il faut partir de l'�tat initial o� tous les param�tres sont des valeurs al�atoires, calculer le gradient de la fonction objectif, et puis modifiez ces param�tres un par un. Avec des milliards de param�tres, laissez la valeur de la fonction objectif aller un peu dans une meilleure direction, et cela doit �tre fait tour par tour. C'est trop de travail, et il n'y a aucun espoir Il est tr�s probable qu'il soit � mi-chemin. Mais c'est en fait un bon algorithme, et plus l'�chelle est grande, mieux cela fonctionne. Ceci est enti�rement d�riv� de notre exp�rience. Maintenant que nous avons d�couvert une telle r�gle, il est beaucoup plus facile d'accepter que le cerveau humain calcule �galement le gradient d'une fonction objective, puis met � jour la force de propagation du signal �lectrique neuronal en fonction du gradient. Nous avons juste besoin de comprendre comment le processus est d�compos� en �tapes et quelle est cette fonction objectif.

Mod�rateur�: Mais notre compr�hension du cerveau n'en est pas encore l�? Nous ne comprenons toujours pas le processus de modification des poids�?

Hinton : C'est une th�orie. Il y a longtemps que les gens pensaient que c'�tait possible, mais il y aura toujours un informaticien traditionnel qui insistera "Cela semble magnifique, mais vous dites que vous avez des milliards de param�tres avec des valeurs initiales al�atoires, et ils passent tous par une descente de gradient. Apprendre, �a ne se fait pas, il faut y mettre des connaissances. � Maintenant, nous pouvons leur prouver le contraire, il suffit de commencer avec des param�tres al�atoires et de tout apprendre.

Mod�rateur�: D�veloppons un peu. En supposant que nous concevons des mod�les bas�s sur la fa�on dont nous pensons que le cerveau fonctionne, puis que nous les testons � grande �chelle, nous avons de bonnes chances d'en apprendre de plus en plus sur la fa�on dont le cerveau fonctionne r�ellement. Y aura-t-il un jour un jour o� nous pourrons r�ellement modifier nos cerveaux pour en faire des machines informatiques plus efficaces et efficaces ?

Hinton : Si nous pouvons vraiment comprendre, nous pouvons mieux faire des choses comme l'�ducation. Je crois que cela arrivera. C'est une chose �trange si vous pouvez comprendre ce qui se passe dans votre cerveau, mais vous ne pouvez pas l'ajuster pour mieux l'adapter � votre environnement.

L'apprentissage automatique "r�ve" aussi

Mod�rateur�: Peut-on mieux comprendre les r�ves�?

Hinton : Je pense que oui, je m'int�resse tellement aux r�ves moi-m�me que je connais au moins quatre th�ories sur les r�ves.

Mod�rateur : Parlez-en � tout le monde.

Hinton : Le premier a une longue histoire. Il y a longtemps, il y avait quelque chose appel� un r�seau Hopfield qui pouvait apprendre la m�moire en tant qu'attracteur local. Ce type, Hopfield, a d�couvert que si vous essayez d'y mettre trop de souvenirs, ils deviennent confus. Cela fera fusionner les deux attracteurs locaux en un seul quelque part au milieu.

Il y a Francis Crick et Graeme Mitchison qui disent que vous pouvez d�sapprendre pour �viter les faux minima locaux. Ensuite, nous d�sactivons l'entr�e du r�seau, d�finissons d'abord le r�seau de neurones dans un �tat al�atoire, puis attendons qu'il s'arr�te, nous sentirons que le r�sultat n'est pas bon, puis ajustons la connexion r�seau pour qu'elle ne s'arr�te pas dans cet �tat. Apr�s avoir fait cela plusieurs fois, il peut stocker plus de souvenirs.

Ensuite, il est venu � moi et � Terry Sejnowski. Nous avons pens� qu'il n'y a pas que des neurones qui stockent des souvenirs, mais aussi de nombreux neurones qui jouent d'autres r�les. Pouvons-nous concevoir un algorithme qui permette � d'autres neurones d'aider �galement � restaurer des souvenirs�? Plus tard, nous avons d�velopp� la machine de Boltzmann en apprentissage automatique, qui a une propri�t� tr�s int�ressante�: montrez-lui des donn�es, elle continuera � se promener dans d'autres unit�s jusqu'� ce qu'elle obtienne un �tat satisfaisant�; une fois qu'elle le fait, elle augmente le poids de toutes les connexions en fonction de si les deux unit�s sont actives. Il y a une �tape ici, et vous devez couper entre elle et l'entr�e. Vous le laissez errer jusqu'� un �tat avec lequel il se sent � l'aise, puis vous le laissez trouver toutes les paires de neurones qui sont actives et affaiblissent les connexions entre eux.

L'algorithme que je vous explique ici semble �tre un processus int�ressant, mais en fait l'algorithme est le r�sultat de recherches math�matiques, on r�fl�chit � "comment changer la fa�on dont ces connexions sont faites pour que le r�seau de neurones avec des couches cach�es puisse se sentir que les donn�es sont tr�s importantes. familier". Et il doit avoir une autre phase, nous l'appelons l'�tat n�gatif, qui consiste � le laisser fonctionner sans entr�e, puis � oublier l'�tat dans lequel il se trouve.

Nous, les humains, dormons plusieurs heures chaque jour. Si vous vous r�veillez au hasard, vous pouvez dire quel r�ve vous �tiez en train de faire car la m�moire du r�ve est stock�e dans la m�moire � court terme. Si vous vous r�veillez apr�s avoir suffisamment dormi, vous ne pouvez vous souvenir que du dernier r�ve, pas des pr�c�dents. C'est en fait une bonne chose, afin de ne pas confondre les r�ves avec la r�alit�. Alors pourquoi ne pouvons-nous pas nous souvenir de nos r�ves ? Le point de Crick est que le but du r�ve est d'oublier beaucoup de choses. C'est comme l'inverse de l'apprentissage.

Et Terry Sejnowski et moi avons montr� qu'il s'agit en fait d'un processus d'apprentissage par maximum de vraisemblance pour une machine de Boltzmann. C'est aussi une th�orie du r�ve.

Mod�rateur�: Avez-vous d�j� cr�� un algorithme d'apprentissage en profondeur comme celui-ci�? Apprenez un ensemble de donn�es d'image, puis oubliez, apprenez � nouveau, etc.

Hinton : Oui. Nous avons essay� des algorithmes d'apprentissage automatique. Les machines Boltzmann ont �t� parmi les premiers algorithmes que nous avons d�couverts qui pouvaient apprendre � g�rer les neurones cach�s, mais ils �taient tr�s inefficaces. Plus tard, j'ai trouv� un moyen de les approximer, ce qui est beaucoup plus efficace. Ce sont en fait des opportunit�s de redonner vie � l'apprentissage en profondeur, c'est-�-dire qu'avec ces m�thodes, je peux apprendre une couche de d�tecteurs de caract�ristiques � la fois. C'est une forme efficace de machine de Boltzmann restreinte. Il peut aussi faire oublier. Il n'a pas besoin de dormir, il a juste besoin de m�diter pendant un moment apr�s avoir examin� chaque point de donn�es.

Mod�rateur�: Qu'en est-il de la deuxi�me th�orie�?

Hinton : La deuxi�me th�orie s'appelle l'algorithme Wake Sleep, et vous allez vouloir apprendre un mod�le g�n�ratif. L'id�e ici est que vous avez un mod�le qui peut g�n�rer des donn�es, il a beaucoup de couches de d�tecteurs de caract�ristiques, il s'active � partir de la couche sup�rieure et fonctionne jusqu'� la couche de pixels, et vous obtenez une image. Vous pouvez aussi le faire dans l'autre sens, c'est-�-dire reconna�tre une image.

De cette fa�on, votre algorithme aura deux phases, dans la phase d'�veil, les donn�es arrivent et le mod�le essaie de reconna�tre les donn�es�; mais le but de l'apprentissage du mod�le � ce moment n'est pas de renforcer la connexion pour la reconnaissance, mais de renforcer la connexion pour la g�n�ration. Au fur et � mesure que les donn�es arrivent, les neurones de la couche cach�e sont activ�s, ce qui permet ensuite aux neurones d'apprendre � mieux reconstruire les donn�es. Chaque couche apprend � se reconstruire. Mais la question est, comment apprendre les jointures en avant de cette mani�re ? L'id�e est que si vous connaissez d�j� la connexion directe, vous pouvez apprendre la connexion inverse car vous pouvez apprendre la reconstruction.

Maintenant, nous avons �galement d�couvert qu'il peut utiliser des connexions inverses, vous pouvez apprendre les connexions inverses, car vous pouvez directement d�marrer l'activation � partir de la couche sup�rieure, puis g�n�rer des donn�es. Et parce que vous g�n�rez des donn�es, vous connaissez les �tats d'activation des neurones cach�s et vous pouvez apprendre les connexions directes pour restaurer ces �tats. C'est la phase de sommeil. Lorsque vous d�sactivez l'entr�e, vous g�n�rez simplement des donn�es, puis vous essayez de reconstruire l'�tat de ces neurones cach�s qui ont g�n�r� les donn�es. De plus, si vous connaissez les liens descendants, vous pouvez apprendre les liens ascendants�; et vice versa. Donc, si vous commencez avec des connexions al�atoires et alternez entre les deux choses, cela fonctionne. Bien s�r, vous devrez y apporter diverses modifications pour le faire fonctionner, mais c'est faisable.

Mod�rateur�: emmm, nous avons encore 8 minutes, allez-vous continuer � parler des deux autres th�ories�? Dans ce cas, nous sauterons les derni�res questions.

Hinton : Les deux autres th�ories pourraient prendre une heure.

Les g�lules sont une bonne id�e, mais aussi une erreur

Mod�rateur : Alors continuons � demander. Quel genre de recherche faites-vous maintenant? Quels probl�mes essayez-vous de r�soudre?

Hinton : En fin de compte, nous voulons tous faire de la recherche qui n'a jamais �t� faite auparavant. Il y a une chose dans ma recherche qui, je pense, ne finira jamais, et ce sont les capsules, qui sont ma th�orie de la perception visuelle par la reconstruction, et la th�orie de l'acheminement de l'information au bon endroit. Dans un r�seau neuronal standard, l'information, c'est-�-dire l'activit� des neurones dans chaque couche, va automatiquement, et vous ne pouvez pas d�cider o� vous voulez que l'information aille. L'id�e de la capsule est de d�cider o� envoyer l'information. Actuellement, depuis que j'ai commenc� � travailler sur des capsules, d'autres coll�gues tr�s intelligents de Google ont cr�� des mod�les Transformer qui font la m�me chose. Ils d�cident tous o� envoyer les informations, ce qui est une grande am�lioration.

Une autre chose qui m'a inspir� pour faire des capsules est le cadre de coordonn�es. Lorsque les humains font de la perception visuelle, nous utilisons tous des cadres de coordonn�es. Si un humain assume le mauvais cadre de coordonn�es sur un objet, il ne reconna�tra pas cet objet.

Vous faites une petite t�che pour vous en faire une id�e�: imaginez un t�tra�dre r�gulier dont la base est un triangle, puis a trois c�t�s triangulaires, et les quatre c�t�s sont des triangles congruents. C'est facile � imaginer, non ? Imaginez ensuite le couper avec une surface plane pour obtenir une section carr�e. Couper est facile, mais obtenir une section carr�e est plus difficile. Chaque fois que vous essayez de couper, vous obtenez une section triangulaire.

Il semble difficile de voir comment cette section carr�e est d�coup�e. Permettez-moi donc de d�crire le m�me objet d'une autre mani�re. Je vais faire un trait avec votre stylo, un stylo au-dessus et un stylo en dessous, les imaginer verticalement dans l'espace, et relier tous les points du stylo sup�rieur � tous les points du stylo inf�rieur. De cette fa�on, vous obtenez un t�tra�dre. Examinons maintenant la relation entre ce t�tra�dre et le cadre de coordonn�es. Le c�t� sup�rieur est parall�le � un axe de coordonn�es et le c�t� inf�rieur est parall�le � l'autre axe de coordonn�es. Ensuite, quand vous le regardez comme �a, il est facile de voir comment d�couper un rectangle et de trouver un carr� quelque part au milieu. Mais nous ne pouvons le voir que si nous pensons dans ce cadre de coordonn�es.

C'est �vident pour les humains, mais le cadre de coordonn�es est vraiment important pour l'ensemble de la perception.

Mod�rateur�: Y a-t-il une diff�rence entre l'ajout d'un cadre de coordonn�es au mod�le et ce que vous avez fait dans les ann�es 1990 pour int�grer les r�gles dans le mod�le et qui s'est av�r� �tre une erreur�? Cela ne signifie-t-il pas rendre le syst�me non supervis�?

Hinton�: Oui, c'est la m�me erreur. Juste parce que je suis � peu pr�s s�r que c'est une grave erreur, je ne peux qu'en ajouter un peu plus, et c'est un peu une �vidence. Cela a �galement rendu ma propre situation un peu embarrassante.

Mod�rateur�: Votre recherche actuelle est-elle sp�cifique � la reconnaissance visuelle, ou avez-vous d'abord pens� au cadre de coordonn�es, puis essay� de le rendre plus g�n�ral�?

Hinton�: Il peut �galement �tre utilis� dans d'autres t�ches, mais je suis particuli�rement int�ress� par les applications en reconnaissance visuelle.

Mod�rateur�: L'apprentissage en profondeur �tait autrefois tr�s unique, mais il semble maintenant �tre synonyme d'IA dans une large mesure�; en m�me temps, l'IA est �galement devenue un mot avec une forte signification marketing, et les personnes qui utilisent n'importe quelle machine ou algorithme aussi dire qu'ils l'ont utilis�. Comment vous sentez-vous en tant que personne qui a d�velopp� ces technologies et contribu� � ce statu quo�?

Hinton�: J'�tais beaucoup plus heureux lorsque l'IA signifiait simplement des syst�mes informatiques bas�s sur la logique qui manipulent des symboles�; les r�seaux de neurones � l'�poque signifiaient �galement que vous pouviez apprendre avec des r�seaux de neurones. Il y a beaucoup d'entreprises maintenant qui n'aiment pas �a et qui ne se soucient que de l'argent. J'ai grandi dans un tel environnement. Maintenant, je vois m�me certaines personnes qui disaient que les r�seaux de neurones �taient des ordures depuis de nombreuses ann�es commencent � dire "Je suis professeur d'IA, alors s'il vous pla�t, accordez-moi un financement". Vraiment �nervant.

Mod�rateur : Votre domaine de recherche a d�coll�, et il a un peu le go�t d'avaler d'autres domaines, ce qui leur donne une raison de demander de l'argent, ce qui est un peu frustrant.

Hinton : Ce n'est pas tout � fait injuste, cependant, beaucoup de gens ont modifi� leur fa�on de penser.

Mod�rateur : Derni�re question, vous avez dit un jour dans une interview que l'IA peut �tre comme un trou noir, et si vous ne la construisez pas de la bonne fa�on, elle peut vous ronger. Alors, comment �viter de le rendre nuisible ou m�me un trou noir dans vos recherches�?

Hinton : Je ne ferais jamais d'IA intentionnellement pour causer du tort. Bien s�r, si vous concevez un trou noir capable de manger la t�te des autres, c'est une tr�s mauvaise chose, et je ne ferai pas de telles recherches.

Mod�rateur : D'accord. Nous avons eu une excellente conversation aujourd'hui, merci d'en avoir dit autant. Peut-�tre que l'ann�e prochaine nous passerons aux troisi�me et quatri�me th�ories sur les r�ves.

Voir la vid�o compl�te sur https://www.youtube.com/watch?v=UTfQwTuri8Y. Compil� par Lei Feng.com AI Technology Review.