La m�me chose ou bancale? MIT professeur de neurosciences James DiCarlo discuter de la fa�on d'interpr�ter le r�seau de neurones � travers le syst�me nerveux humain

Lei Feng r�seau AI Technology Review par: Vision International Computer et haut de Reconnaissance Conf�rence de CVPR 2017 a eu lieu � Hawaii le 21 Juillet � 26 Juillet. Notre groupe a �galement envoy� sp�cial � Hawa� pour vous apporter des rapports de premi�re main.

Tout grand discours: la compr�hension visuelle primat de l'ing�nierie inverse

Heure locale le 25 Juillet, professeur James DiCarlo a �t� intitul� " La science de l'intelligence naturelle (NI): Reverse Engineering Primat Perception visuelle � (sciences naturelles de la sagesse: la compr�hension visuelle primat de l'ing�nierie inverse) La conf�rence pl�ni�re. Lei Feng r�seau AI Technology Review essence extrait de la pr�sentation en direct ci-dessous:

professeur de science James DiCarlo, MIT Doyen du cerveau et les sciences cognitives au MIT nerf. Il �tait Alfred Sloan Fellow, Pew Scholar en sciences biom�dicales (Pew Scholar), et chercheurs Macbeth communaut� des neurosciences. Son objectif de recherche est de comprendre le m�canisme de formation de l'intelligence visuelle dans le cerveau des primates par la m�thode de calcul.

discours texte

Professeur DiCarlo d'abord de remercier les organisateurs l'ont invit� � donner des conf�rences. Il est venu de la communaut� des neurosciences, la r�union est venu du secteur de CV, mais qui veulent aussi profiter de cette occasion pour faire un pont entre deux domaines de recherche.

Le contenu global de la recherche et les m�thodes

professeur de recherche de cerveaux humains pour �tudier la fa�on dont il fonctionne, et comment simuler d'une mani�re calcul�e et industrie CV objectif de recherche est d'essayer de construire un syst�me pour atteindre les performances du cerveau humain. Il semble donc professeur, je l'esp�re l'industrie de CV qui peuvent b�n�ficier de la recherche en neurosciences.

PPT �tat id�al est dans ce jaune, l'industrie de CV qui a consid�r� ses propres recherches pour essayer de construire le syst�me avant que le projet, mais de se conformer � un certain nombre de cerveau et les sciences cognitives limite elle-m�me. Neuroscience qui est, � son tour, consid�r� comme le cerveau a construit un bon syst�me pour �tudier comment les limites du cerveau et essaient d'imiter la structure du cerveau ing�nierie inverse, et peu � peu le m�canisme de v�rification des exemples utilis�s pour faire dans le processus. Ainsi, on peut voir l'�tude des neurosciences et des r�seaux de neurones comme compl�mentaires les uns aux autres, de sorte que les r�sultats de la recherche apportera plus de possibilit�s d'interaction cerveau-ordinateur.

cerveau humain se rendra compte que la cat�gorie de l'objet, la position, la posture, etc. L'information visuelle est entr�e. capacit� de reconnaissance d'objets humain est tr�s forte, sans effort, il y a beaucoup de recherches sur les capacit�s cognitives humaines, telles que la perception humaine des objets rassembl�s dans la gamme d'environ 10 degr�s de champ angle de vision central il y a longtemps, et l'il humain d'observer l'image compl�te captur�e par la pluralit� de mode d'image en mouvement, puis le lien vers la m�moire. Ils ont mis le syst�me visuel humain cette fonctionnalit� appel�e le � centre de la perception des objets � (perception des objets de base). Le r�sultat final est un professeur de t�che de reconnaissance visuelle d'objets (perception de l'objet), vise � identifier la cat�gorie.

professeur d'ing�nierie inverse au centre de la perception de l'objet est divis� en trois �tapes:

Tout d'abord faire la d�finition et le traitement de la performance op�rationnelle dans le domaine de l'�tude, avec une pr�occupation particuli�re est maintenant de cr�er un syst�me qui est insuffisant par rapport au cerveau biologique;
Ensuite, mesurer la performance du syst�me aura un impact sur les composants d'importants, comme il aurait besoin de mesurer certaines caract�ristiques biologiques, la mesure du temps de choisir soigneusement parmi plusieurs indicateurs sp�cifiques pour mesurer;
Enfin, sous r�serve des restrictions ci-dessus effectuer l'ing�nierie avant, construction de mod�les, le mod�le avec des donn�es organis�es. Pour le mod�le, il a besoin non seulement d'�tre en mesure d'expliquer, obtenir les donn�es, il peut �galement pr�dire les nouvelles donn�es. En cons�quence, la mod�lisation est l'�tape la plus critique.

Apr�s la construction d'un bon mod�le � travers l'interaction entre ces trois �tapes, vous pouvez essayer d'�largir le champ d'application du mod�le.

Le professeur parle aujourd'hui se fonde sur ces trois �tapes, r�sume sa perception du progr�s dans le mod�le du syst�me pour �tablir un centre de bout-primat de l'objet.

test de comportement visuel et donn�es caract�ristiques

Prof. utilis� pour tester dans l'�tude est de g�n�rer une image, l'objet plac� � diff�rents angles de vision arri�re-plan non pertinent. La raison pour laquelle ce choix est que, quand il a commenc� � �tudier le syst�me de CV contemporain peut facilement perturber les arri�re-plan non pertinent des r�sultats de reconnaissance, mais les humains ne sera pas affect�e, d'autre part, le syst�me de CV pour plus d'attitude et identifier lorsque des changements ont plus de difficult�s, mais la performance humaine a �galement �t� tr�s bonne, ce qui refl�te la perspective de l'ind�pendance, il croyait que ces images pourraient mieux montrer les caract�ristiques du syst�me visuel humain.

Professeur de tests utilis�s chez l'homme et le singe

singes form�s pour faire le test est facile � reconna�tre. Le professeur et les singes peint humain test�s sur cette matrice de motif d'identification, dans lequel diff�rents objets sont dispos�s selon la complexit� diff�rente. Signification de chaque cellule est proportionnelle � l'objet et un autre objet de classe distinguer correctement cette cat�gorie, la couleur plus rouge, plus la pr�cision de la reconnaissance, plus bleu, la pr�cision de reconnaissance sup�rieure.

Selon la matrice de motifs de mauvaise identification, les primates et la performance non-humaine performance humaine est fondamentalement la m�me, non seulement dans la pr�cision globale, mais aussi entre les choses qui reconna�trait le m�lange. Alors que vous pouvez faire des tests au niveau des nerfs et de contr�le chez les animaux, le type et la quantit� de donn�es obtenues peuvent �tre grandement am�lior�es. Des recherches syst�matiques sur le m�canisme d'information peut �tre trait� sur cette base.

cortex visuel humain / primate a �t� beaucoup de recherches, on sait que l'on peut diviser V1, V2, V4, IT quatre r�gions. Flux de production syst�me visuel entier hors de l'image, alors ceci est la figure, les cellules de la r�tine consid�r�s comme un pixel, alors la composition de stimuli visuels ext�rieurs premi�re r�tine de chromatogramme, la r�tine et par la suite � travers le niveau de LGN pour V1 du cortex c�r�bral, V2, V4, il zones, chaque niveau a un million de cellules, chaque r�gion est ensuite form�e dans la r�tine correspondant aux caract�ristiques des diff�rentes r�gions, la caract�risation spatiale du signal d'entr�e est chang�e progressivement, ainsi qu'il est divis� de sorte que le syst�me visuel d'une profondeur de r�seau hi�rarchique. Depuis la r�gion informatique � la fin, a le plus haut niveau d'abstraction, la r�gion de la correspondance IT est la plus faible zone de la r�tine et dans le mod�le de t�che de reconnaissance d'objets de la r�ponse des diff�rentes classes d'objets est le plus clair.

D'autre part, les �tudes existantes ont montr� que la r�gion commence � partir de V1 est � la fois professeur et anticipatrice commentaires parlera de ces plus tard.

Aujourd'hui, pour parler des principales caract�ristiques de l'informatique est la zone de signal. Apr�s l'�tude, il a �t� constat� que la r�gion a en fait trois caract�ristiques du r�seau informatique, mais aujourd'hui, le premier professeur a donn� des conf�rences conform�ment au sol.

Selon le professeur essai, g�n�rant une r�ponse de l'image pr�sent�e � l'oeil, � l'informatique, ce qui est un d�lai d'environ 100 millisecondes. Proc�d� de mesure d'une r�ponse qu'ils multicanaux �lectrode implant�e dans diverses r�gions du cerveau de singes, en mesurant l'influx nerveux aux �lectrodes afin d'afficher une tache lumineuse dans les r�sultats du test de dessin, la composition d'un certain nombre de points lumineux sur les flocons de neige des r�sultats de mesure. Par quatre images en trois r�gions diff�rentes des r�sultats de mesure, il est clair que la r�ponse IT 100 d�lai milliseconde. Elle refl�te �galement, en r�ponse � la m�me cat�gorie, ils les diff�rentes r�gions d'image ne sont pas les m�mes.

Apr�s avoir test� un grand nombre d'images, professeur a constat� que diff�rents types d'information sur l'image globale du niveau d'intensit� de la r�ponse est diff�rente (autres neuroscientifiques ont �galement �tudi� la r�ponse neuronale � un endroit sp�cifique est de savoir comment le changement). Pour le mode de r�ponse, chaque cellule IT sont diff�rentes, chaque r�ponse est pas exactement la m�me, sur un PPT en r�ponse � nerf entra�n� dans la neige, la neige n'a jamais �t� exactement la m�me chose ne se produit pas.

Dans le processus, certaines personnes essaient diff�rentes r�gions neurales diff�rent quant � l'intensit� des objets de diff�rentes cat�gories de r�ponse, alors constat� en effet la � perception des cellules nerveuses du visage �, en g�n�ral, une r�ponse plus aux visages humains, mais ils sont diff�rents images faciales des r�ponses diff�rentes, de l'autre cat�gorie ne sont pas sans r�ponse. Par cons�quent, ces cellules ne sont pas en stricte conformit� avec la cat�gorie d'objet de reconnaissance pour distinguer les cellules qui sont caract�ristiques du complexe obtenu dans certaines �tudes pr�sent�es.

Caract�ristiques de l'IT d'�tude

Il y a ces r�sultats � l'avenir, un professeur de l'�quipe de recherche a commenc� � �tre en proie � une s�rie de probl�mes: comment expliquer les tests de comportement de mauvaise identification qui apparaissent dans les caract�ristiques de r�ponse des cellules nerveuses? exposition biologique comportement ext�rieur doit �tre soumis � l'impact du mode de r�ponse neuronale, alors comment trouver cette relation? nerf sortie secteur informatique a dix millions, mais aussi lire les signaux des dix millions de cellules nerveuses?

Les m�thodes suivantes utilis�es pour l'industrie de CV seront familiers avec certaines des personnes. Tout d'abord l'IT r�ponse quantitative � la cellule, le signal de r�ponse des cellules de mesure de n peut �tre mesur�e pour chaque mode d'image en r�ponse � l'entr�e de n cellules pour obtenir un espace de caract�ristiques � n dimensions repr�sentation vectorielle; groupe que l'espace n-dimensionnel le nombre est le nombre de fonctionnalit�s disponibles. Ensuite, une autre image contenant l'image de visage / mode de r�ponse n'est pas la mesure de l'image du visage, vous pouvez essayer de trouver si un classificateur lin�aire est un point caract�ristique dans l'espace.

Ici, encore une fois il a fait r�f�rence au professeur dans le cerveau des animaux �lectrodes implant�es chirurgicalement. Les diff�rentes r�gions de la pluralit� d'�lectrodes, chaque �lectrode 96 peut acqu�rir un chemin de signal (96 broches), et un proc�d� pour faire un grand nombre d'exp�riences et d'autres parties constitu�es de l'espace de donn�es informatique de dimension tr�s �lev�. La quantit� de donn�es obtenues par rapport � la p�riode pr�c�dente de-�lectrode unique a aussi une augmentation explosive.

Avec un tel proc�d�, la r�gion en r�ponse � l'image, il peut construire un vecteur de r�ponse tr�s grande dimension, comme repr�sent� sur la figure, environ 100 � 1000 sur les cellules nerveuses mesur�es vecteur de caract�ristique 8 est devenu image dessin�e apparence (long), vert pour une r�ponse �lev�e, noir repr�sente une r�ponse faible. Ils ont mesur� le genre 2000 vecteur de l'image, il n'y a aucune raison de tester une plus grande vari�t� de fonctionnalit�s avec des mesures similaires faites � plusieurs reprises environ 50 fois pour obtenir un signal tr�s �lev� par rapport au bruit.

De cette fa�on, la qualit� du mod�le de r�ponse des cellules nerveuses obtenu peut devenir IT peut affecter la formation de preuves solides des d�cisions sur le comportement des animaux. Proc�d� pour le d�codeur lin�aire, le vecteur de r�ponse des neurones de le faire des pr�visions sur le comportement reconnu de mani�re erron�e, le comportement des r�sultats obtenus avec la mesure directe du degr� de co�ncidence est tr�s �lev�. De la m�me fa�on une r�ponse � la r�tine ne parvient pas � atteindre ce niveau de r�sultats pr�vus (ce qui montre �galement la cat�gorie corr�lation de r�ponse des cellules IT).

Le professeur a une d�couverte int�ressante: il n'a pas besoin d'un grand nombre de cellules nerveuses de mesure des caract�ristiques de la performance humaine peut atteindre, environ 500 suffit. mod�les Vision par ordinateur chaque fonction contribution contemporaine au mod�le de performance est beaucoup plus petit, beaucoup de caract�ristiques humaines pour atteindre des performances similaires. Ceci illustre la capacit� visuelle de comprendre les animaux est probablement pas �lev� par la dimension d'un support de jeu de fonctionnalit�s, le mod�le de calcul peut �tre simul� avec cette ligne de pens�e. Ils disposent contiennent environ dix millions de cellules nerveuses de la production, mais aussi offrir un certain nombre de dimensions inf�rieures � 1000.

D'autre part, �tant donn� que la r�ponse informatique des cellules nerveuses dans un espace � n dimensions, la capacit� de travailler sur le nombre de groupes est le nombre d'espace de dimension n, qui est, la taille de la cat�gorie informatique utilis�e pour caract�riser ensemble de fonctionnalit�s est combien? les recherches sur l'utilisation du mode de r�ponse neuronale de r�gression lin�aire, obtenir l'ensemble des fonctionnalit�s, repr�sent�e par l'ensemble des caract�ristiques du vecteur de r�ponse neuronale, et enfin avec une telle tentative sch�matique d'identifier les comportements ne permettent de pr�dire, le r�sultat est la taille de l'ensemble des fonctionnalit�s pour atteindre 500 quand il peut exactement elle pr�dit. Cette constatation est tr�s alarmante, nous avons obtenu les m�mes num�ros de diff�rentes fa�ons. Cela prend �galement en charge les bases de TI pour soutenir une vari�t� de t�ches de reconnaissance d'objets. Certaines personnes figurent ce groupe de recherche, a �tudi� plusieurs ann�es d'�tudes avec lui.

En r�sum�, l'espace de repr�sentation informatique est la capacit� d'identifier les bases biologiques potentiel, avec un simple lin�aire classificateur pour faire face � la plupart, sinon tous les d�fis de reconnaissance d'objets. groupe nerveux IT est un ensemble de fonctionnalit�s de base relativement fixe, presque pas de formation inverse peut �tre utilis� pour remplir de nombreux objets t�ches connexes.

Dans la compr�hension des caract�ristiques de la cellule informatique du futur, plus pratique et plus en profondeur viendra demander: comment est juste assez 500 de la cellule IT se caract�rise par la formation de nerf? Ils sont la base de la fa�on dont la r�tine � partir du signal progressif sur l'abstrait? Ces m�thodes de calcul dans le processus de croissance humaine o� ils viennent? Si nous pouvons �tudier ces probl�mes, et il sera d'une grande aide au professeur de but de l'�quipe. Leur but est de trouver les moyens de construire un mod�le de codeur, une image, une couche interm�diaire de s�bum sont pr�dire avec pr�cision le mod�le de r�ponse groupe nerf correspondant, le probl�me est juste les questions cl�s de la configuration du syst�me.

Ils peuvent expliquer comment construire un r�seau informatique fonctionnalit�s

Au moment de tous les r�sultats de la recherche sur la fonction des cellules nerveuses de classe V1 a �t� bien expliqu� et mod�les, mais ils ne sont consid�r�s comme un mod�le d'alimentation en avant, mais quand il est utilis� pour expliquer la r�ponse V1 peut-�tre d�j� plus de 50 % de conformit�, mais pas une bonne approximation d'une vari�t� de mod�le informatique pour l'informatique en r�ponse, seulement un maximum de 20%. Ainsi, les mod�les sont tr�s mauvaise performance � ce moment-l�.

Ensuite, le professeur introduit certains mod�les apparus au cours de l'�tude avaient mim�tique syst�me visuel des primates, formant un vecteur caract�ristique � partir des images d'entr�e � travers une vari�t� de m�thodes, puis � la fin il y a un classificateur lin�aire (cat�gorie d'objets disponibles). Selon les r�sultats de recherche sur le cerveau actuel, nous devons limiter le fonctionnement du cerveau et une certaine compr�hension, de sorte que ces mod�les comme le cerveau il y a place pour filtre local, convolution, non lin�aire critique, mise en commun non lin�aire, r�gularisation, etc. , les sorties des mod�les trait�s par ces m�thodes. Le premier r�seau de neurones est propos� par Fukushima en 1980, puis continuer � am�liorer gr�ce � la recherche Tomaso Poggio, David Cox, Nicolas Pinto et d'autres, nous sommes arriv�s au professeur mod�le HMO et ses �l�ves fini ensemble.

Il est un mod�le de r�seau de neurones profond pour imiter les quatre niveaux du syst�me visuel humain, beaucoup de gens qui connaissent bien les caract�ristiques du filtre de convolution de vision par ordinateur et ainsi de suite. D'autres neuroscientifiques font souvent une simulation de cellules nerveuses restauration compl�te, mais ils est de trouver un mod�le artificiel d'architecture plus efficace dans les limites connues. HMO dans la base informatique sur cette mimique humaine, avec la performance humaine a �t� une pr�cision similaire.

Ils disposent alors dans la partie de la repr�sentation du mod�le de l'informatique et de la r�activit� du nerf r�el apportent � faire la comparaison correspondante. performance du premier et humain a �t� similaire dans la pr�cision de la reconnaissance.

Ensuite, pour adapter l'impulsion sp�cifique des cellules nerveuses dans certains domaines de l'informatique, par rapport au mod�le pr�c�dent EXPLIQUE seulement 20% du changement dans la forme du BGL a �t� grandement am�lior�e, environ 50%. Cela montre la mesure d'expliquer la couche cach�e du mod�le est �galement tr�s �lev�.

Neuroscientifiques con�u comme un mod�le, il n'y a plus une bo�te noire, son fonctionnement interne de la fonction du cerveau humain et correspond bien. Non seulement est, V4 pr�vision du cortex visuel a �galement atteint un nouveau sommet. graphique des donn�es ne sont pas la cat�gorie du r�seau n'a jamais vu, et les r�sultats montrent que la g�n�ralisation du mod�le, � pr�visions �.

Professeur montre la carte d'un tel, dans le processus de recherche convolution de r�seau de neurones, les capacit�s de reconnaissance d'objets du r�seau lui-m�me est un indicateur important de performance, et en fait plus la capacit� � mieux identifier le pouvoir explicatif du mod�le de r�ponse informatique; HMO un tel mod�le de l'�volution des performances en m�me temps, le pouvoir explicatif des performances informatiques a �galement atteint un nouveau sommet (l'ann�e 2012).

Ce temps de d�veloppement est plus int�ressant, bien que les objectifs de recherche sur le cerveau et les sciences cognitives et de vision informatique sont diff�rents, mais ils font les choses ont commenc� � converger, il est de trouver des moyens pour les mod�les de construction les plus performants possible.

En 2013, lorsque la performance d'identification a �t� balay� les r�seaux de neurones profonds AlexNet et pouvoir explicatif de r�pondre neurones informatiques ont plus que leur HMO. Le professeur alors avait aussi � remercier du fond du cur, les aspects techniques profondeur du d�veloppement du r�seau de neurones, un bon mod�le pour aider les neuroscientifiques mieux comprendre les principes du cerveau humain.

De nouvelles diff�rences par rapport au r�seau de neurones

Mais les neuroscientifiques peuvent attendre mieux et une meilleure performance du mod�le de r�seau de neurones, ils peuvent se r�jouir de compter davantage et une meilleure compr�hension des mod�les de reconnaissance humaine de celui-ci? En fait, non, enseigner leur propre point orange mod�le de laboratoire, avec les progr�s du mod�le, la performance de la reconnaissance et l'interpr�tation des performances ont �t� am�lior�es, mais les mod�les r�cents de mise au point d'apprentissage machine am�liorent seulement la performance de la classification d'image, de sorte que la performance de classification l'augmentation, la capacit� d'interpr�ter la r�ponse cellulaire a diminu�.

Mais dans l'ensemble, les deux domaines pour atteindre � chaque �tape du traitement de neurones sont de bons r�sultats des mod�les pr�dictifs. Les mod�les de comportement, puis R�ajuster la profondeur de CNN, en fait, est tr�s similaire, mais une plus grande pr�cision et dans l'ensemble dans les coins avec le regard humain, en plus des r�sultats de cette figure Inception v3, l'autre trop comme la performance de CNN.

Afin de poursuivre des recherches approfondies, des principes d'analyse qu'ils recueillent et des singes avec AMT crowdsourcing plus de donn�es, de sorte que vous pouvez observer des donn�es � grain tr�s fin, identifier correctement l'image ou pas identifier correctement pour chaque paire, de comportement analyse d'angle.

Granularit� tr�s fine, le singe et la performance humaine �tait encore tr�s proche. Mais l'image de la stabilit� entre les performances / fonctionnalit�s termes de r�glage, CNN sur la diff�rence entre les humains et les singes sont tr�s grandes.

Le professeur croit manquer une certaine structure du mod�le. Probablement parce que la mod�lisation seul mod�le et anticipatrice commentaires ne sont pas mod�lis�s, ce qui dans les mod�les de primates sera une CNN comportement observ�.

Dans la derni�re �tude, le test est �galement utilis� dans la vision informatique des donn�es d'image set community aide de MS Coco, ils ont mis l'image en deux classes en fonction du r�sultat de test, l'un est le syst�me de vision par ordinateur pour atteindre le niveau des primates (CV-r�solus ), et l'autre est la performance ne r�pondait pas aux, puis mesurer le vecteur de r�ponse des cerveaux IT en essayant de trouver pourquoi.

Ensuite, ils ont constat� que, pour les images de vision par ordinateur montrent le niveau humain (point rouge) n'est pas atteint, le temps de r�ponse des TI dans une plus importante, avec un d�lai moyen d'environ 30 ms (par rapport � obtenir l'image au niveau humain, points bleus). Ils pensent qu'il est dans 30ms celles du cerveau humain, mais il n'y a pas de structure dans le travail de r�seau CNN, comme la r�troaction multiple.

Il y a aussi une conclusion int�ressante est que le r�seau d'alimentation en avant CNN pour expliquer la capacit� de la population des cellules nerveuses pour produire une image en r�ponse au temps plus court pass� dans la plus forte dans l'informatique, entra�nant un temps de r�ponse plus pass� en IT plus d'images faible; courbe de la figure. Cette structure doit avoir la r�troaction du mod�le, l'angle de la structure cyclique des deux domaines de recherche ont soulev� de nouveaux d�fis.

Mais le professeur a dit que ce but n'est pas n�cessaire industrie du CV qui doit prendre les commentaires ajouter aussi si simple, mais ces r�sultats r�v�lent un certain nombre de probl�mes � �tudier pour la recherche future.

Professeur de discours a fait un r�sum� g�n�ral: industrie du CV et de la communaut� scientifique sont des aspects du m�canisme du centre n�vralgique de l'objet de la perception ont fait une grande contribution � la compr�hension. Pour les �tudes futures vont, mon professeur a �galement propos� une nouvelle structure, un nouvel outil de recherche pour �tudier le syst�me visuel pour construire le cours et ainsi de suite.

A la fin du discours, le professeur dans le pass� gr�ce aux chercheurs, aux �tudiants et ses coll�gues, les sponsors, et l'exp�rience ont contribu� leur cerveau de singes. En particulier, gr�ce � la pr�sence de vous, non seulement parce qu'il a �t� invit� � venir, mais aussi parce que les r�sultats du secteur des CV est aussi une grande source d'inspiration pour leurs recherches.

session de Q & A

Question: Les m�thodes d'apprentissage de la machine ont l'apprentissage migr�e, peut avoir un r�seau form�, les couches finales de recyclage r�seau de reconnaissance d'objets avaient jamais vu auparavant. Apprenez � identifier comment les objets jamais vu le syst�me visuel humain sont la formation? Il ajoutera de nouvelles fonctionnalit�s dans les TI?

R�ponse: il est pas certain � quel point l'ensemble des fonctionnalit�s de l'informatique est une partie naturelle de la quantit� de formation est sorti. Toutefois, les animaux adultes pour les tests, l'apprentissage nouvelle cat�gorie prend environ un jour. Apr�s avoir appris apr�s 20-30 nouvelles cat�gories espace caract�ristique Nouvelle analyse informatique est la m�me, nous croyons que le changement � un processus de transfert plus t�t, la nouvelle cat�gorie est plac� dans l'espace original dans le nouvel emplacement.

Question: Comment voyez-vous maintenant quelques plus de 100 couches du r�seau de neurones, comparables entre eux et le r�seau de neurones humains ne?

A: Comme, plus profondes t�ches de test de performance du r�seau de mieux en mieux que je viens d'�voquer, mais l'interpr�tation de la r�ponse de la cellule informatique de conformit� en plus bas. Sans structure du mod�le de prescription, mais la t�che d'optimisation continue, alors, est-ce la tendance � former la diff�renciation telle. Mais en fait, quatre domaines visuel des primates est �galement probable que chacun d'eux est compos� de plusieurs couches, et nous essayons de les mettre dans chaque couche et chaque couche de CNN ne correspondent. A cet �gard, je vous une sp�culation commune, mais maintenant, nous sommes �galement � l'�tude, il est pas tout � fait clair.

Question: CV difficile d'identifier l'image ne pr�sente pas de caract�ristiques particuli�res qui les ont amen�s difficiles � identifier?

R: Nous avons �galement fait un retour pour v�rifier les photos des variables actuellement pas en mesure de trouver une raison sp�cifique, aucune particularit� de ces images.

Question: Depuis combien de temps le temps de go�ter diff�rentes couches? Combien de temps retard� le transfert de signaux entre les couches visuelles primates ont?

R: Au d�but de l'espace caract�ristique de pr�sentation est 100ms, derri�re la pr�sentation du signal IT temps de retard est 10ms, afin de montrer la courbe de changement. Ensuite, entre les couches est sans d�lai fixe, neuroscientifiques en fait, peut-on penser une impulsion de cellules nerveuses est significative, mesur�e dans notre �tude que le comportement de l'informatique, de l'image donn�e pour g�n�rer le comportement a aussi un retard de quelques dizaines � 200ms. Comme V1 � V2 � V4 entre le temps peut �tre sur un tout autre ordre de grandeur, mais parce que nous ne sont pas sp�cialis�s dans ce domaine, donc nous ne pouvons dire tant de.

Question: Avez-vous vous en doutez des informations de retour sera quoi? pure conjecture

A: Pour moi, cette question est comme me demander il y a courant d'alimentation dans quelle information est la m�me, difficile � d�crire avec le langage humain. Je pense que leur r�le est possible par voie de circulation du r�seau dans un profond encapsul� plus petit espace, bas� sur ce que je vois, je pense que oui. Mais je ne suis pas s�r que tous la boucle de r�troaction et sont utilis�s pour calculer, pour le raisonnement, ils peuvent �galement �tre utilis�s pour l'�tude, pour maintenir l'apprentissage en boucle, et cela peut n�cessiter un temps plus long que 30ms. Si vous voulez savoir exactement, alors, nous avons besoin de mettre � jour les outils pour �tablir une distinction entre les types cellulaires faire, afin de mesurer avec pr�cision la diff�rence entre leurs signaux. Voil� pourquoi nous sommes sur la section de pointe. Donc je suppose o� le r�le des cycles d'apprentissage et empaquet� dans un petit espace, un r�seau plus profond. Est tout � fait la sp�culation, je vous remercie de me donner l'occasion de deviner

Question: t�ches de classification grains fins ont quoi que ce soit � l'�tude? Par exemple, au lieu de classer les chiens et les chats, mais une classification plus d�taill�e de certains chiens, des chats, ces aspects de la performance humaine est aussi bonne

R: Regardez la diff�rence entre moins classification grains fins dans un court laps de temps nous mesurons les �valuations de l'informatique. Il devrait �tre des t�ches grains fins chez l'homme ont encore besoin de recueillir des informations plus d�taill�es pour pouvoir distinguer, les informations ult�rieures du niveau actuel des cellules nerveuses aussi ne peut pas dire la diff�rence.

Question: Comment les cellules nerveuses pour terminer le travail � de convolution �?

R: En fait, je le dis souvent, � r�seau de neurones de convolution � ne peut pas �tre �crit, parce que le cerveau ne fonctionne pas. Mais vous pouvez voir les hypoth�ses de manuels ouverts dans les diff�rentes parties de la zone visuelle ont la m�me fonction de Gabor. Certains diront que cela est une sorte d'op�rations de convolution ne pas, mais en fait, devraient se poser est, pourquoi la fonction Gabor jouera le r�le de convolution. Circonvolution r�seau de neurones des r�seaux, nous avons mis en place une couche s�par�e des op�rateurs de convolution et convolution, diff�rentes du cerveau, on peut dire le cerveau pour essayer d'apprendre � synchroniser convolution. Je pense donc que le cerveau a besoin d'apprendre cette fonction, les caract�ristiques statistiques de l'�tude et dispose �galement d'convolution r�seau est similaire, il peut �tre utilis� de deux fa�ons diff�rentes d'apprentissage, et, finalement, obtenir des filtres similaires. Donc, � mon avis, il n'y a pas une couche de convolution c�r�brale sp�ciale, mais finalement obtenir l'effet de convolution. J'esp�re que vous pouvez comprendre ce que je veux dire.

(Fin)

R�cemment, il y a de nombreuses conf�rences universitaires de niveau sup�rieur, il y aura beaucoup de conf�rences acad�miques merveilleux. Les lecteurs int�ress�s Veuillez continuer � se concentrer sur Lei Feng r�seau AI Technology Review.

Route de la soie

Apprenez � conna�tre la Chine

La m�me chose ou bancale? MIT professeur de neurosciences James DiCarlo discuter de la fa�on d'interpr�ter le r�seau de neurones � travers le syst�me nerveux humain

Tout grand discours: la compr�hension visuelle primat de l'ing�nierie inverse

discours texte

session de Q & A