La même chose ou bancale? MIT professeur de neurosciences James DiCarlo discuter de la façon d'interpréter le réseau de neurones à travers le système nerveux humain

Lei Feng réseau AI Technology Review par: Vision International Computer et haut de Reconnaissance Conférence de CVPR 2017 a eu lieu à Hawaii le 21 Juillet à 26 Juillet. Notre groupe a également envoyé spécial à Hawaï pour vous apporter des rapports de première main.

Tout grand discours: la compréhension visuelle primat de l'ingénierie inverse

Heure locale le 25 Juillet, professeur James DiCarlo a été intitulé " La science de l'intelligence naturelle (NI): Reverse Engineering Primat Perception visuelle « (sciences naturelles de la sagesse: la compréhension visuelle primat de l'ingénierie inverse) La conférence plénière. Lei Feng réseau AI Technology Review essence extrait de la présentation en direct ci-dessous:

professeur de science James DiCarlo, MIT Doyen du cerveau et les sciences cognitives au MIT nerf. Il était Alfred Sloan Fellow, Pew Scholar en sciences biomédicales (Pew Scholar), et chercheurs Macbeth communauté des neurosciences. Son objectif de recherche est de comprendre le mécanisme de formation de l'intelligence visuelle dans le cerveau des primates par la méthode de calcul.

discours texte

Professeur DiCarlo d'abord de remercier les organisateurs l'ont invité à donner des conférences. Il est venu de la communauté des neurosciences, la réunion est venu du secteur de CV, mais qui veulent aussi profiter de cette occasion pour faire un pont entre deux domaines de recherche.

Le contenu global de la recherche et les méthodes

professeur de recherche de cerveaux humains pour étudier la façon dont il fonctionne, et comment simuler d'une manière calculée et industrie CV objectif de recherche est d'essayer de construire un système pour atteindre les performances du cerveau humain. Il semble donc professeur, je l'espère l'industrie de CV qui peuvent bénéficier de la recherche en neurosciences.

PPT état idéal est dans ce jaune, l'industrie de CV qui a considéré ses propres recherches pour essayer de construire le système avant que le projet, mais de se conformer à un certain nombre de cerveau et les sciences cognitives limite elle-même. Neuroscience qui est, à son tour, considéré comme le cerveau a construit un bon système pour étudier comment les limites du cerveau et essaient d'imiter la structure du cerveau ingénierie inverse, et peu à peu le mécanisme de vérification des exemples utilisés pour faire dans le processus. Ainsi, on peut voir l'étude des neurosciences et des réseaux de neurones comme complémentaires les uns aux autres, de sorte que les résultats de la recherche apportera plus de possibilités d'interaction cerveau-ordinateur.

cerveau humain se rendra compte que la catégorie de l'objet, la position, la posture, etc. L'information visuelle est entrée. capacité de reconnaissance d'objets humain est très forte, sans effort, il y a beaucoup de recherches sur les capacités cognitives humaines, telles que la perception humaine des objets rassemblés dans la gamme d'environ 10 degrés de champ angle de vision central il y a longtemps, et l'il humain d'observer l'image complète capturée par la pluralité de mode d'image en mouvement, puis le lien vers la mémoire. Ils ont mis le système visuel humain cette fonctionnalité appelée le « centre de la perception des objets » (perception des objets de base). Le résultat final est un professeur de tâche de reconnaissance visuelle d'objets (perception de l'objet), vise à identifier la catégorie.

professeur d'ingénierie inverse au centre de la perception de l'objet est divisé en trois étapes:

  • Tout d'abord faire la définition et le traitement de la performance opérationnelle dans le domaine de l'étude, avec une préoccupation particulière est maintenant de créer un système qui est insuffisant par rapport au cerveau biologique;

  • Ensuite, mesurer la performance du système aura un impact sur les composants d'importants, comme il aurait besoin de mesurer certaines caractéristiques biologiques, la mesure du temps de choisir soigneusement parmi plusieurs indicateurs spécifiques pour mesurer;

  • Enfin, sous réserve des restrictions ci-dessus effectuer l'ingénierie avant, construction de modèles, le modèle avec des données organisées. Pour le modèle, il a besoin non seulement d'être en mesure d'expliquer, obtenir les données, il peut également prédire les nouvelles données. En conséquence, la modélisation est l'étape la plus critique.

Après la construction d'un bon modèle à travers l'interaction entre ces trois étapes, vous pouvez essayer d'élargir le champ d'application du modèle.

Le professeur parle aujourd'hui se fonde sur ces trois étapes, résume sa perception du progrès dans le modèle du système pour établir un centre de bout-primat de l'objet.

test de comportement visuel et données caractéristiques

Prof. utilisé pour tester dans l'étude est de générer une image, l'objet placé à différents angles de vision arrière-plan non pertinent. La raison pour laquelle ce choix est que, quand il a commencé à étudier le système de CV contemporain peut facilement perturber les arrière-plan non pertinent des résultats de reconnaissance, mais les humains ne sera pas affectée, d'autre part, le système de CV pour plus d'attitude et identifier lorsque des changements ont plus de difficultés, mais la performance humaine a également été très bonne, ce qui reflète la perspective de l'indépendance, il croyait que ces images pourraient mieux montrer les caractéristiques du système visuel humain.

Professeur de tests utilisés chez l'homme et le singe

singes formés pour faire le test est facile à reconnaître. Le professeur et les singes peint humain testés sur cette matrice de motif d'identification, dans lequel différents objets sont disposés selon la complexité différente. Signification de chaque cellule est proportionnelle à l'objet et un autre objet de classe distinguer correctement cette catégorie, la couleur plus rouge, plus la précision de la reconnaissance, plus bleu, la précision de reconnaissance supérieure.

Selon la matrice de motifs de mauvaise identification, les primates et la performance non-humaine performance humaine est fondamentalement la même, non seulement dans la précision globale, mais aussi entre les choses qui reconnaîtrait le mélange. Alors que vous pouvez faire des tests au niveau des nerfs et de contrôle chez les animaux, le type et la quantité de données obtenues peuvent être grandement améliorées. Des recherches systématiques sur le mécanisme d'information peut être traité sur cette base.

cortex visuel humain / primate a été beaucoup de recherches, on sait que l'on peut diviser V1, V2, V4, IT quatre régions. Flux de production système visuel entier hors de l'image, alors ceci est la figure, les cellules de la rétine considérés comme un pixel, alors la composition de stimuli visuels extérieurs première rétine de chromatogramme, la rétine et par la suite à travers le niveau de LGN pour V1 du cortex cérébral, V2, V4, il zones, chaque niveau a un million de cellules, chaque région est ensuite formée dans la rétine correspondant aux caractéristiques des différentes régions, la caractérisation spatiale du signal d'entrée est changée progressivement, ainsi qu'il est divisé de sorte que le système visuel d'une profondeur de réseau hiérarchique. Depuis la région informatique à la fin, a le plus haut niveau d'abstraction, la région de la correspondance IT est la plus faible zone de la rétine et dans le modèle de tâche de reconnaissance d'objets de la réponse des différentes classes d'objets est le plus clair.

D'autre part, les études existantes ont montré que la région commence à partir de V1 est à la fois professeur et anticipatrice commentaires parlera de ces plus tard.

Aujourd'hui, pour parler des principales caractéristiques de l'informatique est la zone de signal. Après l'étude, il a été constaté que la région a en fait trois caractéristiques du réseau informatique, mais aujourd'hui, le premier professeur a donné des conférences conformément au sol.

Selon le professeur essai, générant une réponse de l'image présentée à l'oeil, à l'informatique, ce qui est un délai d'environ 100 millisecondes. Procédé de mesure d'une réponse qu'ils multicanaux électrode implantée dans diverses régions du cerveau de singes, en mesurant l'influx nerveux aux électrodes afin d'afficher une tache lumineuse dans les résultats du test de dessin, la composition d'un certain nombre de points lumineux sur les flocons de neige des résultats de mesure. Par quatre images en trois régions différentes des résultats de mesure, il est clair que la réponse IT 100 délai milliseconde. Elle reflète également, en réponse à la même catégorie, ils les différentes régions d'image ne sont pas les mêmes.

Après avoir testé un grand nombre d'images, professeur a constaté que différents types d'information sur l'image globale du niveau d'intensité de la réponse est différente (autres neuroscientifiques ont également étudié la réponse neuronale à un endroit spécifique est de savoir comment le changement). Pour le mode de réponse, chaque cellule IT sont différentes, chaque réponse est pas exactement la même, sur un PPT en réponse à nerf entraîné dans la neige, la neige n'a jamais été exactement la même chose ne se produit pas.

Dans le processus, certaines personnes essaient différentes régions neurales diffèrent quant à l'intensité des objets de différentes catégories de réponse, alors constaté en effet la « perception des cellules nerveuses du visage », en général, une réponse plus aux visages humains, mais ils sont différents images faciales des réponses différentes, de l'autre catégorie ne sont pas sans réponse. Par conséquent, ces cellules ne sont pas en stricte conformité avec la catégorie d'objet de reconnaissance pour distinguer les cellules qui sont caractéristiques du complexe obtenu dans certaines études présentées.

Caractéristiques de l'IT d'étude

Il y a ces résultats à l'avenir, un professeur de l'équipe de recherche a commencé à être en proie à une série de problèmes: comment expliquer les tests de comportement de mauvaise identification qui apparaissent dans les caractéristiques de réponse des cellules nerveuses? exposition biologique comportement extérieur doit être soumis à l'impact du mode de réponse neuronale, alors comment trouver cette relation? nerf sortie secteur informatique a dix millions, mais aussi lire les signaux des dix millions de cellules nerveuses?

Les méthodes suivantes utilisées pour l'industrie de CV seront familiers avec certaines des personnes. Tout d'abord l'IT réponse quantitative à la cellule, le signal de réponse des cellules de mesure de n peut être mesurée pour chaque mode d'image en réponse à l'entrée de n cellules pour obtenir un espace de caractéristiques à n dimensions représentation vectorielle; groupe que l'espace n-dimensionnel le nombre est le nombre de fonctionnalités disponibles. Ensuite, une autre image contenant l'image de visage / mode de réponse n'est pas la mesure de l'image du visage, vous pouvez essayer de trouver si un classificateur linéaire est un point caractéristique dans l'espace.

Ici, encore une fois il a fait référence au professeur dans le cerveau des animaux électrodes implantées chirurgicalement. Les différentes régions de la pluralité d'électrodes, chaque électrode 96 peut acquérir un chemin de signal (96 broches), et un procédé pour faire un grand nombre d'expériences et d'autres parties constituées de l'espace de données informatique de dimension très élevé. La quantité de données obtenues par rapport à la période précédente de-électrode unique a aussi une augmentation explosive.

Avec un tel procédé, la région en réponse à l'image, il peut construire un vecteur de réponse très grande dimension, comme représenté sur la figure, environ 100 à 1000 sur les cellules nerveuses mesurées vecteur de caractéristique 8 est devenu image dessinée apparence (long), vert pour une réponse élevée, noir représente une réponse faible. Ils ont mesuré le genre 2000 vecteur de l'image, il n'y a aucune raison de tester une plus grande variété de fonctionnalités avec des mesures similaires faites à plusieurs reprises environ 50 fois pour obtenir un signal très élevé par rapport au bruit.

De cette façon, la qualité du modèle de réponse des cellules nerveuses obtenu peut devenir IT peut affecter la formation de preuves solides des décisions sur le comportement des animaux. Procédé pour le décodeur linéaire, le vecteur de réponse des neurones de le faire des prévisions sur le comportement reconnu de manière erronée, le comportement des résultats obtenus avec la mesure directe du degré de coïncidence est très élevé. De la même façon une réponse à la rétine ne parvient pas à atteindre ce niveau de résultats prévus (ce qui montre également la catégorie corrélation de réponse des cellules IT).

Le professeur a une découverte intéressante: il n'a pas besoin d'un grand nombre de cellules nerveuses de mesure des caractéristiques de la performance humaine peut atteindre, environ 500 suffit. modèles Vision par ordinateur chaque fonction contribution contemporaine au modèle de performance est beaucoup plus petit, beaucoup de caractéristiques humaines pour atteindre des performances similaires. Ceci illustre la capacité visuelle de comprendre les animaux est probablement pas élevé par la dimension d'un support de jeu de fonctionnalités, le modèle de calcul peut être simulé avec cette ligne de pensée. Ils disposent contiennent environ dix millions de cellules nerveuses de la production, mais aussi offrir un certain nombre de dimensions inférieures à 1000.

D'autre part, étant donné que la réponse informatique des cellules nerveuses dans un espace à n dimensions, la capacité de travailler sur le nombre de groupes est le nombre d'espace de dimension n, qui est, la taille de la catégorie informatique utilisée pour caractériser ensemble de fonctionnalités est combien? les recherches sur l'utilisation du mode de réponse neuronale de régression linéaire, obtenir l'ensemble des fonctionnalités, représentée par l'ensemble des caractéristiques du vecteur de réponse neuronale, et enfin avec une telle tentative schématique d'identifier les comportements ne permettent de prédire, le résultat est la taille de l'ensemble des fonctionnalités pour atteindre 500 quand il peut exactement elle prédit. Cette constatation est très alarmante, nous avons obtenu les mêmes numéros de différentes façons. Cela prend également en charge les bases de TI pour soutenir une variété de tâches de reconnaissance d'objets. Certaines personnes figurent ce groupe de recherche, a étudié plusieurs années d'études avec lui.

En résumé, l'espace de représentation informatique est la capacité d'identifier les bases biologiques potentiel, avec un simple linéaire classificateur pour faire face à la plupart, sinon tous les défis de reconnaissance d'objets. groupe nerveux IT est un ensemble de fonctionnalités de base relativement fixe, presque pas de formation inverse peut être utilisé pour remplir de nombreux objets tâches connexes.

Dans la compréhension des caractéristiques de la cellule informatique du futur, plus pratique et plus en profondeur viendra demander: comment est juste assez 500 de la cellule IT se caractérise par la formation de nerf? Ils sont la base de la façon dont la rétine à partir du signal progressif sur l'abstrait? Ces méthodes de calcul dans le processus de croissance humaine où ils viennent? Si nous pouvons étudier ces problèmes, et il sera d'une grande aide au professeur de but de l'équipe. Leur but est de trouver les moyens de construire un modèle de codeur, une image, une couche intermédiaire de sébum sont prédire avec précision le modèle de réponse groupe nerf correspondant, le problème est juste les questions clés de la configuration du système.

Ils peuvent expliquer comment construire un réseau informatique fonctionnalités

Au moment de tous les résultats de la recherche sur la fonction des cellules nerveuses de classe V1 a été bien expliqué et modèles, mais ils ne sont considérés comme un modèle d'alimentation en avant, mais quand il est utilisé pour expliquer la réponse V1 peut-être déjà plus de 50 % de conformité, mais pas une bonne approximation d'une variété de modèle informatique pour l'informatique en réponse, seulement un maximum de 20%. Ainsi, les modèles sont très mauvaise performance à ce moment-là.

Ensuite, le professeur introduit certains modèles apparus au cours de l'étude avaient mimétique système visuel des primates, formant un vecteur caractéristique à partir des images d'entrée à travers une variété de méthodes, puis à la fin il y a un classificateur linéaire (catégorie d'objets disponibles). Selon les résultats de recherche sur le cerveau actuel, nous devons limiter le fonctionnement du cerveau et une certaine compréhension, de sorte que ces modèles comme le cerveau il y a place pour filtre local, convolution, non linéaire critique, mise en commun non linéaire, régularisation, etc. , les sorties des modèles traités par ces méthodes. Le premier réseau de neurones est proposé par Fukushima en 1980, puis continuer à améliorer grâce à la recherche Tomaso Poggio, David Cox, Nicolas Pinto et d'autres, nous sommes arrivés au professeur modèle HMO et ses élèves fini ensemble.

Il est un modèle de réseau de neurones profond pour imiter les quatre niveaux du système visuel humain, beaucoup de gens qui connaissent bien les caractéristiques du filtre de convolution de vision par ordinateur et ainsi de suite. D'autres neuroscientifiques font souvent une simulation de cellules nerveuses restauration complète, mais ils est de trouver un modèle artificiel d'architecture plus efficace dans les limites connues. HMO dans la base informatique sur cette mimique humaine, avec la performance humaine a été une précision similaire.

Ils disposent alors dans la partie de la représentation du modèle de l'informatique et de la réactivité du nerf réel apportent à faire la comparaison correspondante. performance du premier et humain a été similaire dans la précision de la reconnaissance.

Ensuite, pour adapter l'impulsion spécifique des cellules nerveuses dans certains domaines de l'informatique, par rapport au modèle précédent EXPLIQUE seulement 20% du changement dans la forme du BGL a été grandement améliorée, environ 50%. Cela montre la mesure d'expliquer la couche cachée du modèle est également très élevé.

Neuroscientifiques conçu comme un modèle, il n'y a plus une boîte noire, son fonctionnement interne de la fonction du cerveau humain et correspond bien. Non seulement est, V4 prévision du cortex visuel a également atteint un nouveau sommet. graphique des données ne sont pas la catégorie du réseau n'a jamais vu, et les résultats montrent que la généralisation du modèle, « prévisions ».

Professeur montre la carte d'un tel, dans le processus de recherche convolution de réseau de neurones, les capacités de reconnaissance d'objets du réseau lui-même est un indicateur important de performance, et en fait plus la capacité à mieux identifier le pouvoir explicatif du modèle de réponse informatique; HMO un tel modèle de l'évolution des performances en même temps, le pouvoir explicatif des performances informatiques a également atteint un nouveau sommet (l'année 2012).

Ce temps de développement est plus intéressant, bien que les objectifs de recherche sur le cerveau et les sciences cognitives et de vision informatique sont différents, mais ils font les choses ont commencé à converger, il est de trouver des moyens pour les modèles de construction les plus performants possible.

En 2013, lorsque la performance d'identification a été balayé les réseaux de neurones profonds AlexNet et pouvoir explicatif de répondre neurones informatiques ont plus que leur HMO. Le professeur alors avait aussi à remercier du fond du cur, les aspects techniques profondeur du développement du réseau de neurones, un bon modèle pour aider les neuroscientifiques mieux comprendre les principes du cerveau humain.

De nouvelles différences par rapport au réseau de neurones

Mais les neuroscientifiques peuvent attendre mieux et une meilleure performance du modèle de réseau de neurones, ils peuvent se réjouir de compter davantage et une meilleure compréhension des modèles de reconnaissance humaine de celui-ci? En fait, non, enseigner leur propre point orange modèle de laboratoire, avec les progrès du modèle, la performance de la reconnaissance et l'interprétation des performances ont été améliorées, mais les modèles récents de mise au point d'apprentissage machine améliorent seulement la performance de la classification d'image, de sorte que la performance de classification l'augmentation, la capacité d'interpréter la réponse cellulaire a diminué.

Mais dans l'ensemble, les deux domaines pour atteindre à chaque étape du traitement de neurones sont de bons résultats des modèles prédictifs. Les modèles de comportement, puis Réajuster la profondeur de CNN, en fait, est très similaire, mais une plus grande précision et dans l'ensemble dans les coins avec le regard humain, en plus des résultats de cette figure Inception v3, l'autre trop comme la performance de CNN.

Afin de poursuivre des recherches approfondies, des principes d'analyse qu'ils recueillent et des singes avec AMT crowdsourcing plus de données, de sorte que vous pouvez observer des données à grain très fin, identifier correctement l'image ou pas identifier correctement pour chaque paire, de comportement analyse d'angle.

Granularité très fine, le singe et la performance humaine était encore très proche. Mais l'image de la stabilité entre les performances / fonctionnalités termes de réglage, CNN sur la différence entre les humains et les singes sont très grandes.

Le professeur croit manquer une certaine structure du modèle. Probablement parce que la modélisation seul modèle et anticipatrice commentaires ne sont pas modélisés, ce qui dans les modèles de primates sera une CNN comportement observé.

Dans la dernière étude, le test est également utilisé dans la vision informatique des données d'image set community aide de MS Coco, ils ont mis l'image en deux classes en fonction du résultat de test, l'un est le système de vision par ordinateur pour atteindre le niveau des primates (CV-résolus ), et l'autre est la performance ne répondait pas aux, puis mesurer le vecteur de réponse des cerveaux IT en essayant de trouver pourquoi.

Ensuite, ils ont constaté que, pour les images de vision par ordinateur montrent le niveau humain (point rouge) n'est pas atteint, le temps de réponse des TI dans une plus importante, avec un délai moyen d'environ 30 ms (par rapport à obtenir l'image au niveau humain, points bleus). Ils pensent qu'il est dans 30ms celles du cerveau humain, mais il n'y a pas de structure dans le travail de réseau CNN, comme la rétroaction multiple.

Il y a aussi une conclusion intéressante est que le réseau d'alimentation en avant CNN pour expliquer la capacité de la population des cellules nerveuses pour produire une image en réponse au temps plus court passé dans la plus forte dans l'informatique, entraînant un temps de réponse plus passé en IT plus d'images faible; courbe de la figure. Cette structure doit avoir la rétroaction du modèle, l'angle de la structure cyclique des deux domaines de recherche ont soulevé de nouveaux défis.

Mais le professeur a dit que ce but n'est pas nécessaire industrie du CV qui doit prendre les commentaires ajouter aussi si simple, mais ces résultats révèlent un certain nombre de problèmes à étudier pour la recherche future.

Professeur de discours a fait un résumé général: industrie du CV et de la communauté scientifique sont des aspects du mécanisme du centre névralgique de l'objet de la perception ont fait une grande contribution à la compréhension. Pour les études futures vont, mon professeur a également proposé une nouvelle structure, un nouvel outil de recherche pour étudier le système visuel pour construire le cours et ainsi de suite.

A la fin du discours, le professeur dans le passé grâce aux chercheurs, aux étudiants et ses collègues, les sponsors, et l'expérience ont contribué leur cerveau de singes. En particulier, grâce à la présence de vous, non seulement parce qu'il a été invité à venir, mais aussi parce que les résultats du secteur des CV est aussi une grande source d'inspiration pour leurs recherches.

session de Q & A

Question: Les méthodes d'apprentissage de la machine ont l'apprentissage migrée, peut avoir un réseau formé, les couches finales de recyclage réseau de reconnaissance d'objets avaient jamais vu auparavant. Apprenez à identifier comment les objets jamais vu le système visuel humain sont la formation? Il ajoutera de nouvelles fonctionnalités dans les TI?

Réponse: il est pas certain à quel point l'ensemble des fonctionnalités de l'informatique est une partie naturelle de la quantité de formation est sorti. Toutefois, les animaux adultes pour les tests, l'apprentissage nouvelle catégorie prend environ un jour. Après avoir appris après 20-30 nouvelles catégories espace caractéristique Nouvelle analyse informatique est la même, nous croyons que le changement à un processus de transfert plus tôt, la nouvelle catégorie est placé dans l'espace original dans le nouvel emplacement.

Question: Comment voyez-vous maintenant quelques plus de 100 couches du réseau de neurones, comparables entre eux et le réseau de neurones humains ne?

A: Comme, plus profondes tâches de test de performance du réseau de mieux en mieux que je viens d'évoquer, mais l'interprétation de la réponse de la cellule informatique de conformité en plus bas. Sans structure du modèle de prescription, mais la tâche d'optimisation continue, alors, est-ce la tendance à former la différenciation telle. Mais en fait, quatre domaines visuel des primates est également probable que chacun d'eux est composé de plusieurs couches, et nous essayons de les mettre dans chaque couche et chaque couche de CNN ne correspondent. A cet égard, je vous une spéculation commune, mais maintenant, nous sommes également à l'étude, il est pas tout à fait clair.

Question: CV difficile d'identifier l'image ne présente pas de caractéristiques particulières qui les ont amenés difficiles à identifier?

R: Nous avons également fait un retour pour vérifier les photos des variables actuellement pas en mesure de trouver une raison spécifique, aucune particularité de ces images.

Question: Depuis combien de temps le temps de goûter différentes couches? Combien de temps retardé le transfert de signaux entre les couches visuelles primates ont?

R: Au début de l'espace caractéristique de présentation est 100ms, derrière la présentation du signal IT temps de retard est 10ms, afin de montrer la courbe de changement. Ensuite, entre les couches est sans délai fixe, neuroscientifiques en fait, peut-on penser une impulsion de cellules nerveuses est significative, mesurée dans notre étude que le comportement de l'informatique, de l'image donnée pour générer le comportement a aussi un retard de quelques dizaines à 200ms. Comme V1 à V2 à V4 entre le temps peut être sur un tout autre ordre de grandeur, mais parce que nous ne sont pas spécialisés dans ce domaine, donc nous ne pouvons dire tant de.

Question: Avez-vous vous en doutez des informations de retour sera quoi? pure conjecture

A: Pour moi, cette question est comme me demander il y a courant d'alimentation dans quelle information est la même, difficile à décrire avec le langage humain. Je pense que leur rôle est possible par voie de circulation du réseau dans un profond encapsulé plus petit espace, basé sur ce que je vois, je pense que oui. Mais je ne suis pas sûr que tous la boucle de rétroaction et sont utilisés pour calculer, pour le raisonnement, ils peuvent également être utilisés pour l'étude, pour maintenir l'apprentissage en boucle, et cela peut nécessiter un temps plus long que 30ms. Si vous voulez savoir exactement, alors, nous avons besoin de mettre à jour les outils pour établir une distinction entre les types cellulaires faire, afin de mesurer avec précision la différence entre leurs signaux. Voilà pourquoi nous sommes sur la section de pointe. Donc je suppose où le rôle des cycles d'apprentissage et empaqueté dans un petit espace, un réseau plus profond. Est tout à fait la spéculation, je vous remercie de me donner l'occasion de deviner

Question: tâches de classification grains fins ont quoi que ce soit à l'étude? Par exemple, au lieu de classer les chiens et les chats, mais une classification plus détaillée de certains chiens, des chats, ces aspects de la performance humaine est aussi bonne

R: Regardez la différence entre moins classification grains fins dans un court laps de temps nous mesurons les évaluations de l'informatique. Il devrait être des tâches grains fins chez l'homme ont encore besoin de recueillir des informations plus détaillées pour pouvoir distinguer, les informations ultérieures du niveau actuel des cellules nerveuses aussi ne peut pas dire la différence.

Question: Comment les cellules nerveuses pour terminer le travail « de convolution »?

R: En fait, je le dis souvent, « réseau de neurones de convolution » ne peut pas être écrit, parce que le cerveau ne fonctionne pas. Mais vous pouvez voir les hypothèses de manuels ouverts dans les différentes parties de la zone visuelle ont la même fonction de Gabor. Certains diront que cela est une sorte d'opérations de convolution ne pas, mais en fait, devraient se poser est, pourquoi la fonction Gabor jouera le rôle de convolution. Circonvolution réseau de neurones des réseaux, nous avons mis en place une couche séparée des opérateurs de convolution et convolution, différentes du cerveau, on peut dire le cerveau pour essayer d'apprendre à synchroniser convolution. Je pense donc que le cerveau a besoin d'apprendre cette fonction, les caractéristiques statistiques de l'étude et dispose également d'convolution réseau est similaire, il peut être utilisé de deux façons différentes d'apprentissage, et, finalement, obtenir des filtres similaires. Donc, à mon avis, il n'y a pas une couche de convolution cérébrale spéciale, mais finalement obtenir l'effet de convolution. J'espère que vous pouvez comprendre ce que je veux dire.

(Fin)

Récemment, il y a de nombreuses conférences universitaires de niveau supérieur, il y aura beaucoup de conférences académiques merveilleux. Les lecteurs intéressés Veuillez continuer à se concentrer sur Lei Feng réseau AI Technology Review.

Dwayne Johnson incarnation du Père Noël atterrissage, « Entertainment Weekly » et aussi une poignée de peau Happy Camp Salut
Précédent
Pourquoi les mots du médecin sont illisibles? L'original était vraiment justifié
Prochain
Apprenez à vous comment maîtriser le couteau précis du jour de la nouvelle année
premier sommet de la chaîne d'approvisionnement automobile intelligente de Shanghai Auto Show a frappé, Visteon, Bosch Tencent et d'autres lourds 11 invités ont annoncé
« Star Wars 8 » fichier officiellement 5ème Janvier! Dans la science-fiction espace ouvert chef-d'oeuvre, l'avenir créatif Chine
Huawei Wang Yinfeng: la sagesse et la connectivité complète sont la clé pour ouvrir la porte à l'avenir du PC
"Intérêt Wilderness" Link et moto ajoutant "course Mario 8 Deluxe Edition"
débuts domestique StarVR, comment casques expérience 5K + 210 champ degré d'angle de vue? | ChianJoy 2017
version de l'affiche « Fée II » exposée « banlieue Simon » pour enseigner à votre population démon « hors du démon »
Vrai ou faux? ! « EVA nouveau film » Les quatre premières années libérés au printemps 2020!
Chongqing mode chaud fantaisie Zoo est activée, ils se fondent je vous envie « maison heureuse graisse »
Après oublié dans l'espace de Maserati a été vidé trois 90 suspects ont été arrêtés: Voulez-vous installer leur propre voiture, vendue inappropriée
cricket système de commande de mode de coulissement adaptatif d'inversion dynamique
2018 classement des investissements mondiaux de R & D a annoncé: Cette liste des entreprises chinoises beaucoup