Tout comme le monde physique, comme la fa�on dont il est difficile de pr�dire l'homme? Les nouvelles m�thodes d'apprentissage de la machine � surmonter ce probl�me est

( � MIT Technology Review � dans la version anglaise de l'APP est maintenant en ligne, l'utilisateur technologie abonnement annuel Anglais en classe hebdomadaire en direct, la science et la technologie ainsi que les communaut�s d'apprentissage en anglais oh ~)

Un merci sp�cial � MIT �tudiant au doctorat Wu Jiajun a contribu� � cet article

Massachusetts Institute of Technology (MIT) professeur de sciences du cerveau et cognitives Joshua Tenenbaum (Josh Tenenbaum) est le cerveau de l'�cole, la pens�e, la machine Research Center (Centre de cerveaux, les esprits et machines) d�veloppement de la recherche intelligente directeur. Le Cross College, plateforme de recherche interdisciplinaire d�di� � l'exploration, l'interpr�tation et copie l'intelligence humaine.

, Le Tenenbaum et son �tudiant au doctorat Wu Jiajun Dans l'Assembl�e g�n�rale Neural Information Processing Systems (PNM) de cette ann�e a publi� quatre documents, Discute l'agent ce qui doit la capacit� cognitive de base pour �tre en mesure d'explorer le monde, y compris la distinction entre les diff�rents objets, et l'objet va d�duire quelle r�ponse � apporter � la quantit� physique appliqu�e.

Les chercheurs croient que la capacit� de construire un syst�me informatique appartenant � l'�tape pr�c�dente � pas, ils finiront par �tre en mesure d'aider � trouver sur le d�veloppement intellectuel de l'humanit� � diverses �tapes de ce que l'information est de savoir comment traiter le probl�me. Dans ce processus, les chercheurs peuvent m�me trouver des id�es nouvelles pour le syst�me de vision du robot de recherche.

" Le th�me commun de tous ces projets de recherche est d'essayer de se sentir vraiment l'ordinateur physique � Tenenbaum estime que � Pour ce faire, l'ordinateur doit d'abord r�tablir la pleine forme en trois dimensions de l'objet, et l'analyse de ces objets vivants dans la sc�ne et leurs relations, ainsi que ses propri�t�s physiques telles que la masse et la friction, apr�s de d�duire comment ces objets changeront au fil du temps. Jiajun de quatre documents discut� la question. Trois documents o� discuter de la fa�on de d�duire la structure physique de l'objet � partir des donn�es visuelles et audio, l'autre est discut� de la fa�on de pr�dire la performance de l'objet dans ladite base de donn�es. Ensemble, nous pouvons commencer � construire certains mod�les de calcul de la cognition humaine pour mieux d�crire le monde physique. "

La ligne � deux voies

Un autre facteur dans les quatre documents ensemble, ils utilisent une m�thodes d'apprentissage de la machine. l'apprentissage de la machine est un moyen de laisser l'ordinateur analyser de grandes quantit�s de donn�es pour faire une formation technique pour effectuer des t�ches informatiques. Dans un syst�me d'apprentissage de la machine traditionnelle pour les donn�es de formation est marqu�e � l'avance, le syst�me essaiera de figurer ces donn�es avec laquelle l'�tiquette est associ�e l'analyse de l'apprentissage. L'�valuation d'un apprentissage standard de la machine, l'ordinateur correctement marqu� � l'avance le volume de donn�es non marqu�es .

Dans leur article, syst�me de formation est utilis� pour d�duire le mod�le physique du monde - d�duit comme la forme en trois dimensions d'une la plupart du temps cach� de la vue de l'objet. Apr�s l'utilisation du mod�le est invers�, la sortie du mod�le de syst�me en utilisant la resynth�se de donn�es d'entr�e, et par la mesure des donn�es originales et des donn�es reconstruites pour correspondre au syst�me d'�valuation du niveau d�duit.

Par exemple, le mod�le en trois dimensions la construction d'un besoin d'un abri pour analyser tous les objets de blocage et de lib�ration, mais aussi de filtrer les textures visuelles, les reflets et les ombres de l'objet, et d'�tre en mesure de d�duire la forme de l'objet en dehors du champ de vision. Lorsque le mod�le du syst�me Wu Jiajun et Tenenbaum, le syst�me doivent �galement tourner dans un espace � trois dimensions de mod�le � un emplacement sur l'image, et d'ajouter de la texture visuelle au mod�le, jusqu'� ce que finalement � peu pr�s les donn�es d'image d'entr�e.

En fait, quatre documents chercheurs ont discut� de la complexit� du mod�le en deux dimensions � d�duire de donn�es d'image. Ces documents co-auteur, ainsi que quatre autres chercheurs du MIT, y compris l'ing�nierie �lectrique et informatique professeur William Freeman (William Freeman), ainsi que des chercheurs de DeepMind, Universit� de Shanghai des sciences et de la technologie et de l'Universit� Jiaotong de Shanghai .

Diviser pour mieux r�gner

La th�orie est bas�e sur un MIT neuroscientifique tr�s influent David Marr (David Marr) Le syst�me mis en place. Mar mort pr�matur�e en 1980, seulement 35 ans. Selon l'hypoth�se de Marr, le cerveau lors de l'interpr�tation d'une sc�ne visuelle, va d'abord cr�er un 2.5D � croquis � est utilis� pour repr�senter visible � la surface de l'objet. Puis, � partir de la 2.5 dimensions � projet � sur (au lieu de l'information visuelle originale bas�e sur la sc�ne), le cerveau continue � d�duire la forme tridimensionnelle compl�te de l'objet vu.

" Ces deux questions sont difficiles, mais au moins nous avons une bonne fa�on de les briser � Wu Jiajun a dit, � de sorte que vous pouvez traiter des probl�mes � la fois, plut�t que de les r�soudre, ce sera plus difficile. "

Figure Shuwujiajun 2010, est dipl�m� de la Haute �cole Attach� � East China Normal University deuxi�me, a remport� l'Olympiade nationale en informatique prix a march� � l'Universit� de Tsinghua, a �tudi� � l'�cole des sciences informatiques et d'information traversant la classe exp�rimentale (les fameuses classes Yao). Il est �tudiant au doctorat de quatri�me ann�e au MIT, a publi� plus de 20 articles sur CVPR, NIPS, ECCV, PAMI et d'autres conf�rences et revues, a remport� la bourse d'�tudes de classe, l'Universit� de Tsinghua, Baidu bourse, bourses Facebook

Wu Jiajun et ses collaborateurs comprenant un mod�le de donn�es en trois dimensions de l'objet en utilisant l'image de l'image visuelle et le syst�me de formation. Pr�cis mod�le en trois dimensions pour construire des images r�elles de l'objet prendra trop de temps, donc dans les premi�res �tapes, les chercheurs ont utilis� les donn�es pour former le syst�me. Dans lequel, � partir des donn�es d'image obtenues par le rendu mod�le en trois dimensions. L'ensemble du processus de cr�ation des donn�es et cr�er film d'animation par ordinateur sur le m�me.

Une fois le syst�me de formation pour apprendre les donn�es combin�es, la pr�cision peut �tre plus �lev� et les donn�es du syst�me en utilisant la formation proprement dite et l'apprentissage. Syst�me d'�valuation final de l'exactitude du syst�me d'apprentissage rebuild comparaison des donn�es d'entr�e r�g�n�r�.

Lorsque le syst�me d'�valuation, les chercheurs ont utilis� une m�thode d'�valuation commune et nomm� birapport. En vertu de cette mesure, leur syst�me est meilleur que la g�n�ration pr�c�dente. D'autre part, en raison du rapport de la croix et pas bien d�crire les d�tails locaux du mod�le, Wu Jiajun et ses coll�gues utilisent �galement la m�thode de crowdsourcing, ce qui permet aux utilisateurs d'�valuer la pr�cision du mod�le de l'objet source dans la reconstruction de l'image. 74% des participants estiment que les r�sultats de reconstruction du nouveau syst�me est mieux que la g�n�ration pr�c�dente.

Yong est conduite de flux de temps

Dans Wu Jiajun et Tenenbaum, un autre document Freeman, ils ont form� un syst�me pour analyser le bruit des chutes d'objets, pour en d�duire la forme de l'objet, le mat�riau et la hauteur de sa chute. Impliqu� dans l'�tude ainsi que le MIT, l'Universit� de Cambridge et de l'Universit� de Shanghai des chercheurs de technologie. En outre, le syst�me est form� pour g�n�rer un mod�le abstrait d'un objet, puis, � son tour, utilisez le mod�le pour simuler le son en cas de chute d'une certaine hauteur, il sera g�n�r�. La similitude entre le son synth�tis� et la source sonore, en fonction de la performance finale du syst�me.

Enfin, dans leur quatri�me dans le document, co-Wu Jiajun, Tenenbaum, Freeman, DeepMind et de l'Universit� d'Oxford pour construire un syst�me qui a commenc� � imiter l'intuition humaine sur la fa�on de comprendre le r�le des objets physiques. Supposons que le point de d�part de cette �tude est le r�sultat final de ces trois derniers documents d�crits: le syst�me a �t� suppos� que la forme tridimensionnelle de l'objet est d�riv�e.

Le papier utilis� dans des formes simples d'objets �tudi�s: Ball et cubes . Les chercheurs ont form� leur syst�me pour effectuer deux t�ches, avant tout est de permettre au syst�me d'estimer dans la table de billard vitesse de Voyage, de performance et de pr�voir la piscine apr�s la collision. Une autre t�che est d'analyser la pile de cubes d'images fixes, et de pr�voir ces cubes ne tombent pas, si l'automne, le cube tombe o�.

Wu Jiajun a propos� ce qu'il appelle sc�ne XML �Caract�risation du langage, peut �tre d�crire quantitativement les positions relatives des objets dans la sc�ne visuelle. Dans l'�tude, les r�sultats du syst�me d'apprentissage d'abord pour d�crire les donn�es entr�es dans cette langue, le syst�me sera fourni pour d�crire un � moteur physique �, le moteur physique peut �tre appliqu�e � l'�tude de la force physique sur les objets � construire le mode. Les deux moteurs de l'animation par ordinateur physique aussi une partie importante de l'informatique scientifique, dans une animation par ordinateur est utilis� pour d�placer un moteur physique, la g�n�ration d'un objet qui tombe comme des v�tements, dans le calcul scientifique, moteur physique ont �t� utilis�s � grande �chelle de simulation de la physique.

Apr�s la fin de la pr�diction de balle de moteur physique et le mouvement du cube, l'information sera envoy�e au moteur de rendu d'image. le moteur de rendu g�n�re la sortie sera � nouveau compar�e � l'image source. Comme les m�thodes utilis�es dans l'�tude de la reconstruction visuelle, les chercheurs ont d'abord donn�es synth�tis�es avec le syst�me de formation, puis d'affiner la pr�cision, en utilisant des donn�es r�elles pour former leur syst�me.

Dans les tests, le nouveau syst�me a �galement de meilleures performances que les syst�mes existants. Dans les exp�riences de pr�dire le mouvement de billard, le nouveau syst�me effectue souvent mieux que les humains.

� Ce travail dans le plus aper�u critique que l'utilisation d'outils physiques - renderer, moteur de simulation, le mod�le form� - pour former le mod�le g�n�ratif �, professeur adjoint des sciences informatiques, commentaires University of Southern California Lin Joseph (Joseph Lim), " Lorsque ce simple et des id�es �l�gantes combin�es � la profondeur de la derni�re et de la technologie d'apprentissage les plus avanc�es, nous voyons les grandes r�alisations faites dans l'interpr�tation de la machine d'un certain nombre de t�ches dans le monde physique . "

Route de la soie

Apprenez � conna�tre la Chine

Tout comme le monde physique, comme la fa�on dont il est difficile de pr�dire l'homme? Les nouvelles m�thodes d'apprentissage de la machine � surmonter ce probl�me est