Berkeley: r�seau de neurones modulaire apprentissage raisonnement complexe (articles)

Ji-won nouvelle compilation

Ji-won ouvert un nouveau num�ro public micro-canal, r�pondre directement � [] ou [NMN neurones module r�seau] 3 articles concern�s

Supposons que nous voulons �tre une famille de robot, nous esp�rons qu'il peut r�pondre � des questions sur l'environnement. Nous pourrions lui poser cette question:

A gauche: Qu'est-ce? A droite: la figure avec le cylindre bleu de la m�me taille de l'objet est de quelle couleur?

Comment pouvons-nous faire en sorte que le robot peut r�pondre � ces questions bonne chose � faire? �tude approfondie de la m�thode standard est de rassembler un grand nombre de questions, des r�ponses et des ensembles de donn�es d'image, puis former un r�seau de neurones pour cartographier directement le probl�me et la r�ponse. Si le probl�me est similaire � la gauche du probl�me, nous devons r�soudre le probl�me est une reconnaissance d'image famili�re, cette approche monolithique est tr�s efficace:

R�pondez � la question: Qu'est-ce?

Mais le genre de question, il est pas si simple:

R�ponse: cylindre bleu avec la m�me taille de l'objet est de quelle couleur?

Ici, nous formons le r�seau a abandonn� le traitement, avec la figure jusqu'� la couleur (bleu) comme une estimation. Pourquoi est-ce beaucoup de probl�me difficile? M�me si notre image est plus claire et concise, cette question doit encore plusieurs �tapes raisonnement : Il est pas un probl�me simple d'identifier l'objet principal dans l'image, le mod�le doit d'abord trouver le cylindre bleu, puis trouver un autre objet, il dit la m�me taille, puis d�terminer la couleur de l'objet. Ce calcul est complexe, mais aussi un calcul sp�cifique pour un probl�me sp�cifique est la question. Diff�rents probl�mes n�cessitent des mesures pour r�soudre.

L'�tude dominante en profondeur de paradigme est � taille unique � approche: nous voulons r�soudre tout probl�me, nous allons �crire un mod�le d'architecture fixe, en esp�rant qu'il capturerait tout au sujet de la relation entre l'entr�e et la sortie, et des Notes les donn�es de formation pour ce mod�le d'apprentissage des param�tres fixe.

Mais dans le raisonnement du monde r�el ne fonctionne pas de cette fa�on: il implique une vari�t� de capacit�s diff�rentes, m�langeant chaque nouveau d�fi auquel nous sommes confront�s dans le monde ext�rieur. Nous avons besoin d'un mod�le dynamique de la fa�on de d�terminer les questions soulev�es devant le raisonnement - un r�seau peut choisir leur propre structure en fonctionnement. Dans cet article, nous allons discuter d'une classe est appel�e modules de r�seau de neurones (r�seaux de neurones du module, NMNs) Le mod�le, qui peut �tre combin�e avec cette approche plus souple � la solution tout en maintenant une forte formation de la profondeur d'utilit�.

A �t� mentionn� pr�c�demment, trois �tapes diff�rentes impliqu�es pour r�pondre � ces probl�mes: trouver un cylindre bleu, et trouve la m�me taille que d'autres objets, la couleur de l'objet est d�termin�e. Ce processus peut �tre repr�sent� par le sch�ma suivant:

Une fois que le probl�me est modifi�, il pourrait conduire � une s�rie de diff�rentes �tapes. Par exemple, si nous demandons � ? La figure et la taille de la boule du m�me objet combien �, deviendront les �tapes:

Les op�rations de base, telles que � comparaison de taille �, des probl�mes diff�rents sont partag�s, mais l'utilisation de diff�rentes mani�res. L'id�e principale est de faire ce partage de NMN devient explicite: Nous utilisons deux structures de r�seau diff�rentes pour r�pondre � ce qui pr�c�de deux questions, mais les deux r�seaux d'inclure une partie du droit � la m�me masse de base est partag�e.

Alors, comment apprendre un tel mod�le? En m�me temps, nous sommes en fait la formation d'un grand nombre de diff�rents r�seaux, et essayer de combiner leurs arguments au moment opportun, au lieu d'un grand nombre d'entr�es / paire de sorties sur la formation d'un r�seau unique.

Figure: une architecture d'�tude approfondie r�cente, y compris DyNet et tensorflow Fold, sont calcul�s de la mani�re cette conception dynamique.

Apr�s ce processus de formation, nous obtenons pas un seul r�seau de profondeur, mais une collection � modules � de nerf (modules), chaque module impl�mente un raisonnement �tape. Lorsque nous voulons utiliser les mod�les ont �t� form�s sur la nouvelle question, nous pouvons combiner dynamiquement ces modules, ce qui en fait une nouvelle architecture de r�seau pour le probl�me.

Ce processus est int�ressant de noter que nous ne avons pas besoin pour assurer la surveillance de bas niveau en un seul module: le mod�le ne sera pas un exemple isol� des � objets bleus � ou relation � c�t� gauche � comme. Des modules d'apprentissage que dans la structure d'un portefeuille plus important, seule (question, r�ponse) jumelant la supervision. Cependant, le processus de formation peut corriger automatiquement la relation entre le raisonnement et les calculs dont il est responsable des composants de structure:

Probl�me: le m�me bleu et rouge sur le bloc-cylindres droite de morceaux m�talliques de mat�riel il?

Le m�me processus est aussi la r�ponse � travailler sur une image plus r�aliste, et m�me � d'autres bases de donn�es et d'autres sources de connaissances aussi le travail:

Question: Qu'est-ce qui se cache derri�re le pied du lit? Qu'est-ce que les plages de la Floride?

L'�l�ment cl� de ce proc�d� est tel que d�crit ci-dessus Une collection de � plan de raisonnement � de . Ces plans peuvent nous dire comment la mise en page du r�seau de chaque question devrait �tre, et comment ils se rapportent les uns aux autres probl�mes diff�rents. Mais ces plans viennent de lui?

Dans les travaux pr�liminaires sur ces mod�les, nous avons trouv� une corr�lation frappante entre probl�me de conception la r�solution et la structure grammaticale analytique d'un probl�me particulier (sp�cifique � la question) du r�seau de neurones. Linguistes ont longtemps trouv�, �troitement li�e au calcul de l'ordre des �tapes n�cessaires � la grammaire des probl�mes et des questions de r�ponse (s�quence). Merci aux progr�s r�cents dans le traitement du langage naturel, nous sommes en mesure d'utiliser les outils existants d'analyse de syntaxe pour fournir automatiquement des versions similaires de ces plans.

Cependant, la structure du langage cartographi�e pr�cis�ment au probl�me de la structure de r�seau reste un processus de transition stimulant sujettes � l'erreur. Dans une �tude ult�rieure, nous ne comptons plus sur cette analyse linguistique, mais l'utilisation de donn�es cr��es par un expert humain qui a r�alis� un plan pour commenter le raisonnement id�alis� comme une s�rie de questions directes. En apprenant � imiter l'approche humaine, nous pouvons am�liorer consid�rablement la qualit� des pr�dictions du mod�le. Encore plus surprenant est que, lorsque nous avons utilis� un mode pour une simulation de formation d'experts humain et permet le mod�le de pr�dire leurs propres modifications � ces experts, il est possible de trouver des experts meilleure solution que sur de nombreuses questions.

Bien que ces derni�res ann�es, la profondeur de l'apprentissage a beaucoup de succ�s notables, mais il y a encore de nombreux d�fis, tels que apprentissage quelques-shot et le raisonnement complexe . Mais ces probl�mes pr�cis�ment les techniques classiques plus structur�es, telles que l'analyse s�mantique (analyse s�mantique) et le programme d'induction (induction du programme) place qui fonctionne vraiment. module de r�seau de neurones (NMN) dans ces deux d�fis ont des avantages: une combinaison discr�te de donn�es de flexibilit� et d'efficacit�, la profondeur et la capacit� de r�seau. NMN a r�ussi � de nombreuses t�ches raisonnement visuel et textuel, nous attendons avec impatience de l'appliquer � d'autres probl�mes AI.

Cet article est bas� sur des documents (Ji-won ouvert un nouveau num�ro public micro-canal, r�pondre directement NMN [] ou [] T�l�charger le papier module de r�seau de neurones):

R�seaux Module neurales. Jacob Andreas, Marcus Rohrbach, Trevor Darrell et Dan Klein. CVPR 2016. (arXiv)
Apprendre � Compose Neural Networks pour Question R�ponse. Jacob Andreas, Marcus Rohrbach, Trevor Darrell et Dan Klein. NAACL 2016. (arXiv)
Les relations de mod�lisation dans r�f�rentielle expressions avec des r�seaux modulaires de composition. Ronghang Hu, Marcus Rohrbach, Jacob Andreas, Trevor Darrell et Kate Saenko. CVPR 2017. (arXiv)

Auteur: Jacob Andreas

Collaboration �crivain: Ronghang Hu, Marcus Rohrbach, Trevor Darrell, Dan Klein & Kate Saenko

Route de la soie

Apprenez � conna�tre la Chine

Berkeley: r�seau de neurones modulaire apprentissage raisonnement complexe (articles)