�Ji-won nouvelle compilation

Source: DeepMind

Compile: Marvin

[New Ji-won EXAMEN Les derni�res recherches, a r�cemment publi� propos� "th�orie de la machine d'esprit" DeepMind (Machine Theory of Mind), "th�orie de l'esprit" Inspir� par des chercheurs en psychologie construit un r�seau de neurones TomNet une th�orie de l'esprit, et � travers une s�rie d'exp�riences pour prouver qu'il a la capacit� mentale. Ceci est le d�veloppement de syst�mes d'IA multi-agents, la construction de machines - une �tape importante dans les interm�diaires technologiques interaction par ordinateur humain, ainsi que de promouvoir le d�veloppement de l'interpr�tation AI.

Th�orie de l'esprit (ToM, Premack & Woodruff, 1978) fait r�f�rence � la capacit� humaine � comprendre l'�tat d'esprit de leur propre et d'autres, ces �tats psychologiques comprennent des d�sirs, des croyances, intentions et autres. les chercheurs ont tent� de former DeepMind une machine � construire un tel mod�le. Ils ont con�u une th�orie des r�seaux de neurones de l'esprit (th�orie de l'esprit du r�seau de neurones) - TomNet, le r�seau utilise m�ta-apprentissage pour construire un agent mod�le (agent) rencontr� en observant son comportement. Gr�ce � ce processus, TomNet acquis une solide mod�le a priori du comportement de l'agent, et l'utilisation de seulement un petit nombre sera en mesure de proc�der � une observation plus approfondie et les caract�ristiques psychologiques pr�disent le corps du renseignement de l'�tat. Les chercheurs ont un agent TomNet appliqu� � un simple environnement de r�seau, qu'il peut apprendre un algorithme pseudo-al�atoire et la profondeur de diff�rents groupes d'agents d'apprentissage de renforcement, et il a pass� le test des t�ches classiques de ToM, comme � test Sally-Anne � (Wimmer et Perner, 1983, Baron-Cohen et al, 1985). Les chercheurs pensent que ce syst�me - agent ind�pendant pour apprendre comment simuler ses autres agents dans le monde - est le d�veloppement de syst�mes d'IA multi-agents, la construction d'interm�diaires technologiques de l'interaction homme-ordinateur, ainsi que de promouvoir les progr�s de la grippe aviaire pourrait expliquer une �tape importante.

Inspir� par la th�orie de la � th�orie de la machine d'esprit � esprit humain

� l'heure actuelle, la profondeur de l'apprentissage et des progr�s accomplis dans la profondeur de l'apprentissage de renforcement, bien que passionnant, mais certaines personnes craignent que notre compr�hension de ces syst�mes sont insuffisants. Les r�seaux de neurones sont g�n�ralement d�crits comme bo�te noire opaque, inexpliqu�e. M�me si nous avons le poids de sa description compl�te, il est difficile de savoir qu'ils utilisent le mod�le, et o� ils peuvent se tromper. Avec l'IA de plus en plus dans le monde humain, la compr�hension de leurs besoins est �galement en croissance.

L'arr�t Let et demander: Pour un agent, la � compr�hension � un autre agent ce que cela signifie? En tant qu'�tres humains, nous sommes face � ce d�fi chaque jour, parce que nous sommes toutes les communications humaines autres caract�ristiques potentielles, de l'�tat et le processus de calcul potentiel est presque totalement inaccessible jour. Mais nous � comprendre � l'autre est tout � fait remarquable. Nous pouvons pr�dire le comportement futur des �trangers, et en d�duire leur connaissance du monde, nous pouvons planifier � interagir avec les autres, et d'�tablir une communication efficace.

Il y a un autre agent � compr�hension � Une caract�ristique importante est que la structure sous-jacente de leur v�ritable presque aucun agent de r�f�rence. Nous, les humains ne tentons g�n�ralement pas d'estimer l'activit� neuronale des autres, ils d�duisent comment le cortex pr�frontal est connect�, ou d'un plan d'aller � interagir avec d'autres carte de l'hippocampe humain. Un point de vue important de la psychologie cognitive est que notre raisonnement social d�pend du mod�le de haut niveau d'autres personnes (Gopnik & Wellman, 1992), qui ne comportait pas de mod�les abstractions d�taill�s m�canismes physiques sur la base de la description du comportement observ�, au contraire, nous compris que l'�tat mental des autres, comme leurs d�sirs, les croyances et les intentions. Cette capacit� est souvent d�crite comme la th�orie mentale (th�orie de l'esprit).

Dans cet article, nous nous inspirons de la th�orie de l'esprit des gens pour tenter de construire un autre syst�me de mod�lisation de l'agent d'apprentissage. Nous allons d�crire comme "Th�orie machine de l'esprit" (Machine Theory of Mind) . Notre objectif est de ne pas g�n�rer le comportement de l'agent mod�le propos� et inverser son algorithme. Au lieu de cela, nous nous concentrons sur la fa�on dont l'utilisation d'auto-apprentissage observateur des donn�es limit�es pour d'autres agents de mod�lisation. Cela nous permet de travailler avec diff�rentes �tudes ant�rieures, des �tudes ant�rieures reposent sur le mod�le du corps de l'intelligence artificielle, par exemple en utilisant un RL inverse, l'inf�rence bay�sienne, th�orie bay�sienne de la th�orie de l'esprit ou jeu. Au lieu de cela, nous apprenons mod�le d'agent, et comment ils raisonnent � partir de z�ro par m�ta-apprentissage.

Construire une riche machine flexible et performance �lev�e pour la th�orie de l'esprit AI est un �norme d�fi. Un point principal de cet article est que la majorit� des premiers d�fis de la construction ToM pourrait �tre consid�r�e comme un simple probl�me d'apprentissage, parce qu'ils sont repr�sent�s par la formule. Notre travail ici est de pratiquer le calcul de ces formules simples.

Ce travail a de nombreuses applications potentielles. Il est le mod�le d'apprentissage riche permettra d'am�liorer de nombreuses t�ches de (prise de d�cision) de prise de d�cision complexe multi-agents, en particulier dans le cas de la planification ax�e sur les besoins et le mod�le d'imagination. Ces mod�les sont �galement importants pour les ajustements de valeur et une coop�ration souple, et est susceptible d'�tre une partie de l'avenir de la machine de prise de d�cision morale. Ils sont �galement tr�s importants pour la communication et l'�ducation, peuvent jouer un r�le cl� dans l'interaction homme-ordinateur. Cette capacit� � g�n�rer des conditions de recherche peuvent �galement r�v�ler l'origine des capacit�s humaines. Enfin, ces mod�les peuvent devenir un moyen important pour la compr�hension humaine de l'intelligence artificielle.

Enfin, notre motivation est de faire une forte intelligence artificielle peut �tre expliqu�e comme des �tres humains. Nous sommes ici pour essayer une nouvelle approche: en essayant de construire le syst�me interm�diaire afin de r�duire la dimension du comportement de l'espace, et les montrer sous une forme plus compr�hensible, plut�t que l'agent modificateur de telle sorte que la structure interne de l'Etat est expos� � des formes de interpr�table humaine. Dans cette perspective, la poursuite de la machine ToM est d'�tablir l'absence d'interface entre machines et humaine attendue (interface manquante).

M�thodes: Exp�rimentale t�che m�ta-apprentissage

Nous consid�rons le b�timent comme une th�orie de l'esprit m�ta-apprentissage Probl�me. Lors des essais, nous esp�rons �tre en mesure de r�pondre � un nouvel agent que nous avons jamais vu auparavant, et ils ont une connaissance pr�alable forte et riche sur leur comportement. De plus, quand on voit l'agent au moment de son action dans le monde, nous esp�rons �tre en mesure de recueillir des donn�es sur ses caract�ristiques potentielles et l'�tat mental (apr�s la formation d'post�rieure), ce qui nous permettra d'am�liorer les pr�visions de leur comportement futur.

� cette fin, nous avons d�velopp� une t�che de m�ta-apprentissage. Nous avons construit un observateur (Observateur), il peut voir un nouvel ensemble de comportements � chaque agent de traces d'�pisode. L'objectif de l'observateur est de pr�dire l'agent de comportement futur. Pendant la formation, l'observateur doit former rapidement une pr�diction sur le nouvel agent � partir des donn�es limit�es. Ce nouvel agent sur � l'apprentissage � est ce que nous appelons m�ta-apprentissage. Gr�ce � ce processus, l'observateur doit aussi apprendre agent efficace le comportement avant, la connaissance capture implicitement les points communs entre l'agent de la population de formation.

Nous pr�sentons deux concepts pour d�crire les composants du r�seau d'observateurs et leurs r�les fonctionnels. On distingue entre la th�orie g�n�rale de l'esprit - poids du r�seau d'apprentissage, qui comprend des pr�visions sur l'ensemble de la formation comportement commun de tous les agents, et sp�cifique de l'agent � la th�orie de l'esprit - en observant la formation de � plongement agent � dans le test, il contient ce qui rend les fonctionnalit�s de l'agent et diff�rent de l'�tat mental d'un autre agent. Ceux-ci correspondent au comportement de l'agent et post�rieur avant.

La structure de cet article est une s�rie d'exp�riences qui augmentent progressivement la complexit� de la � th�orie de la machine d'esprit, � le r�seau (TomNet). Ces exp�riences montrent des id�es TomNet, ainsi que sa capacit� � apprendre d'autres agents mod�les riches, ces mod�les combine les caract�ristiques des caract�ristiques de la th�orie de l'esprit humain, comme la compr�hension de la fausse croyance.

Contribution: TomNet apprendre � pr�dire et expliquer les croyances

Dans cette �tude, les contributions sont les suivantes:

En 3.1, nous montrons pour le simple agent de hasard, TomNet appris � se rapprocher des propri�t�s d'agent � base bay�sienne du niveau optimal d'inf�rence.
En 3.2, nous montrons TomNet appris � d�duire la cible des agents algorithmiques des (quelques-contrechamp la mise en uvre efficace de l'apprentissage de renforcement), et comment ils �quilibrer les co�ts et les rendements.
Dans la section 3.3, nous montrons un agent d'apprentissage de renforcement profond pour caract�riser les diff�rents types de TomNet apprendre � capturer un facteur cl� dans la variation globale de la population, et la formation de l'intelligence abstraite int�gr�e dans ces corps. Nous montrons �galement que, TomNet peut d�couvrir de nouveaux espace abstrait comportement.
En 3.4, nous montrons que lorsque TomNet sont form�s � l'agent de profondeur POMDP d'action RL, il conna�t implicitement l'agent peut d�tenir de fausses croyances sur le monde. Ceci est la composante de base de la th�orie de l'esprit humain.
En 3.5, nous prouvons TomNet peut �tre form� pour pr�dire l'�tat des croyances de l'agent, et r�v�le clairement les fausses croyances de l'agent. Nous montrons �galement que, TomNet leur comportement peut �tre d�duit que d'une teneur en agent diff�rent peut �tre vu, et ils ont tendance � croire en fonction de ce contenu.

Figure 1. Architecture TomNet

Figure 2. Agent al�atoire agit d'exemples grille-monde

Figure 3. Formation sur TomNet Agent al�atoire

Figure 13. supervision ont la pr�vision de la foi

Pour plus de d�tails, reportez-vous � la th�se originale: https: //arxiv.org/pdf/1802.07740.pdf

[] Joignez-vous � la communaut�

Ji-won nouvelles technologies AI + industrie du recrutement communautaire, a accueilli les �tudiants + industrie de la technologie AI a atterri int�r�t, plus Little Helper Micro Signal: aiera2015_1 dans le groupe, si elle est approuv�e seront invit�s dans le groupe, assurez-vous de modifier le groupe apr�s avoir rejoint la communaut� remarques (nom - soci�t� - emploi, groupe professionnel d'examen plus rigoureux, s'il vous pla�t comprendre).

De plus, la nouvelle technologie AI + Yuan Zhi industries Communaut�s (auto intelligent, l'apprentissage machine, apprentissage en profondeur, les r�seaux de neurones, etc.) sont pour les ing�nieurs et les chercheurs sont engag�s dans des domaines connexes de recrutement.

Ji-won a ajout� une nouvelle plate-forme ouverte de la communaut� technique pour partager AI +

Route de la soie

Apprenez � conna�tre la Chine

perc�e AI: DeepMind construire une th�orie de l'esprit r�seau de neurones pour que la machine se comprendre

Inspir� par la th�orie de la � th�orie de la machine d'esprit � esprit humain

M�thodes: Exp�rimentale t�che m�ta-apprentissage

Contribution: TomNet apprendre � pr�dire et expliquer les croyances