RNN de faveur, enivrant d'apprentissage de renforcement, IPSC 2019 r�sum� des huit participants

AI Technology Review par: La semaine derni�re, la profondeur de l'apprentissage acad�mique haut IPSC 2019 conf�rence � la Nouvelle-Orl�ans a pris fin. Il est dipl�m� de l'Universit� de Stanford, maintenant � l'informaticien f�minin NVIDIA Chip Huyen a particip� � la r�union, parler de ses sentiments au sujet du sommet, elle voulait dire la chose suivante 8:00:

1. Inclusive

Le IPSC 2019 a mis en �vidence le r�le important de l'inclusion dans l'IA: Les deux premiers grands discours discours d'ouverture de --Sasha Rush et Cynthia Dwork a invit� des conf�rences - tout sur l'�quit� et l'�galit�. Une partie des donn�es soul�ve des pr�occupations:

Haut-parleurs et les participants, les femmes ne repr�sentaient que 8,6%, respectivement, et le ratio de 15%;

Les deux tiers des chercheurs LGBTQ + n'a pas assist� � une capacit� professionnelle;

L'invitation � l'Assembl�e g�n�rale un total de huit haut-parleurs, mais sont blancs.

Sasha discours d'ouverture de pointe d'un PPT

Malheureusement, cela ne semble pas attirer l'attention et de r�flexion des chercheurs d'Amnesty International. D'autres ateliers sont les foules, mais l'IA pour l'atelier bien social ne se soucie, cette situation semble avoir am�lior� la Yoshua Bengio. Parmi les nombreuses activit�s d'�change de IPSC j'ai particip�, personne n'a mentionn� la diversit� - jusqu'� ce que je demand� � haute voix pourquoi le parti voudrait me inviter ce n'est pas le temps pour mes activit�s scientifiques et technologiques, un ami m'a dit: " dire qu'il peut �tre un peu offens�, vous �tes venu ici parce que vous �tes une femme ".

Pour une raison quelconque l'existence de ce ph�nom�ne est - une sorte de non-sujet � technique �, ce qui signifie, m�me si vous passez plus de temps sur ce ne sera votre carri�re de recherche utile. Et en partie parce que l'atmosph�re sociale existe encore quelques probl�mes. Un ami m'a dit, ne pas ignorer le d�fi dans un groupe de chat mon peuple, parce que � il aime � se moquer de ceux qui discutent de l'�galit� et de la diversit�. � Certains de mes amis ne parlerai pas de tout sujet li� � la diversit� sur Internet, parce qu'ils ne veulent pas � quelque chose � faire et le genre de sujet. �

2. Caract�risation de l'apprentissage non supervis� et l'apprentissage des migrations

L'objectif principal de caract�riser l'apprentissage non supervis�, les donn�es d'annotation ne se trouve jamais des donn�es de caract�risation utiles pour compl�ter la mission de suivi. En PNL, l'apprentissage non supervis� est souvent caract�ris�e par l'utilisation de la mod�lisation linguistique termin�e. Ensuite, apprendre � caract�riser l'utilisation de l'analyse des sentiments, la reconnaissance d'entit�s nomm�es, traduction automatique et d'autres t�ches.

L'ann�e derni�re, quelques bons r�sultats du papier, le contenu est la PNL apprentissage non supervis� au sujet de la caract�risation, y compris Elmo (Peters et al.), ULMFiT (Howard et al.), OpenAI de TPG (Radford et al.), BERT (Devlin et al.), bien s�r, il est � le risque est trop grand pour publier GPT-2 complet. �

Une fois le mod�le GPT-2 complet sur l'affichage � l'IPSC, des r�sultats tr�s satisfaisants. Vous pouvez entrer une d�claration au d�but, il vous aidera � atteindre la cr�ation ult�rieure du texte - comme �crire l'article BuzzFeed, avec les lettres, les documents scientifiques et m�me invent� le sens de certains mots. Mais maintenant, il est toujours pas droit plat enti�rement horizontal avec les humains. L'�quipe travaille actuellement sur GPT-3, une plus grande �chelle, l'effet peut �tre mieux. Je ne peux pas attendre de voir les r�sultats de celui-ci.

Alors que la vision par ordinateur est la communaut� la migration des applications d'apprentissage r�ussie au d�but, mais sa t�che de base - dans le train le mod�le de classification IMAGEnet - est toujours supervis�. traitement du langage naturel et la communaut� de la communaut� de vision par ordinateur se posent la m�me question: � Comment peut-on caract�riser l'apprentissage non supervis� appliqu� � l'image? �

Bien que les plus c�l�bres laboratoires ont commenc� � �tudier, mais seulement apparu dans une conf�rence de IPSC papier: (. Metz et al) � Mise � jour M�ta-apprentissage des r�gles pour l'apprentissage non supervis� repr�sentation �. Leur algorithme ne met pas � jour les poids, mais mis � jour pour apprendre les r�gles. Puis affiner la caract�risation des �chantillons de haute �cole pour apprendre les r�gles apprises dans une petite quantit� de marquage, la classification d'images pour r�soudre le probl�me. Ils peuvent trouver pour apprendre les r�gles sup�rieures � 70% le taux de pr�cision dans MNIST et mode MNIST.

L'auteur explique quelle partie du code, mais n'a pas l'intention de les exposer, car � il est associ� � un calcul. � La boucle externe dure environ 100000 �tape de formation n�cessite 200 heures de formation sur 256 GPU.

Interne, boucle externe �l�ment d'apprentissage (Metz et al.)

J'ai le sentiment que dans un proche avenir, nous verrons plus ces documents. Vous pouvez utiliser des t�ches d'apprentissage sans supervision comprennent: le codage automatique, rotation de l'image pr�dictive (. Gidaris et al papier � Unsupervised apprentissage Repr�sentation en pr�disant l'image Rotations � est le feu dans l'IPSC 2018), pr�voir l'image suivante dans la vid�o.

3. backtracking ML

Des id�es similaires et l'apprentissage de la machine �l�gante, sont dans le cercle de tour. Lors de la s�ance d'affiches de se promener sentir comme marcher dans les couloirs de la m�moire. d�bat IPSC encore plus en regardant aussi avec impatience la fin sur � a priori contre la structure � du sujet, qui est le sujet l'an dernier, Yann LeCun et Christopher Manning a discut�, cette discussion depuis des ann�es entre bay�sienne et la fr�quence des �coles similaires d�bat.

MIT programme � Grounded l'apprentissage des langues et la compr�hension � de Media Lab a �t� arr�t� en 2001, mais le retour apprentissage des langues mis � la terre � la sc�ne cette ann�e avec deux documents, mais mis sur le manteau de l'apprentissage de renforcement:

DOM-Q-NET: sur le langage structur� (Jia et al.) Grounded RL: donn� une cible exprim�e en langage naturel, l'algorithme d'apprentissage par renforcement pour apprendre � naviguer dans les pages des champs remplis et cliquez sur le lien.

BabyAI: Une plate-forme d'�tudier l'efficacit� de l'�chantillon de l'apprentissage des langues Grounded (Chevalier-Boisvert et al.): A et OpenAI plate-forme Gym compatible avec un agent de bot fait main, l'agent peut simuler l'apprentissage humain instructeur agent langue synth�tique.

Je pense que ces deux documents et AnonReviewer4 comme:

� ...... et les m�thodes d'analyse s�mantique de l'�tude de la litt�rature pr�sent�e ici est tr�s similaire, bien que le document ne cite que la profondeur des articles r�cents apprentissage de renforcement. Je pense qu'il b�n�ficierait grandement de l'analyse s�mantique de l'article, la communaut� s�mantique peut �tre r�solu Inspirez-vous cet article ...... mais en fait les deux communaut�s ne sont pas beaucoup d'�changes, m�me si dans certains cas que nous avons �tudi�s sont des probl�mes similaires ".

automate d'�tats finis d�terministes (DFA) ont �galement deux documents sont mont�s � bord IPSC 2019 �tape:

Repr�senter les langues officielles: (. Michalenko et al) Comparaison entre Finite et r�currente Automata R�seaux de Neurones

Apprentissage Repr�sentations �tat des r�seaux Finite politique r�currente (Koul et al.)

La principale motivation pour les deux documents, parce que beaucoup d'espace d'�tat cach� RNN, donc si le nombre d'�tats peut �tre r�duit � un nombre limit� de celui-ci? Comme le montre le document, je doute que DFA peut repr�senter avec pr�cision RNN dans la langue, mais j'aime apprendre pendant la phase de formation RNN, puis le convertir � l'esprit de raisonnement DFA, comme Koul et al. Les r�sultats obtenus caract�risent le fini n�cessite trois �tat de m�moire discret et de l'�tat d'observation 10 seulement dans le jeu Pong, ce qui contribue �galement � expliquer RNN.

Trois �tapes de l'apprentissage d'une DFA (Koul et al) de RNN

Machine d'extraction automatique (Koul et al)

4. RNN de faveur

2018-2019 pr�sent� dans le document refl�te le th�me du changement: RNN forte baisse. Il est �galement pr�vu, parce que m�me si RNN applique aux donn�es de s�quence, mais il y a un grand d�faut: ils ne peuvent pas parall�les de calcul, et ne peut donc pas tirer profit d'une �tude plus large des conducteurs depuis 2012 - Les op�rateurs vigueur. RNN est pas populaire dans le domaine de la vision par ordinateur et l'apprentissage de renforcement, une fois populaire dans le domaine du traitement du langage naturel, ils sont remplac�s par une architecture � base d'attention.

RNN de faveur (Figure source: IPSC 2019 donn�es statistiques suppl�mentaires)

Est-ce RNN moyen sera abandonn�? Il est pas toujours le cas. 2019 L'un des deux meilleurs papiers IPSC � neurones ORDONN�: L'int�gration des structures d'arbres dans les r�seaux de neurones r�currents � sur RNN et pertinents. En plus de ce chef-d'uvre et mentionn� ci-dessus deux documents sur les automates, IPSC 2019 a �galement re�u neuf documents sur RNN, la plupart des recherches RNN creuser plus profond des connaissances de base des math�matiques, plut�t que d'explorer de nouvelles applications de RNN .

Dans le secteur industriel, RNN est encore tr�s actif, en particulier dans l'affaire de l'entreprise avec des donn�es de s�ries chronologiques, comme les soci�t�s commerciales. Malheureusement, ces entreprises sont g�n�ralement ne publient pas leurs propres recherches. M�me maintenant RNN pas si attrayante pour les chercheurs, nous savons aussi que dans l'avenir, il pourrait � revenir �.

5. dynamique GAN reste forte

Par rapport � l'ann�e derni�re, li�e � l'�volution plus n�gative de GAN, mais le nombre de documents connexes a augment�, une augmentation d'environ 70 � environ 100. Ian Goodfellow a �t� invit� � donner une conf�rence sur le th�me de GAN, comme toujours, �t� beaucoup d'attention.

IPSC 2019 La premi�re session de l'affiche est sur le GAN de. Il y a eu beaucoup nouvelle architecture GAN, l'am�lioration de l'architecture GAN existante, ainsi que l'analyse GAN. les applications de GAN comprennent la g�n�ration d'image, la g�n�ration de texte, une pluralit� d'art de synth�se audio, il pate-GAN, GANSynth, ProbGAN, InstaGAN, RelGAN, MisGAN, SPIGAN, LayoutGAN, KnockoffGAN autres architectures diff�rentes. Je ne sais pas vraiment dire ce que cela signifie, parce que j'ai appel� l'analphab�tisme GAN dans le domaine. En outre, Andrew Brock n'a pas mis son grand mod�le GAN appel� Gigantesque, et je me sens tr�s d��u.

Dog balle Vivent (Brock et al.)

session d'affiches GAN a r�v�l� la r�action de la communaut� � la GAN combien la polarisation Oui. Certains chercheurs non-GAN a d�clar�: � Je ne peux pas attendre GAN veulent cette vague de troubles rapidement dans le pass� �, � mon avis, ils peuvent �tre jaloux, � une confrontation a �t� mentionn�, mon esprit va juste en bas. �.

6. L'absence d'�tude approfondie inspir� par la biologie

Compte tenu de tous les soucis et la discussion du s�quen�age du g�ne CRISPR et les b�b�s, IPSC est m�me pas beaucoup de profondeur et de combiner l'apprentissage de la th�se de la biologie, ce qui est surprenant. Sur ce sujet, un total de six articles:

Y compris deux documents sur l'architecture inspir�e par la biologie:

Apprendre-Biologiquement Plausible algorithmes � l'�chelle grande datasets (Xiao et al.)

Une th�orie unifi�e des premi�res repr�sentations visuelles de la r�tine � travers Cortex anatomiquement Constrained profonde CNNs (Lindsey et al.)

Un article sur la conception de l'ARN:

L'apprentissage de l'ARN Design (Runge et al.)

Environ trois op�rations sur les prot�ines (manipulation de prot�ines):

Localisation des prot�ines au niveau humain avec Convolutif Neural Networks (Rumetshofer et al.)

L'apprentissage structure des prot�ines avec un simulateur Diff�rentiable (Ingraham et al.)

L'apprentissage embeddings de s�quences de prot�ines en utilisant des informations de structure (Bepler et al.)

Convolution r�seau de neurones inspir� par la r�tine (Lindsey et al.)

Mais pas de papier est sur le g�nome, ni un atelier sur ce sujet. Il est vraiment frustrant ...... Cependant, ceci est pour une �tude approfondie des int�ress�s chercheur en biologie ou biologiste pour �tudier la profondeur d'int�r�t, il est une �norme opportunit�.

Allons �num�rent juste un fait: le premier auteur de la r�tine papier Jack Lindsey est encore �tudiants � l'Universit� de Stanford. Les enfants n'ont pas commenc� � appuyer l'acceptation sociale de celui-ci.

7. L'apprentissage de renforcement est encore soumettre des documents dans les sujets les plus chauds

Documents de recherche sur IPSC 2019 Assembl�e g�n�rale montre que les communaut�s d'apprentissage de renforcement sont jamais approche de mod�le tourn� et algorithme bas� sur un mod�le efficace et des �chantillons de l'algorithme m�ta-apprentissage. Ce changement est susceptible d'�tre TD3 (Fujimoto et al., 2018) et SAC (Haarnoja et al., 2018) contr�le continu Mujoco r�gl� scores �lev�s sur la r�f�rence, et R2D2 (Kapturowski et al., 2019 RPR) obtenu inspir�s des scores �lev�s sur les t�ches de contr�le discret Atari.

algorithme de mod�le asymptotiquement libre et le m�me algorithme bas� sur un mod�le (par exemple mod�le d'environnement d'apprentissage � partir des donn�es, puis en utilisant le plan de mod�le ou de g�n�rer plus de donn�es) exp�rience dans l'utilisation de 1 / 10-1 / 100 de la formation, pourrait r�pondre la performance. Cet avantage montre que les t�ches du monde r�el algorithme bas� sur un mod�le appropri�. Lorsque le simulateur appris peut-�tre d�fectueux, l'erreur peut �tre obtenue par mod�le dynamique plus sophistiqu� de r�mission, comme simulateur int�gr� (Rajeswaran et al.). Une autre fa�on de renforcer l'apprentissage de probl�mes du monde r�el que le support de simulateur tout complexe randomisation: un environnement simul� dans une vari�t� de strat�gies de formation pourrait penser que le monde r�el est � une autre r�partition al�atoire �, et le succ�s (OpenAI).

Peut �tre effectu�e sur une pluralit� de t�ches pour apprendre �l�ment de transition rapide de telle sorte que l'algorithme d'apprentissage �chantillon efficacit� grandement am�lior�e et le rendement (Promp (Rothfuss et al.), PEARL (Rakelly et al.)). Ces am�liorations nous rapprocher de � renforcer l'apprentissage du moment IMAGEnet, � que nous pouvons utiliser la strat�gie de contr�le de l'apprentissage d'autres t�ches, plut�t que de partir de la strat�gie de formation de z�ro (bien s�r, est encore la t�che trop complexe ne peut pas �tre atteint).

Dans les six t�ches standard, PEARL (Rakelly et al) �chantillons de formation de performance asymptotique et yuan d'efficacit� sont mieux qu'avant le yuan pour renforcer l'apprentissage

IPSC 2019 re�oit une grande partie du papier, ainsi que la structure et prieurs dans tous les ateliers de papiers RL (SPiRL), est la connaissance de la fa�on d'int�grer l'algorithme d'apprentissage de l'environnement. Bien que l'un des principaux avantages de l'algorithme d'apprentissage de renforcement en profondeur pr�coce est g�n�rale (par exemple DQN utilisation de tous les jeux Atari m�me architecture, sans avoir � conna�tre quel jeu particulier), mais l'introduction du nouvel algorithme d�montrent l'aide de connaissances pr�alables � r�soudre plus t�che complexe. Par exemple, dans le r�seau Transporter (Jakab et al.), Avec plus d'informations pour explorer la structure de l'agent d'utiliser les connaissances avant d'effectuer.

Dans l'ensemble, au cours des cinq derni�res ann�es, la communaut� d'apprentissage de renforcement a mis au point un certain nombre d'outils efficaces pour r�soudre les probl�mes d'apprentissage de renforcement sans mod�le. Le moment est venu de proposer des algorithmes d'�chantillonnage plus efficaces peuvent �tre utilis�s pour renforcer la migration sur les probl�mes r�els �tudi�s.

En outre, Sergey Levine peut �tre la plupart des auteurs de cette ann�e, il y a autant que 15.

8. La plupart de papier de r�ception sera bient�t oubli�

Lors de la r�union, j'ai demand� un chercheur bien connu comment il voit recevoir du papier cette ann�e. Il eut un petit rire: � La plupart des bout de documents de conf�rence r�ception sera oubli�. � Domaine de l'apprentissage machine telles que le d�veloppement rapide des r�sultats les plus avanc�s apr�s quelques semaines ou quelques jours m�me peut �tre bris�, mais la plupart du papier de r�ception officiel du salon a �t� d�pass� pas non plus surprenant. Par exemple, le papier IPSC 20188 contre les papiers �chantillon de sept a �t� rompu avant le d�but de l'Assembl�e g�n�rale.

J'entends souvent un tel commentaire � la r�union: la r�ception des documents / rejeter la tr�s al�atoire. Je ne l'ai pas nomm�, mais certains bien connus ou tr�s documents cit�s � l'Assembl�e g�n�rale avait �t� rejet�e auparavant. En revanche, beaucoup de papiers bien que personne n'a �t� des r�f�rences accept�es.

Dans le cadre de ce domaine, je fais face souvent une vari�t� de menaces. Je pense que peu importe ce que l'id�e, il semble qu'il y ait toujours quelqu'un d'autre a fait, et fait mieux, plus vite. Toutefois, si le papier n'a pas aid� tout le monde, alors ce qui est publi� est le point? Qui peut dire ce qu'ils ah!

conclusion

Parce que l'espace est limit�, il y a beaucoup de tendances que je ne pouvais pas �crire une analyse d�taill�e, par exemple:

Optimisation et r�gularisation: Adam et le d�bat SGD continue. IPSC Assembl�e g�n�rale cette ann�e beaucoup de nouvelles technologies, dont certaines sont tout � fait passionnant. Il semble que chaque laboratoire d�veloppent leur propre optimiseur, la m�me chose est vraie de notre �quipe.

�valuation m�trique: Avec le mod�le g�n�re de plus en plus populaire, nous avons besoin in�vitablement de proposer de nouvelles mesures pour �valuer la sortie g�n�r�e.

Si vous voulez en savoir plus, vous pouvez aller voir un 55 IPSC de David Abel a publi� 2019 notes. Pour les personnes qui veulent savoir IPSC 2019 points chauds, en dessous de ce chiffre peut �tre en mesure de vous aider �:

Il semble que vous devriez �crire un article intitul� � Un cadre probabiliste robuste pour les papiers m�ta-apprentissage universel, sans supervision cessible �

J'ai vraiment appr�ci� IPSC cette Assembl�e g�n�rale - il est assez grand, vous pouvez trouver beaucoup d'amis partageant les m�mes id�es ici, assez petit, vous pouvez profiter du plaisir ne s'alignent pas, le calendrier de quatre jours de r�unions arrive aussi. En revanche, NeurIPS r�union un peu plus, les participants observeront les quatre jours apr�s que je pensais que les papiers d'affiches: � Regardez toutes ces connaissances, je maintenant saisir, mais trop paresseux pour se d�placer. �

Je pensais juste que des plus grands gains en conf�rence IPSC, il est la force motrice de la recherche scientifique. Zhuoyue Cheng et beaucoup de mon �ge qui a fait des recherches scientifiques me permettent de voir la beaut� de la recherche scientifique, me motiver � travailler plus dur � faire des recherches. D'ailleurs, m�me si seulement le temps cette semaine pour regarder les journaux et rencontrer de vieux amis est aussi un choix fabuleux ~

via huyenchip.com/2019/05/12/top-8-trends-from-iclr-2019.html

2019 Sommet mondial sur l'intelligence artificielle et robotique

Organis� par la F�d�ration chinoise informatique, Lei Feng r�seau et l'Universit� chinoise (Shenzhen) Hong Kong co-h�te du Sommet mondial 2019 sur l'intelligence artificielle et robotique (CCF-GAIR 2019), sera 2019 Nian 12 Juillet � 14 Tenue � Shenzhen.

D'ici l�, le laur�at du prix Nobel JamesJ. Heckman, acad�micien �tranger, pr�sident du haut du monde, bien connu Fellow, un certain nombre d'invit�s poids lourds seront personnellement Zuozhen , Pour discuter de l'intelligence artificielle et sur le terrain complexe de situation de survie de la robotique, la production, l'investissement et ainsi de suite.

Cliquez sur Lire l'original , joindre le renforcement du papier groupe de discussion d'apprentissage, il ~

Route de la soie

Apprenez � conna�tre la Chine