Comment faire contre le r�seau GAN g�n�re la qualit� de plus de texte? LeakGAN propres exp�riences: � confrontation, vous pourriez avoir besoin d'un espion! �

Lei Feng r�seau Technologie AI Note de l'examen: Depuis la formule GAN de r�seau apparaissent conflictuelles, et ses variantes a �t� maintes fois prouv� son efficacit� dans la t�che de g�n�ration d'image, mais aussi continuer � attirer un nombre croissant de chercheurs ajout� � l'�tude pour am�liorer la contr�labilit� et la stabilit� de la formation GAN.

Dans un premier temps, en raison d'un d�faut dans lequel, dans la g�n�ration de texte aspect Gans ne peut pas �tre efficacement appliqu�e. L'�quipe a b�n�fici� de SeqGAN d�j� publi�, GAN sur le texte peut avoir g�n�r�, mais la performance n'a pas �t� si importante dans la t�che de g�n�ration d'image. L'un des principaux probl�mes est que le g�n�rateur G de l'information de r�troaction contenue dans le discriminateur D obtenu trop petit pour la mise � jour guider efficacement G, am�liorer la qualit� de la g�n�ration de texte, en particulier lorsque la longueur du texte de longue date.

Cela conduit � la question suivante: Si le discriminateur information Plus au g�n�rateur si le g�n�rateur peut effectivement am�liorer la performance de la t�che de g�n�ration de longues phrases il? Professeur Yu Yong, Universit� Jiaotong de Shanghai, Zhang Weinan assistants professeurs et �tudiants Guojia Xian, Lu Sidi, Tsai Han conjointe D�partement UCL de l'informatique Professeur Wang Jun ensemble pour compl�ter le document intitul� � Texte g�n�ration via Long accusatoire formation avec fuite d'information � (information divulgu�e par conflictuel Stagiaire texte croissance), ils g�n�rer de longues phrases de texte ce probl�me a �t� �tudi�, nous avons trouv� la r�ponse propos�e moyen efficace de lutter contre le r�seau est largement utilis� dans le quiz du robot, la g�n�ration automatique de nouvelles, et la traduction automatique et d'autres applications il offre la possibilit�.

formule antagoniste r�seau (Gans) g�n�r�e � l'origine des donn�es d'image ou analogue de conception continue. Avant SeqGAN du Groupe et d'autres mod�les peuvent g�rer une s�quence de segments discrets de donn�es, de sorte que vous pouvez lutter contre le r�seau qui offre la possibilit� de g�n�rer du texte, montrant des r�sultats prometteurs. Comme le texte anglais est naturellement une des t�ches mot par mot g�n�ration de texte peut �tre mod�lis� comme une s�quence de processus de prise de d�cision, pour chaque �tape du chemin, l'�tat actuel est des mots d�j� g�n�r�, le comportement va g�n�rer mot la g�n�ration d'un r�seau G est mis en correspondance avec l'�tat actuel du comportement de la politique de r�partition spatiale al�atoire. Apr�s la fin de la g�n�ration de texte de la phrase, la phrase r�sultant est introduit dans le discriminateur D, qui peut �tre s�par� du texte proprement dit et la zone de texte g�n�r� apr�s la formation, retourne les r�sultats pour distinguer entre G est obtenu, le guide il met � jour.

Apr�s SeqGAN, les chercheurs ont propos� un certain nombre de fa�ons de GAN et ses variantes sont utilis�es pour la production de texte. Cependant, ces r�sultats sont souvent limit�s au texte est la g�n�ration courte (par exemple 20 mots ou moins), peu de recherche aspects les plus difficiles de g�n�ration de texte ne voit plus. Dans les rapports de presse, qui g�n�rent automatiquement des descriptions de produits de la t�che r�elle, la capacit� � long g�n�ration de texte est indispensable. A pr�sent proc�d� de g�n�ration de texte sur la base de la s�quence de prise de d�cision il y a un grand manque de cette probabilit� � partir du signal discriminateur D de r�troaction scalaire est rare, car le texte bien que le G-par-mot g�n�r� dans une action multi-tour, mais seulement si apr�s la fin de la phrase enti�re g�n�re G pour recevoir le signal de r�troaction provenant du D. De plus, G est cens� mettre � jour leur strat�gie sous la direction de D, D, mais le texte int�gral de ces commentaires est un scalaire, une quantit� tr�s limit�e de l'information, ne suffit pas de conserver la structure syntaxique et s�mantique du texte dans le processus, il ne peut pas G apprendre efficacement mise � jour de l'aide.

D'une part, afin d'augmenter la quantit� d'informations provenant du discriminateur D, qui devrait �tre fourni en plus de la valeur de retour de jugement final plus d'informations d'orientation D est apr�s tout une structure connue, form�e r�seau CNN, plut�t qu'une bo�te noire tout � fait possible D pour fournir plus d'informations. D'autre part, les informations de guidage de D est encore clairsem�e, afin de rem�dier � ce probl�me, les auteurs pensent que le niveau d'utilisation de la production de texte, � savoir: des �chantillons r�els de texte sont conformes aux niveaux de langue et de la parole structure s�mantique, etc. �crite. Le mod�le sera en mesure d'apprendre plus facilement gr�ce � la t�che toute g�n�ration de texte en sous-t�ches multiples dans la hi�rarchie.

Dans cet article, les auteurs le long de plus que l'id�e, a propos� une structure appel�e mod�le LeakGAN, tout en traitant deux informations de r�troaction de d�ficit en D et la r�troaction probl�me clairsem�s. discriminateur LeakGAN D est un moyen pour fournir plus d'informations sur le nouveau motif g�n�rateur G.

Pour utiliser D de fuite d'information dimensionnelle, les auteurs font r�f�rence comme repr�sent� sur la figure. DeepMind publi�e dans f�odales r�seau ICML2017 con�u un g�n�rateur hi�rarchique G, qui comprend un ordre �lev� et faible pour le module Manager le module travailleur. Module LSTM Manager est un r�seau, il est le r�le des interm�diaires d'information. Au cours de chaque cycle pour g�n�rer un mot d'un nouveau module Gestionnaire D sont re�us du discriminateur pour caract�riser de grande dimension, tels que D la carte de fonction r�seau CNN, puis module Gestionnaire utilisera cette information pour guider la formation de la cible (objectif) , agissant sur le module actuel des travailleurs. En raison du r�le de D et G aurait pu �tre conflictuel, l'information D ne doit rester dans leur propre interne, mais maintenant il y a des informations dans D est � fuite � � G, comme si, comme un espion, de sorte que les auteurs ont nomm� LeakGAN.

Ensuite, lorsque le module Manager g�n�re la cible int�gration (int�gration de but) apr�s, les modules de travailleurs vont mot actuellement g�n�r� avec un autre r�seau de LSTM de codage, la sortie de la moissonneuse-batteuse cible LSTM int�gr� pour faire en sorte que la direction peut �tre int�gr� selon le gestionnaire et l'�tat actuel g�n�re un nouveaux mots appropri�s. Gr�ce � ce processus, les commentaires de D serait non seulement montr� que les r�sultats de la discrimination scalaire apr�s la fin de la g�n�ration de la phrase, mais aussi dans le processus de g�n�ration dans cette phrase fournit beaucoup d'informations � travers le vecteur cible int�gr�, l'orientation G am�liorer leur performance.

Selon les auteurs, c'est le premier cadre de GAN pour mieux g�n�rateur de train par voie de divulgation de l'information, et une combinaison de l'apprentissage par renforcement hi�rarchique pour r�soudre le probl�me de la g�n�ration de texte long.

La conception des auteurs, le constructeur du module Manager re�oit un vecteur caract�ristique de la D, et g�n�re la cible cible de liaison des travailleurs du module embarqu� g�n�r� phrase en cours et l'ensemble du processus du nouveau mot sont diff�rentiables, l'algorithme gradient REINFROCE une telle strat�gie peut �tre fin imm�diatement � la fin (bout � bout) pour la formation de G. Toutefois, en raison du module Worker Manager et le module devrait �tre en mesure de se concentrer sur leur t�che d'identifier toutes les fonctionnalit�s utiles, ce r�seau f�odales dans la pratique, le module Manager et des modules travailleurs re�oivent une formation s�par�ment de l'identification du module auquel le gestionnaire espace caract�ristique est plus utile pour pr�dire la direction, puis faire l'action du module de travailleurs dans cette direction recevra une r�compense. Formation et module Gestionnaire des modules travailleurs sont mis � jour en alternance, chaque fois un fixe, une autre mise � jour.

En outre, les auteurs ont �galement soigneusement con�u une m�thode de formation pour faire face au probl�me de la formation GAN en g�n�ral sujettes � de tels probl�mes gradient dispara�t, il y aura beaucoup plus forte lorsque le rapport D G. Inspir� RankGAN dans les m�thodes de tri, ils font une m�thode simple et efficace de classement en fonction de la � bootstrap R�activer � (Activation TRANSFORM� la m�thode bootstrap) pour ajuster la taille D des commentaires. Apr�s cette conversion, chaque mini-batch et la diff�rence obtenue de r�troaction d�sir�e sera constante, cette m�thode est �quivalente � une valeur du stabilisant, lorsque l'algorithme est tr�s sensible � la valeur quand la taille d'une grande utilit� � la fonction, et comme la m�thode de tri, il peut �galement �viter le probl�me de la disparition du gradient, ce qui acc�l�re le mod�le de convergence.

Les auteurs ont �galement prendre une m�thode pour �viter le probl�me du mode effondrement (effondrement du mode) la formation en alternance (Interleaved formation), qui est, apr�s la pr�-formation, et non pas toute la formation contradictoire habituelle jusqu'� ce que la convergence, mais laissez l'apprentissage et de la formation supervis�e tour � tour de formation contradictoire. L'importance de cette approche est que le mod�le peut aider � �viter le mauvais minimum local, et d'�viter l'effondrement du mod�le. D'autre part, l'ajout du mod�le de formation d'apprentissage supervis� est de g�n�rer une r�gularisation implicite, �viter les comportements de mod�le d'apprentissage non supervis� �carte trop du r�sultat.

courbe de formation figure peut �tre vu, LeakGAN chute log-vraisemblance n�gatif beaucoup plus rapide que les m�thodes conventionnelles, la longueur du texte est de 40 � la situation, la m�thode classique est la convergence difficile, voire m�me.

Les auteurs bas�s sur les donn�es g�n�r�es et des donn�es r�elles � faire beaucoup d'exp�riences. Dans l'exp�rience sur la base des donn�es g�n�r�es, LeakGAN fait mod�le de probabilit� nettement inf�rieur � celui avant le logarithme n�gatif de la s�quence de 20 � 40 � la longueur du mot de texte. (Tableau 1)

Dans les exp�riences bas�es sur des donn�es r�elles, les auteurs ont choisi EMNLP 2017 nouvelles WMT, l'annotation d'image COCO et la po�sie chinoise �taient aussi long, moyen et court corpus de texte, LeakGAN �galement obtenu le meilleur score de l'UEBL. (Tableau 2,3,4)

Chez l'homme test de Turing, LeakGAN a �galement r�alis� mod�le nettement am�lior�e que par le pass�. (Tableau 5)

Les auteurs ont �galement des interactions entre le module et le module Worker Manager pour faire des recherches approfondies, les r�sultats montrent LeakGAN en l'absence d'une structure de phrase explicite situation donn�e peut �tre apprendre implicitement la structure des phrases, tels que la ponctuation, longue et tendue suffixe.

Ce qui suit est un exemple comparatif de texte g�n�r� par le mod�le et les travaux ant�rieurs:

Les d�tails sp�cifiques de l'�tude se trouvent dans les documents originaux https://arxiv.org/abs/1709.08624, le papier a une richesse de l'annexe de donn�es d�crit le processus de formation, � condition que beaucoup de phrases g�n�r�es et fournit un code mod�le.

De plus, nous sommes �galement invit�s � l'un des auteurs du papier Zhang Weinan faire Lei Feng r�seau classe ouverte, et expliquer les r�sultats de ce document avec GAN texte ne g�n�rent plus les conditions de recherche li�es.

Zhang Weinan maintenant disponible au D�partement d'informatique de l'Universit� Jiaotong de Shanghai et Johns Croft Research Center en tant que professeur adjoint, direction de la recherche pour l'application des probl�mes miniers d'apprentissage de la machine et des donn�es. Il est dipl�m� de l'Universit� Jiaotong de Shanghai en 2011 cours ACM Informatique, D�partement d'informatique, Universit� Ph.D. College de Londres en 2016, a publi� 50 articles de recherche dans des conf�rences universitaires internationales haut et revues, cinq fois le premier auteur les donn�es publi�es dans la Conf�rence scientifique internationale ACM KDD, 2016 a �t� d�cern� par Microsoft Research Award � la recherche mondiale SIGKDD Top 20 l'�toile montante � titre, en 2017 pour obtenir la Conf�rence ACM SIGIR sur l'information recherche internationale candidature meilleur prix du papier. Il a remport� la troisi�me place dans les utilisateurs du monde entier KDD-concours Coupe personnalis�e recommandations, concours de l'algorithme d'appel d'offres le championnat final des donn�es globales annonces d'affichage d'ench�res en temps r�el. Page personnelle de recherche: http: //wnzhang.net/

Ouvert le temps de classe est le 28 Septembre 20h00 jeudi soir, les lecteurs int�ress�s peuvent analyser l'enregistrement du code, � ne pas manquer!

Documents de contenu li� Lei Feng r�seau compil� AI Technology Review, merci Zhang Weinan Professeur adjoint, la correction du professeur Wang Jun de cet article.

Route de la soie

Apprenez � conna�tre la Chine

Comment faire contre le r�seau GAN g�n�re la qualit� de plus de texte? LeakGAN propres exp�riences: � confrontation, vous pourriez avoir besoin d'un espion! �