Digest algorithme de g�n�ration et sp�ciaux | AIS pr�-s�cher toute la part parlera

AIS (ACL, IJCAI, SIGIR) 2018

Session9: Summarization et g�n�ration

1 � Ye Yajie l'Universit� de P�kin

Langue g�n�ration via DAG Transduction

La premi�re partie d�crit notre mission. Notre t�che est de restaurer la phrase de graphe s�mantique originale. papier quadrill� s�mantique utilis�e est appel�e structure de d�pendance �l�mentaire. Il est un sch�ma d'une s�mantique de type � logique s�mantique, et il se caract�rise par une tr�s plate et d'une pluralit� d'arbre de syntaxe hi�rarchique ayant une structure et est �galement tr�s diff�rent. Sur la base de la m�thode traditionnelle d'automate DAG � ce traitement s�mantique EDS figure une certaine difficult�. Pour r�soudre ces probl�mes, nous avons sur la base des cadeaux traditionnels sur papier une nouvelle m�thode DAG transducteur au graphe acyclique base (DAG) sur une machine automatique.

EDS Ce graphique s�mantique sont g�n�ralement le bord d'une marque, mais l'utilisation r�elle, il n'y a pas besoin de marquer le bord, nous mettons simplement une �tiquette sur le bord de devenir un nud sp�cial, il ne faut pas perdre en m�me temps pour r�soudre le probl�me l'information d'origine. DAG Transducteur nous utilisons automate � base de DAG. Une r�gle DAG des automates: Quand un ensemble d'ar�tes dans un noeud a M �tats, N peut �tre mis dans les �tats de l'ensemble des ar�tes, ce qui ach�ve un processus de transition depuis le bord vers le bord. Tout le but de l'automate DAG est: pas de bord sur le bord d'une marque du DAG plus drapeau de l'Etat, puis la collection � un tableau de points de vie selon les r�gles, notre objectif est de choisir une m�thode de marquer le score le plus �lev�.

La deuxi�me partie d�crit l'id�e de base de notre conception DAG Transducteur. Transducteur repose essentiellement sur r�inscriptible classique, � savoir le noeud est r��crit en un graphe ou sous un sous-arbre, dans le processus de r��criture se poursuit, la structure enti�re dans une autre structure. Mais nous avons utilis� une m�thode relativement nouvelle que nous ne sommes pas bas�s r��crit, mais sur la base des effets secondaires. informations relatives � un �criture noeud en m�me temps avec cette identification de chaque noeud du graphe s�mantique. Cette information est le processus d'identification produit des effets secondaires, qui peuvent �tre toute expression ou de contrainte. Dans le document, nous s�mantique graphique dans un ensemble d'�quations, ces �quations d�crivent comment les phrases sont form�es par �pissage dans chaque mot. Nous �tions all�s � ces �quations, on peut mettre un graphe s�mantique dans une phrase qu'il repr�sente. Solution de ces processus d'�quations, en fait, peut �tre �crit sous la forme d'un arbre.

Notre syst�me cadre de NLG de base est divis�e en deux parties: la premi�re partie est d'utiliser notre DAG Transducteur le graphe s�mantique en une s�quence de prototype de parole, la seconde partie est une s�quence � s�quence proc�d� � chaque mot par le prototype de parole inflexion.

La troisi�me section d�crit comment extraire les r�gles d'utilisation DAG Transducer. Les r�gles sont des extraits concentr�s � partir des donn�es de formation sur. Pour de meilleurs r�sultats, nous utilisons une strat�gie fine � grossi�re, qu'il y aura trois niveaux de r�gulation du syst�me entier: la premi�re est induite par des r�gles, � savoir les r�gles r�sum�es d�duisent. Cette r�gle est les r�gles les plus directes et les plus raisonnables. Nous utilisons ces r�gles pour am�liorer la pr�cision du syst�me, le deuxi�me est �tendu r�gles, qui est obtenu par un peu de modification des r�gles induites, derni�re est des r�gles dynamiques dans le graphe s�mantique pour achever la transition de la peine, sinon la r�gle , nous allons produire de fa�on dynamique ces r�gles. Nous utilisons cette r�gle pour augmenter la robustesse du syst�me.

La m�thode sp�cifique pour extraire des r�gles induites sont: Tout d'abord, un mot de l'intention de noeud TOP, faire une recherche sp�ciale en profondeur d'abord avec un certain nombre de r�gles heuristiques. Ensuite, nous avons combin� la section ascendante le long des noeuds de l'arbre de recherche, la fusion est termin�e, une liste des parties de section associ�s sera une figure. Liste des donn�es de l'entra�nement par intervalles et nous allons nous concentrer sur ce c�t� du graphe s�mantique pour faire un alignement d'arbre de syntaxe, et enfin nous utilisons la syntaxe d'�tiquette nud de l'arbre apr�s l'alignement a �t� utilis� comme une �tiquette sur chaque c�t� de l'Etat. Selon la relation entre le bord de la plage, il est facile d'�crire les r�gles.

Partie IV d�crit les r�sultats exp�rimentaux. Avec cette t�che sur les r�sultats des ensembles de donn�es AMR et comparaison de base, nous avons con�u notre Transducteur obtenir de meilleurs r�sultats dans l'ensemble de donn�es EDS.

2 Qiuxi Peng Universit� Fudan

Vers Diverse G�n�ration de texte avec l'apprentissage par renforcement inverse

(Remarque: L'affichage papier L'AIS au lieu de la pr�-conf�rence donnera un rapport oral Qiuxi Peng)

g�n�ration de texte est une t�che tr�s importante, qui est largement utilis� dans la traduction automatique, plug-parler, le texte et les syst�mes de summarization dialogue.

Notre objectif est de g�n�rer peine plus r�aliste. Le mod�le de g�n�ration de profondeur quelques pratique courante: la premi�re consiste � faire directement avec l'autre approche d'estimation de vecteur MLE, le second est associ� � l'approche GAN, le troisi�me est une pratique inverse cet article en utilisant l'apprentissage de renforcement.

Pour GAN peut �tre utilis� dans les champs de texte, il y a deux fa�ons: l'une est d'utiliser SeqGAN, approche RankGAN pour renforcer les m�thodes d'apprentissage introduites dans. La deuxi�me m�thode est une m�thode utilisant Gumbel-softmax, de fa�on continue � approximativement vecteur d'un chaud, de sorte que le gradient peut �tre renvoy�. L'avantage de cette approche est que l'inconv�nient plus r�elle phrase qui en r�sulte est que la formation ne soit pas tr�s stable, la formation est plus difficile.

Notre m�thode utilise l'apprentissage par renforcement inverse pour la production de texte. Et g�n�rer � partir de l'ensemble d'apprentissage pour g�n�rer un retour d'information, par l'interm�diaire du g�n�rateur de mise � jour de r�troaction, capable de g�n�rer un meilleur texte. En permanence la formation crois�e, et enfin capable de g�n�rer un bon texte.

Une hypoth�se de base: t une forme de texte r�troaction fonction de probabilit� est obtenue avec la distribution d'�nergie est proportionnelle � t.

La deuxi�me hypoth�se, que je t peut �tre d�compos� en toutes les �tapes du processus de prise de d�cision, de sorte que lorsque chaque d�cision sont en mesure d'obtenir une r�troaction, donc finalement mes commentaires ne serait pas trop peu, pas tous auront g�n�r� plus de commentaires .

Comment optimiser les param�tres de retour? Maximiser les ensemble de donn�es de formation, les formules ont z log, ce qui maximise le temps, il faut soustraire le z journal, qui est un MLE direct et local essentiellement diff�rent. Alors vous pouvez obtenir une expression pour le gradient apr�s d�rivation. Sa signification physique est que je sampl� d'une v�ritable r�troaction de donn�es, l'�largissement d'un �chantillonnage du r�el, les commentaires des donn�es, l'�cart avec mes commentaires du constructeur. Cela est d'obtenir un tel param�tre de r�troaction r�troaction, de sorte que les donn�es r�elles, y compris le g�n�rateur de donn�es factice g�n�re r�troaction obtenue inf�rieur.

J'utilise le g�n�rateur pour am�liorer le processus de gradient de strat�gie est appliqu�e bas�e sur l'entropie, ce que ces deux sont �quivalents, ils ont lanc� la m�me expression.

fr�quence exp�rimentale avec les donn�es exp�rimentales principalement de deux fa�ons: La premi�re consiste � utiliser Oracle dataset, la probabilit� d'essai. La seconde est de faire des exp�riences sur un texte r�el, nous utilisons Bleu en arri�re. Avec MLE, SeqGAN, RankGAN, LeakGAN, comparer nos r�sultats soient meilleurs qu'eux.

Enfin expliquer notre m�thode peut r�duire les causes de l'effondrement du mod�le. La premi�re est parce que le RL Max-entropie recherchera la strat�gie de distribution multimodale, plut�t qu'une seule strat�gie de distribution de pointe. La deuxi�me �tape est une des hypoth�ses de distribution de donn�es flexibles.

3 Institut de technologie de Feng Xiao Cheng Harbin

Sujet � Essay G�n�ration avec les r�seaux de neurones

Dans cette t�che, nous devons d�finir des mots-cl�s pour un travail d'essai, nous voulons entrer dans un certain nombre de mots-cl�s diff�rents, g�n�rons un paragraphe autour de ces mots par ces mots-cl�s, ce passage est relativement longue, et exigent un langage relativement naturel lisser le texte. Mentionner ici deux d�fis suppl�mentaires, est un th�me de l'int�grit�, nous voulons produire de l'information s�mantique � travers un paragraphe entier contenant tous les mots cl�s saisis. Suivi par la pertinence d'actualit�, nous voulons g�n�rer chaque mot peut �tre utile � mes sujets d'�criture, ne veut pas dire que certains des Bai.

Et nous avons encore � faire face � la t�che d'assurer la coh�rence et la logique de la repr�sentation. Nous avons effectu� dans le cadre traditionnel s�quence � la s�quence d'une am�lioration de deux points, un m�canisme est bas� sur le th�me de l'attention, l'autre est un m�canisme de couverture multi-sujet.

Tout d'abord, jetez un oeil au plus mod�le de base, le mod�le est bas� sur une moyenne du th�me, nous serons tous les mots cl�s entrent en moyenne, mettre cela comme notre vecteur th�me puis d�cod� par un LSTM. Cette m�thode a un probl�me, nous avons l'entr�e de cinq mots, il peut �galement �tre une moyenne de cinq autres termes la moyenne, ce qui un sujet n'efface pas le probl�me. Nous avons donc ajout� un m�canisme d'attention.

Sur cette base, nous proposons un LSTM plurith�matique-Aware, cette m�thode traditionnelle Quelle est la diff�rence? Nous esp�rons que ces cinq mots le sujet peuvent �tre inclus dans un paragraphe qui est g�n�r�. Cependant, avant cela, et il existe diff�rents mod�les. Parce que l'�criture exige un vrai th�me, chaque pi�ce est de ne pas dire, chaque mot �tait autour d'un th�me, de sorte que l'ensemble du document sera �crit tr�s d�contract�, donc nous rejoindrons le coefficient d'att�nuation sur la base d'un m�canisme de couverture sur l'original, nous voulons contr�ler un th�me diff�rent � chaque ralentissement, assurez-vous qu'il y aura un sujet plus important.

Nous mod�lisons le processus de formation est l'utilisation d'une m�thode pour optimiser l'estimation de la probabilit�, en utilisant une approche diff�rente dans la phase de d�codage, est une sorte de faisceau-recherche + m�thode �chantillon, nous avons choisi les dix meilleurs apr�s un choisi au hasard, faisceau de recherche n'est pas la m�me qu'avant la s�lection directe des meilleures fa�ons que nous avons trouv� qu'il peut effectivement augmenter la diversit� de la composition r�sultante.

Nous avons construit deux corpus connexes. Nous montions et avons obtenu quelques scores relativement �lev�s, certains critiques d'articles informatifs, fragmenter le processus. Apr�s l'extraction d'un certain nombre de mots-cl�s, ces mots-cl�s comme un essai de mot de sujet, comme entr�e. De plus, nous avons constat� que beaucoup de gens ont pos� des questions sur le savoir presque corpus, et feront l'objet d'un certain nombre de mots artificiels, nous avons mis ce ramper aussi vers le bas, pour construire un second corpus, corpus est g�n�r� sur la base du savoir texte presque.

Dans l'�valuation, nous avons utilis� une combinaison de fa�on manuelle et automatis�e. Dans 1 � 5 minutes en marquant le tri sur une �valuation manuelle. La pertinence du th�me peut �tre vu dans l'int�grit� et le th�me de notre fa�on d'obtenir de bons r�sultats. Nous avons �galement constat� que la complexit� croissante du mod�le, la longueur de l'article est �galement g�n�r� � progressivement plus.

Voici une comparaison de deux m�thodes pour g�n�rer, sur la base d'une po�sie PNN g�n�r�e, une couverture est une attention bas�e SC-LSTM. Afin de v�rifier l'efficacit� de l'�valuation manuelle, nous avons �galement proc�d� � UEBL d'�valuation automatique, le r�sultat est conforme � la tendance de l'�valuation artificielle, mod�le courant multi-th�me nous l'avons mentionn�, pour obtenir les meilleurs r�sultats.

4 Mashu Ming Universit� de P�kin

Autoencoder Contr�leur adjoint: Am�liorer la repr�sentation du texte pour les m�dias sociaux chinois Texte Summarization

Ce travail est un r�sum� du texte sur les m�dias sociaux chinois, commencer par une br�ve introduction t�che. Ceci est un exemple, la gauche est un contenu de micro-blogging est au sujet d'un article de nouvelles. Cela correspond � droite est un r�sum� des nouvelles, les gens de fumer vol, l'�quipage et les passagers des conflits. Vous pouvez voir le but de cette t�che est bas�e sur le sens du texte original conserv�, le texte de certains r�sum� des m�dias sociaux et la g�n�ralisation.

Il existe deux m�thodes g�n�rales ne r�sum�: un r�sum� est amovible, il est une formule de synth�se. Nous g�n�rative Cet article est un r�sum� de la m�thode utilis�e. formule abstraite g�n�ralement utilis� Seq2Seq mod�le, qui est g�n�ralement la trame, coder un premier codage d'un texte en une repr�sentation de texte, puis d�coder le produit de digestion a g�n�r� correspondant. Nous essayons de faire un peu de temps avec ce mod�le a trouv� quelques probl�mes, car le texte des m�dias sociaux, en g�n�ral, il y aura une expression informelle, et parfois il y aura des fautes de frappe. Dans ce cas, le texte Encoder cod� dans une repr�sentation textuelle d'un �cart, g�n�re une erreur de la derni�re digestion.

Pour r�soudre ce probl�me, nous pouvons penser � des fa�ons de r�soudre, la premi�re m�thode est une m�thode de correction d'erreurs bas�e sur des r�gles pour le bruit. Nous savons que le bruit est une grande vari�t� de textes de m�dias sociaux, on trouve � peine un ensemble de r�gles pour couvrir la plupart du bruit. La deuxi�me m�thode, nous avons un mod�le pour le rendre auto-correction, mais nous ne disposons pas de ces ensembles de donn�es les informations marqu�es, pour faire une marque sp�ciale, est beaucoup de travail et de temps.

Donc, � la fin d'une approche plus r�aliste est de laisser notre propre r�sum� du mod�le pour apprendre � g�n�rer une repr�sentation impartiale du texte. Pour r�soudre ce probl�me, nous proposons une m�thode, est d'utiliser un r�sum� des Autoencoder pour suivre ce mod�le Seq2Seq, il est possible de g�n�rer une repr�sentation impartiale du texte. encodeur R�sum� peut g�n�rer un r�sum� de la repr�sentation du texte. R�sum� g�n�ralement relativement courte, et il n'y a pas de bruit, et plus important encore, il est le sens s�mantique de l'information entre le texte d'origine est la m�me, afin que nous puissions mettre un r�sum� de la repr�sentation de texte estimation approximativement sans biais d'une repr�sentation du texte original.

Des m�thodes sp�cifiques. La construction de laisser un mod�le Seq2Seq attentionbased et un Autoencoder, alors nous utilisons le r�sum� de l'ensemble des donn�es de formation, ces deux mod�les de formation supervis�s. Enfin minimiser leur repr�sentation textuelle de la distance entre ces deux mod�les pour atteindre l'objectif de la supervision et de la formation. Ceci est la phase de formation.

Au cours de la phase d'essai, n'a pas besoin Autoencoder, nous ne devons r�aliser codec Seq2Seq g�n�re un r�sum�.

phase de formation, nous avons �galement ajout� un moyen de formation de combat. Nous avons introduit un discriminateur, laissez-le aller faire la distinction entre le texte original et le texte de repr�sentation textuelle de la repr�sentation abstraite.

section exp�rimentale. Notre ensemble de donn�es est une grande �chelle des ensembles de donn�es de synth�se de micro-blogging, dont 2,4 millions droit d'extrait de texte. Nous avons s�lectionn� r�sum� de texte de la m�thode d'�valuation standard ROUGE, pour �valuer notre mod�le. Nous mettons nos mod�les et faire avant de pr�senter une s�rie de r�sum� de texte connexe du mod�le ont �t� compar�s. Nous pouvons voir que notre mod�le est capable de d�passer tous les mod�les, obtenir de meilleurs r�sultats.

Selon une autre exp�rience a montr� que la m�thode propos�e peut am�liorer consid�rablement la pr�cision du codeur Seq2Seq sur la classification des sentiments, ce qui montre que notre m�thode peut en effet entra�ner un meilleur codeur, il peut obtenir une meilleure repr�sentation du texte.

Nous avons un code open source, bienvenue � t�l�charger.

5 Li Haoran Acad�mie chinoise des sciences Institut de l'automatisation

Phrase multimodaux Summarization avec attention et Modality image Filteringe

Tout d'abord, le premier module est le codage hi�rarchique. Nous utilisons RNN deux voies encode le texte, utiliser l'image de codage CNN. Ensuite, nous devons aussi �tre des images pond�r�es ainsi que du texte et des images g�n�rent le vecteur de contexte de texte, �galement connu sous le m�canisme de l'attention. En plus de cela, nous avons mis en place une base de l'attention modale, nous croyons que certains mots de texte pour fournir plus d'informations, plus de photos et des informations fournies par des mots, de sorte que les besoins d'attention � trouver un �quilibre entre les deux modes.

La deuxi�me image est un filtre, une analyse compl�te de notre texte th�matique pour le d�codage de l'image et l'�tat actuel de la pertinence, l'attention est propos�e sur la base des photos et des images filtre bas� sur le contexte des images vectorielles d'espoir juste �quilibre entre poids suppl�mentaire modal ou image par �l�ment filtrant le bruit caus�.

La troisi�me initialisation du d�codeur. d�codeur � base de texte traditionnel, seule la fonction texte source d'initialisation. Dans le multimodaux, nous esp�rons que ce d�codeur est initialis� en utilisant les informations de l'image. Nous caract�ristiques � base d'images-utilis�es enti�rement connect�es couche CNN et la couche de convolution.

La derni�re strat�gie est le m�canisme de couverture multimodale. Inspir� par le m�canisme de couverture texte, nous avons con�u un m�canisme fond� sur la couverture des signaux visuels, le d�codage du temps o� nous pouvons �tre certains domaines de l'image a donn� une grande attention, et le processus de d�codage ult�rieur, ces zones ne � plusieurs reprises compte tenu de la grande attention. Nous esp�rons r�duire la g�n�ration de mots r�p�t�s.

Enfin, certains de nos r�sultats exp�rimentaux. Pour le mod�le multi-modal, mais sans l'utilisation de l'image du filtre en ce qui concerne seulement les informations de texte, il est tr�s petit ascenseur. Apr�s avoir utilis� l'image des filtres, notre mod�le a �t� consid�rablement am�lior�e. Pour l'initialisation des diff�rents d�codeurs, en fonction des modal initialize couche de convolution, il est le plus efficace. De plus, nous avons constat� que la couverture du m�canisme multimodaux de notre mission utile.

Route de la soie

Apprenez � conna�tre la Chine

Digest algorithme de g�n�ration et sp�ciaux | AIS pr�-s�cher toute la part parlera