IPSC 2020 de papier | suppl�mentaire objectif avant gaussienne pour faciliter l'ignorance de la diversit� n�gative

Auteur | Universit� nationale Chiao Tung �quipe Zhao

Modifier | Camel

Source: informatique et de g�nie, Universit� Jiaotong de Shanghai

Conf�rence internationale sur les repr�sentations d'apprentissage (IPSC) (Conf�rence internationale d'�tude de caract�risation) est la r�union de haut de la profondeur de l'apprentissage. IPSC 2020 aura lieu le 26 Avril 2020 dans la capitale �thiopienne Addis-Abeba, la session en cours a re�u un total de 2594 articles, 687 ont �t� re�us, dont 48, 108 projecteurs orals et 531 affiche Pian. Il a �t� engag� dans ce 687 l'article 34 est sur papier. Shanghai Jiaotong University D�partement de l'interaction intelligente informatique et g�nie cognitif, Laboratoire cl� de Shanghai professeur Gao Xiao Zhao et ses collaborateurs papiers a �t� nomm� l'un des ICLR2020 sur papier.

Th�se intitul�e: � Avant gaussienne en fonction de donn�es objectives pour la g�n�ration de langage �, le premier auteur du document est un guide candidat au doctorat Professeur Zhao de huiler les �tudiants, le professeur Zhao est co-auteur correspondant.

la compr�hension du langage Pearl est la plus haute intelligence artificielle. Comme Richard Feynman (Richard Feynman) la maxime bien connue, � Je ne peux pas cr�er quelque chose, je ne peux pas le comprendre. � g�n�ration de langue refl�te le niveau de d�veloppement de la compr�hension du langage.

Ces derni�res ann�es, le mod�le de g�n�ration de langage fait d'importants progr�s, en particulier dans le r�seau de neurones profond (DNN) un d�veloppement rapide. Il existe plusieurs g�n�ration de mod�le de langage typique, telle qu'une s�quence de mod�le de s�quence (seq2seq), g�n�r� contre le r�seau (GAN), la variation du codeur (VAE) et le r�seau autor�gressif.

g�n�ration de langue est souvent mod�lis� comme une t�che de pr�diction de la s�rie, la s�quence en utilisant l'estimation de vraisemblance maximale (MLE) en tant que lignes directrices de formation standard (c.-�-la cible). MLE en raison de sa nature et de flexibilit� intuitive a �t� un grand succ�s. Cependant, en raison de la MLE, la s�quence pr�dit la pr�sence des questions suivantes:

Exposition Bias: pas de mod�le dans le processus de formation est expos� � toutes les erreurs;
perte Mismatch: dans le processus de formation, nous maximisons la vraisemblance, et dans le processus de raisonnement, le mod�le est �valu� par les diff�rents indicateurs (par exemple, ou ROUGE BLEU);
Le manque de diversit�: ennuyeux texte g�n�r�, ordinaire, tel que le manque de vision et de la r�p�tabilit�;
ignorance de la diversit� n�gative: MLE incapable de r�partir la fraction appropri�e des diff�rents r�sultats du mod�le d'erreur, ce qui signifie que toutes les erreurs dans les sorties de processus de formation sont trait�s de mani�re �gale.

En plus de la diversit� de l'ignorance que n�gative, il y a eu une vari�t� de travail peut att�nuer ce qui pr�c�de MLE que l'absence d'objectifs de formation. l'ignorance de la diversit� n�gative est injustement sous-estim� l'unit� association situ�e dans la cible, en raison de la pr�sence de l'unit� de g�n�ration de langue cible proche d�finie, etc. exprimant une situation similaire, ce qui rend la s�quence de langage de g�n�ration de t�che sp�cifique � la t�che de pr�diction g�n�rale. Lorsque l'on compare la MLE sa s�quence cible et pr�dire la s�quence r�elle, elle a adopt� une politique qui correspond � la fois. s�quence Pr�visible sera donn�e les �tiquettes binaires correctes ou incorrectes. Cependant, ces formations de pr�diction incorrecte peut varier, donc savoir quel mod�le plus pr�cis�ment pr�dit erron� ou incorrect, peut-�tre plus efficace que d'autres erreurs de mod�le d'orientation de la formation des pr�visions.

Par exemple, la phrase � la peu �gar�on est assis sur le fauteuil � g�n�ration, par exemple (figure 1), la g�n�ration du � fauteuil �les �tudiants peuvent devenir � tort � canap�s �mais ne devrait g�n�ralement pas �tre confondu avec � champignons �.

Figure 1: Exemple de production D2GPo

Afin d'all�ger le probl�me de la diversit� ignorante n�gative, nous avons ajout� un but avant gaussienne suppl�mentaire pour ajouter un �l�ment suppl�mentaire de d�viation de perte Kullback-Leibler (KL) pour am�liorer la formation MLE actuelle. Est calcul� en comparant deux perte distribution de probabilit� suppl�mentaire, la distribution de probabilit� � partir d'une premi�re formation d�taill�e d'un mod�le pr�dictif, la deuxi�me unit� de distribution de probabilit� de la v�ritable r�partition spatiale, et est d�finie comme �tant une distribution a priori gaussienne des donn�es relatives �. Ensuite, le terme de divergence KL gaussienne apr�s les donn�es, avant li�es � la cible (D2GPo) est inject� dans la perte finale. D2GPo avec �loign�es donn�es Gaussienne avant (L2 r�gularisation) ind�pendant commun, L2 r�gularis�e but MLE est de simplifier la formation, qui est directement appliqu�e sur les pertes MLE.

Les r�sultats exp�rimentaux montrent que cette m�thode peut effectivement utiliser les donn�es plus en d�tail l'information pr�alable, et peut am�liorer consid�rablement les performances d'une des t�ches typiques de g�n�ration de langues, y compris la traduction automatique supervis�e et non supervis�e, texte r�sum�, la narration et les images r�sum� ( la figure 2).

Figure 2: R�sum� des exemples d'image

Figure 2: Mod�le de r�f�rence Exemple D2GPo dans l'image, nous pr�sentons un r�sum� de la t�che. Comme on peut le voir dans les exemples ci-dessus utilisent des rendements du mod�le de formation CSTD plus pr�cis et un r�sum� d�taill� de l'image et le mod�le form� utilise le retour D2GPo � une des phrases grammaticales plus compl�tes, qui d�montrent l'efficacit� de D2GPo dans la t�che de g�n�ration de langage.

Documents lien: https: //openreview.net/pdf id = S1efxTVYDr?

Pour plus d'informations IPSC 2020, aura lieu dans � groupe d'�change IPSC 2020 �, les moyens ajout� de groupe: Ajout AI Yanxishe haut assistant (AIyanxishe2), notes � IPSC � invit� dans le groupe.

Route de la soie

Apprenez � conna�tre la Chine

IPSC 2020 de papier | suppl�mentaire objectif avant gaussienne pour faciliter l'ignorance de la diversit� n�gative