Universit� de P�kin Professeur Wan Xiaojun: laisser la machine cr�ation litt�raire, quels progr�s et d�fis?

Responsable: Cet article est l'Universit� de P�kin Wan Xiao Jun professeur Forum Byte l'intelligence artificielle Tech 2019 fronti�re Partager sur. Byte Tech 2019 battu par l'Association chinoise de l'intelligence artificielle, octets, organis�e conjointement par l'Universit� de Tsinghua, Acad�mie des sciences, Universit� de Tsinghua donn�es co-organis�e.

Je voudrais parler avant le d�but de la pr�sentation, Pourquoi faire la g�n�ration de langage naturel (NLG), Avant que nous touchons plus d'une compr�hension du langage naturel (NLU), qui est, de comprendre le langage humain, c'est un objectif important du traitement du langage naturel. Maintenant, nous nous attendons � des �quipements intelligents, les machines et les gens � obtenir une communication plus loin, nous devons faire est d'am�liorer encore la technologie NLG, � savoir la technologie de g�n�ration de langage naturel, la vraie machine interaction naturelle avec les humains et d'am�liorer le niveau d'intelligence de la machine.

Tout d'abord, Quelle est la g�n�ration de langage naturel NLG? NLG large �ventail de sous-t�ches diff�rentes en fonction de diff�rents types d'entr�e. Les entr�es incluent des images, audio, feuilles de calcul, texte, etc., sont en fin de compte g�n�rer du texte. Texte pour g�n�rer du texte et peuvent inclure de nombreux types de sous-t�ches. Tels que le texte de sortie en fonction courte longueur de texte, qui est le r�sum� du document, et le texte est r�p�t� R��crivez le texte, similaire � la longueur de l'entr�e et de sortie, la m�me s�mantique du texte d'entr�e pour g�n�rer du texte, mais les diff�rences d'expression de texte se produisent.

En outre, la g�n�ration de dialogue, la traduction automatique appartient �galement � une g�n�ration de t�che de texte � texte. La traduction automatique de texte dans une langue en entr�e, la langue de texte compl�mentaire sortie. g�n�ration de dialogue est g�n�r� sur la base de la r�ponse ci-dessus. Dialogue g�n�re beaucoup de la traduction automatique dans ces deux domaines, g�n�ralement trait�s s�par�ment et non int�gr�s dans le champ de texte est g�n�r�.

En plus du texte pour g�n�rer du texte, il y a des donn�es pour g�n�rer du texte, telles que la cr�ation du texte descriptif financier selon les �tats financiers, ont une utilisation tr�s importante dans le monde des affaires, il y a beaucoup d'unit�s dans l'�tude de cette technologie.

Selon la s�mantique, l'�nonc� de syntaxe repr�sente une g�n�ration de la recherche universitaire est plus une NLG t�che, dans des applications pratiques plus complexes � mettre en uvre, car il impliquera simultan�ment � NLU et NLG deux probl�mes.

Enfin, l'image d'entr�e ou vid�o, g�n�rer du texte, qui est l'objet de la recherche NLG, plus de recherche est concentr�e dans le champ de vision par ordinateur (CV). Nous pouvons voir toute l'�tendue de NLG est tr�s grand, il est mon meilleur d�part personnel � faire r�sum� du document de recherche, puis progressivement NLG autres t�ches de recherche.

NLG est large gamme d'applications, Y compris le d�sormais tr�s populaire chiendent robot de dialogue, g�n�ration digest, g�n�ration de nouvelles, la g�n�ration de la po�sie.

� l'heure actuelle, Grande exigences d'application NLG, la demande de technologie NLG est �galement tr�s large, Y compris de nombreux articles r��crits romans d'�criture de script et ainsi de suite. Mais il est tr�s difficile de r�pondre � ces besoins, laissez l'ordinateur pour obtenir la cr�ation d'un v�ritable sens impossible et nous voulons le faire est de laisser l'ordinateur jouer un r�le de soutien peut �tre. Pour beaucoup l'article r�-�criture, comme la production de papier doux, comment r��crire les articles pour une vari�t� de styles, diffusion sur Internet, de sorte que plus de gens voient. Si la r��criture n'est pas bon pour le contenu des deux articles tr�s similaires, r��crire l'essai sera bloqu�, il faut garder beaucoup sous la r��criture s�mantique originale sans en changer la grande difficult� de ce processus. De plus, l'IA sera l'h�te, le d�bat actuel est tr�s difficile difficult�, bien que temporairement dans l'incapacit� de mettre � utiliser, mais vous pouvez d'abord la recherche et l'exploration.

Avant d'apprendre profond�ment populaire, NLG il y a plusieurs fa�ons, des mod�les � base de r�gles ou de remplissage est l'un d'entre eux, �criture premi�re artificielle les r�gles, les donn�es de remplissage ne, peuvent �galement g�n�rer du texte. En fait, cette m�thode est simple, mais tr�s utile dans de nombreuses applications commerciales. Il peut �galement �tre automatiquement par des m�thodes d'apprentissage machine pour r�sumer automatiquement et obtenir mod�le d'�criture.

Ces derni�res ann�es, la m�thode d'apprentissage en profondeur est largement utilis�, bas� sur la s�quence du codeur au mod�le de conversion de s�quence de trame de d�codeur est le plus courant du mod�le de production de documents, apprentissage de renforcement et de g�n�ration de confrontation des r�seaux principalement afin d'am�liorer le mod�le de s�quence de conversion. Notre architecture de base ou codec, certaines �tudes ont am�lior� codeur, d�codeur et certaines �tudes se sont am�lior�es, afin de renforcer l'effet.

Voici les ressources et les mod�les pour t�che typique NLG. donn�es parall�les seront diff�rentes dans les diff�rentes t�ches de g�n�ration de texte, notamment en fonction de la profondeur des m�thodes d'apprentissage telles donn�es parall�les. Nous voyons un r�sum� de donn�es parall�les t�che g�n�r�e est relativement importante, mais seulement quelques cent mille paires seulement, ces donn�es sont compar�es � la taille de la traduction automatique en termes de donn�es de formation est relativement faible, de sorte que la g�n�ration actuelle ne sont pas id�ales. Maintenant, beaucoup de t�ches de g�n�ration de texte manque de corpus de formation � grande �chelle, et ce corpus de formation est difficile dans l'artificiel � court terme marqu�. La r�alit� est que tous les mod�les de g�n�ration de texte n'est pas parfait, une grande partie du probl�me est que le mod�le de donn�es elles-m�mes, mais aussi pour faire les ajustements appropri�s.

Je tiens � souligner est, le mod�le de r�seau de neurones NLG ne r�ussit pas, m�me si nous avons fait beaucoup de recherches universitaires, a publi� de nombreux articles acad�miques, mais de nombreuses t�ches pour autant que des performances a augment� de 1% � 2%, papier peut �tre fait, mais de point de vue pratique, la technologie est difficile d'atteindre le niveau de satisfaction, donc nous devons aussi continuer � am�liorer dans le mod�le de donn�es.

Notre �quipe a fait beaucoup de texte r�sultant des travaux de recherche, la recherche visant � g�n�rer � texte X, X est une vari�t� d'entr�e, tel que le texte, les donn�es, les images, le code, et ainsi de suite. La sortie du type de texte, y compris des phrases, des r�sum�s courts, des articles, des po�mes, des commentaires et ainsi de suite. Par exemple, une image bas�e sur l'�criture de la po�sie. Les po�mes sont g�n�ralement g�n�r�s par mots-cl�s, �largi en quatre mots-cl�s fond�s sur un th�me donn�, chaque mot cl� en fonction de la sortie d'une ligne de po�sie, quatrains mis ensemble dans un po�me complet. Compte tenu des caract�ristiques de la po�sie, mais aussi de faire un peu de traitement, comme la rime et le rythme, cela est plus facile pour un ordinateur pour r�soudre, peu de contr�le sur ce qui peut �tre r�alis� lorsque le texte de d�codage. Nous ne g�n�rons pas une seule image � partir d'un po�me, mais un po�me g�n�r� � partir d'un ensemble de photos, prises au cours de Voyage comme un groupe de photos, comment g�n�rer un po�me pour d�crire la sc�ne, effectuer l'expression illustr�e, qui est de l'image � des t�ches de conversion de texte. Nous encodeur cadre � base de d�codeur, utilise un m�canisme d'auto-s�lection et le m�canisme de mise au point pour faire face � la pr�sence de bruit et de l'image image de redondance Concentration, la po�sie ne correspond pas � quelques-uns des mots et des probl�mes de contenu de l'image.

Ce chiffre est le r�sultat final, l'image d'entr�e ci-dessus est r�gl�e, nous pouvons g�n�rer des vers et quatrains le coin inf�rieur droit du coin inf�rieur gauche, l'effet global r�sultant est la bonne po�sie. Nous allons �galement pr�senter d�mo pertinente.

champ de g�n�ration de langage naturel il y a encore des d�fis.

Tout d'abord, � l'heure actuelle, notre �valuation tels que UEBL, ROUGE, etc. ne sont pas assez pr�cis, mais le manque d'�valuation de la stabilit� artificielle, pas facile � utiliser, comment trouver une �valuation pr�cise et objective de l'automatisation, cette contribution � l'art plus que la contribution de tout mod�le.

En second lieu, Comment g�n�rer dans des cas rares corpus de texte parall�le, m�me g�n�ration de texte non surveill�e � la fin il peut ne pas �tre possible, mais il ne fait aucun doute que, si le corpus suffisant pour obtenir l'effet de g�n�ration de texte supervis� sera certainement mieux.

En troisi�me lieu, Comment d�coder un texte long, le d�codeur de texte actuel peut r�soudre des dizaines de mots, mais quelques centaines de mots de d�codage direct, la s�quence de milliers de mots peut �tre difficile, comment atteindre cet objectif m�rite d'�tre examin�e.

Enfin, Cross-modalit� fa�on dont le texte est g�n�r� un niveau �lev�, � savoir plug-parler. La figure est les timbres 2019, nous voyons le timbre, vous dire quelque chose, ou quoi �crire un article il?

Il y a mille mille lecteurs Hamlet, chaque personne perspective de la pens�e. Les r�sultats de l'outil de g�n�ration de plug-parler de Microsoft CaptionBot est � Je pense que c'est le personnage de dessin anim� �, ce r�sultat ne peut pas dire tout � fait tort, mais � cause du mod�le et des donn�es, la compr�hension s�mantique de l'image de la machine est encore tr�s faible et ne peut pas �tre le raisonnement Lenovo. Si les auteurs humains � �crire, vous pouvez penser � beaucoup de choses, comme d'encourager les �l�ves � trois enfants, la pression d'apprentissage, les enfants grandissent front, �clair� toute la journ�e pour le travail, sa m�re a br�l�, VEILLE mon p�re, encore brillant et ainsi de suite. Ainsi, nous constatons que l'imagination humaine est tr�s forte, il sera associ� � un large �ventail de connaissances et d'indices, pour cr�er un des articles riches et int�ressants. Bien que maintenant connu comme l'intelligence artificielle est tr�s puissant, mais en r�alit�, au moins pour g�n�rer des t�ches de texte, et les LAG humains loin derri�re, et maintenant utiliser uniquement dans le commerce AI doit r�soudre r�p�titive d'�criture simple, vous ne pouvez pas cr�er en profondeur article. Il y a un �cart entre la communaut� universitaire � des fins de recherche est l'occasion, apr�s tout, il y a des lacunes, il y a des lacunes, seules les recherches n�cessaires.

Merci.

Editeur: Wen Jing - FIN -

attention Tsinghua - donn�es Acad�mie des sciences de Qingdao plate-forme publique micro-canal officiel " donn�es d'envoi THU � Sisters et n � � Les donn�es envoy�es THU � Pour plus de conf�rences et de bien-�tre contenu de qualit�.

Route de la soie

Apprenez � conna�tre la Chine

Universit� de P�kin Professeur Wan Xiaojun: laisser la machine cr�ation litt�raire, quels progr�s et d�fis?