Article pour l'�volution de l'histoire de g�n�ration de langage naturel!

NLG (g�n�ration du langage naturel, NLG) fait partie du traitement du langage naturel, et analogues � partir de la base de connaissances sous la forme d'un syst�me de machine ou de la logique pour g�n�rer une expression de langue naturelle. En fait, la g�n�ration de langage naturel est apparu depuis longtemps, a �t� en 71 ans. D�s 1948, Shannon a mis le mod�le de probabilit� discr�te langage de description de processus de Markov utilis� dans la machine automatique. Mais la technologie de g�n�ration de langage naturel commercial connu r�cemment devenu populaire. Cependant, vous comprenez l'�volution de l'histoire de la g�n�ration du langage naturel faire?

Depuis la naissance des films de science-fiction, la communaut� sera tr�s fascin� par l'intelligence artificielle. Chaque fois que nous entendons "intelligence artificielle" quand le mot, viennent � notre esprit, souvent des films de science-fiction de l'avenir des robots, tels que "Terminator" ( "Terminator"), "The Matrix" ( "The Matrix" ) et "I, robot" ( "I, robot") et ainsi de suite.

Bien que nous puissions penser ind�pendamment du robot encore quelques temps des ann�es, mais au cours des derni�res ann�es, le domaine de l'apprentissage de la machine et la compr�hension du langage naturel a fait des progr�s significatifs. assistant personnel (Siri / Alexa), et Q & A application robot bot est vraiment r�volutionnent la fa�on dont nous interagissons avec des machines, et ont commenc� � infiltrer notre vie quotidienne.

NLU (Compr�hension du langage naturel, NLU) et g�n�ration du langage naturel (g�n�ration du langage naturel, NLG) est l'un des plus rapide le d�veloppement d'applications d'intelligence artificielle, parce qu'il ya un besoin croissant de comprendre le langage et le sens d�duisent, et la langue caract�ristique est qu'il ya beaucoup d'ambigu�t�s et de la structure diversifi�e. Selon Gartner, � en 2019, la g�n�ration de langage naturel deviendra une caract�ristique standard de 90% de l'intelligence d'affaires moderne et d'analyse plate-forme. � Dans cet article, nous allons discuter d'un bref historique du d�but de la mise en place de la g�n�ration du langage naturel, ainsi que sa direction de d�veloppement dans les prochaines ann�es.

Quelle est la g�n�ration de langage naturel?

objectif de g�n�ration de langue est de pr�dire le mot suivant dans la phrase pour transmettre des informations. Utiliser mod�le de langage peut �tre r�solu (en millions de possibilit�s) qui peuvent �tre pr�dits probl�mes de mots, le mod�le de langue est une distribution de probabilit� de s�quences de mots. Le mod�le de langage peut �tre le niveau de caract�re, le niveau n-gramme, une phrase ou m�me niveau de construction au niveau du paragraphe. Par exemple, pour pr�dire Je dois apprendre comment __ �Apr�s le mot suivant, la prochaine s�rie de mots possibles est associ� � un mod�le de probabilit�, peut �tre �criture , drive �Et ainsi de suite. Les derniers progr�s des r�seaux de neurones (tels que les r�seaux de neurones r�currents et le r�seau de la m�moire � long terme) est un long processus phrases possible, am�liore consid�rablement la pr�cision du mod�le linguistique.

cha�ne de Markov

cha�ne de Markov est une de la premi�re pour l'algorithme g�n�r�. Ils ne en utilisant le mot courant pour pr�dire le mot suivant dans la phrase. Par exemple, si le mod�le est uniquement disponible pour la formation de la phrase suivante: Je boire un caf� le matin �et Je mange Sanwiches avec du th� Ensuite, il devrait caf� �suivront boisson La possibilit� est de 100%, alors que Je �Suivre boisson �La possibilit� est de 50%, suivie manger �La possibilit� est �galement de 50%. cha�ne de Markov est calcul�e en tenant compte de la probabilit� d'une relation unique entre chaque mot d'un mot. Dans les versions ant�rieures de la m�thode d'entr�e de t�l�phone intelligent, cha�ne de Markov pour g�n�rer une recommandation pour le prochain mot dans une phrase.

Cependant, en raison du mod�le de Markov seulement pr�occup� par le mot courant, et donc perdre tout le contexte et la structure de la phrase devant le mot, ce qui peut conduire � des pr�dictions erron�es, de cette fa�on, elle limite leur applicabilit� dans de nombreuses sc�nes g�n�r�es .

Recurrent Neural Network (RNN de)

mod�le de r�seau neuronal est inspir� par le cerveau humain et la mise en place d'op�rations par la mod�lisation de la relation non lin�aire entre l'entr�e et la sortie, le calcul fournit un autre proc�d�, leur utilisation dans la mod�lisation de langage est appel� neuro-linguistique la mod�lisation.

nature s�quentielle r�currente r�seau de neurones sont capables d'utiliser une entr�e de r�seau de neurones. Il passe � travers un r�seau feed-forward de chaque s�quence, et d�livre en sortie le mod�le en tant que l'entr�e suivante dans la s�quence, ce qui permet le stockage d'informations � partir de l'�tape pr�c�dente. r�seau de neurones r�current avec toute la capacit� de � m�moire � qui les rend id�ales pour la production de langue, parce qu'ils peuvent se rappeler le contexte du dialogue au fil du temps. les r�seaux de neurones r�currents et des cha�nes de Markov diff�rent en ce qu'ils observent �galement le mot vu pr�c�demment (la cha�ne de Markov en vue de face seul mot) pour la pr�diction.

Langue pour les r�seaux de neurones r�currents g�n�r�s

En m�moire et calcule la probabilit� du mot suivant d'un mot stock� dans chaque it�ration du r�seau de neurones r�currents, le mod�le sera rencontr� avant. Par exemple, si le mod�le g�n�re un texte Nous avons besoin de louer un __ , Il faut maintenant calculer le mot suivant dans cette phrase. Pour chaque mot dans le dictionnaire, un mod�le de distribution de probabilit� bas�e sur un mot avant qu'il ne voit. Dans notre exemple, maison �ou voiture La probabilit� de ces deux mots que rivi�re �ou d�ner Ce mot est beaucoup plus �lev�. S�lectionnez ensuite la plus forte probabilit� et le mot en m�moire, puis passez � la prochaine it�ration de son mod�le de stockage.

La pr�sence du r�seau de neurones r�currents, une limitation importante: gradient disparaissant. Avec une longueur croissante de la s�quence, le r�seau de neurones r�currents ne peut pas �tre stock� dans les phrases de mots arri�re loin rencontre, et ne peut �tre pr�dite sur la base du mot le plus r�cent. Cela limite le bruit g�n�r� longues phrases coh�rentes utilis�es dans le r�seau de neurones r�currents.

Court et r�seau de la m�moire � long terme (LSTM)

Sur la base de r�seau de neurones du r�seau de m�moire � court et � long terme est une variante de r�seaux de neurones r�currents, il est possible de traiter plus pr�cis�ment l'entr�e d�pendance � long terme (d�pendances � longue port�e) dans la s�quence de probl�mes que le r�seau neuronal r�current moyenne. Ils sont utilis�s dans une grande vari�t� de questions. Similaire m�moire � long terme r�seau neuronal r�current ayant une structure de cha�ne de r�seau, mais elles sont constitu�es d'un r�seau de neurones � quatre couches, le r�seau neuronal r�current plut�t que le r�seau en une seule couche. Un r�seau d'unit� de m�moire � long terme, une porte d'entr�e, la sortie des portes de grille et l'oubli quatre parties. Un tel r�seau de neurones r�currents en ajustant le flux d'informations � l'int�rieur et � l'ext�rieur de l'appareil, ou oublier de se souvenir des mots dans ne importe quel intervalle de temps.

Langue pour g�n�rer le r�seau de la m�moire � long terme

La phrase suivante comme entr�es du mod�le: Je suis d'Espagne. Je parle couramment __. �Afin de pr�dire correctement le mot suivant est un espagnol Le mod�le se concentrera sur la phrase pr�c�dente Espagne �Le mot et utiliser l'unit� de m�moire � � se souvenir � il. L'unit� de traitement de l'information stocke la s�quence, puis utilis�e pour pr�dire le mot suivant. Face � un arr�t complet, oubliez la porte se rendra compte que le contexte de la phrase peut changer, les informations sur l'�tat actuel de l'unit� peut �tre ignor�e. Ainsi, le r�seau peut s�lectivement tracer que les informations pertinentes tout en minimisant disparaissant gradient, le mod�le sera en mesure de se rappeler des informations sur une plus longue p�riode de temps.

Court et r�seau de la m�moire � long terme et ses variantes semble �liminer le gradient pour produire une r�ponse aux questions de phrase coh�rente. Cependant, �tant donn� qu'il reste un chemin s�quentiel complexe de l'unit� pr�c�dente � la cellule actuelle, et donc la quantit� d'informations peuvent �tre stock�es il y a des limites. En cons�quence, les r�seaux de m�moire � long terme peuvent se souvenir de la longueur de la s�quence est limit�e � moins de quelques centaines de mots. Un autre inconv�nient est que, en raison des exigences �lev�es de calcul, et donc difficile � un r�seau de formation � court et � long terme. En raison de la nature s�quentielle, ils sont difficiles � parall�liser, ce qui limite leur capacit� � utiliser des dispositifs informatiques modernes (par exemple, GPU, TPU ou similaires) de.

transformateur

Transformateur initialement dans le document Google � L'attention est tout ce qu'il faut � introduit, il a propos� une nouvelle m�thode pour � m�canisme d'auto-focus � (m�canisme d'auto-attention) est. Transformer il est largement utilis� dans une vari�t� de t�ches de traitement du langage naturel telles que le langage de mod�lisation, la traduction automatique et g�n�ration de texte. Transformateur par un ensemble d'un ensemble de codeur et le d�codeur, le premier proc�d� de longueur quelconque, qui d�livre en sortie la phrase produite.

Dans l'exemple ci-dessus, un codeur destin� � traiter une phrase d'entr�e et g�n�re. Le d�codeur utilise cette repr�sentation pour cr�er le mot de sortie par phrase mot. Chaque mot repr�sente un accident / int�gr� par les cercles vides repr�sentent. Ensuite, puisque le mod�le utilise les informations de tous les autres mots de polym�risation d'attention, chaque mot pour g�n�rer une nouvelle repr�sentation, repr�sent�e par les cercles pleins, par l'ensemble notificateur de contexte. Cette �tape est r�p�t�e une pluralit� de fois et ensuite en parall�le � tous les mots, la nouvelle pr�sentation successive. De m�me, chaque d�codeur g�n�re un mot de gauche � droite. Il est non seulement pr�occup� par les autres mots cr��s pr�c�demment, le codeur �galement pr�occup� par le d�veloppement de la repr�sentation finale.

Et � long et r�seau de m�moire � court terme est diff�rent, Transformer effectue seulement une petite quantit� d'un nombre constant d'�tapes, tout en appliquant le m�canisme d'auto-attention. La relation entre tous les mots de ce m�canisme phrase analogique directe, quel que soit leur emplacement respectif. Lorsque le mod�le de processus de chaque mot dans la s�quence d'entr�e, �tant donn� que le m�canisme de mise au point d'entr�e permet au mod�le pour d'autres parties de la s�quence, afin de mieux le mot cod�. Il utilise une pluralit� de t�tes de focalisation (t�te de l'attention), �tend les capacit�s du mod�le d'int�r�t des endroits diff�rents, sans tenir compte de la distance dans la s�quence.

Ces derni�res ann�es, l'architecture du transformateur ordinaire a apport� quelques am�liorations, d'am�liorer consid�rablement leur vitesse et la pr�cision. 2018, Google a publi� un document sur le transformateur (BERT) codeur � deux voies repr�sent� le papier pour une vari�t� de traitement du langage naturel pour g�n�rer des r�sultats les plus avanc�s. De m�me, en 2019, OpenAI a publi� un mod�le de langage � base de transformateur, qui a environ 1,5 milliard de param�tre, entrez quelques lignes de texte que tr�s peu peuvent g�n�rer long article coh�rent.

Transformateur pour la production de langue

R�cemment, Transformer aussi pour la production de langue. L'un des plus c�l�bre exemple est le mod�le TPG-2 OpenAI de la langue. Le mot suivant dans l'apprentissage du mod�le de pr�vision de la phrase, apprend en attirant l'attention sur ce mot de pr�diction du mot suivant pertinent.

Transformer g�n�rer le texte est bas� sur une structure similaire � la traduction automatique. Si nous prenons une phrase: Sa robe avec les points qui sont rose, blanc et __. Mod�le va pr�dire le mot suivant est bleu Comme il passe � travers le m�canisme de l'attention de la liste des analyses de mot pr�c�dent pour la couleur ( blanc et rose ), Pr�dire et comprendre le mot devrait �tre une couleur. Comme il existe diff�rentes parties du mod�le d'attention permet une attention s�lective � chaque mot de la phrase, non seulement de se rappeler bloc r�cursif (bloc r�current) quelques-unes des caract�ristiques (dans le r�seau de neurones r�currents et des r�seaux de m�moire � court et � long terme), et la plupart de ces fonctionnalit�s ne sont pas il sera utilis� dans plusieurs blocs. Ce mod�le peut aider � rappeler la phrase pr�c�dente plus de fonctionnalit�s, et des pr�visions plus pr�cises et coh�rentes. Diff�rent du mod�le pr�c�dent, le transformateur peut identifier tous les mots dans ce contexte, sans toute l'information est une compression de longueur fixe. Cette architecture permet de conserver Transformer l'information des peines plus longues, mais sans augmenter de mani�re significative les besoins informatiques. Dans le cas o� ils ne ont pas besoin de modifier le domaine sp�cifique, la performance inter-domaines des pr�c�dents mod�les plus performants que d'autres.

Le langage de la g�n�ration future

Dans cet article, nous voyons l'�volution de la production de langue, la g�n�ration d'une phrase simple en utilisant la cha�ne de Markov, � utiliser la g�n�ration de mod�le de m�canisme d'auto-attention plus texte coh�rent. Cependant, nous sommes encore dans le langage de mod�lisation de premi�re g�n�ration, et transformateur est qu'une �tape dans la direction de l'�tape de g�n�ration de texte r�el ind�pendant. De plus, le mod�le de g�n�ration d�veloppe �galement d'autres types de contenus, tels que des images, vid�o et audio. Cela ouvre la possibilit� de ces mod�les et de g�n�rer du texte int�gration du mod�le, afin de d�velopper un assistant personnel avanc� avec interface audio / vid�o.

Cependant, en tant que soci�t�, nous devons faire attention � mod�le de g�n�ration d'applications, car ils g�n�rent de fausses nouvelles en ligne, usurpation d'identit� et de faux commentaires ouvre de nombreuses possibilit�s. OpenAI a d�cid� de ne pas lib�rer le mod�le TPG-2, par crainte d'�tre victimes de violence. Cela refl�te un fait: nous entrons maintenant dans un mod�le de langage assez puissant pour la cause �re de pr�occupation.

mod�le de g�n�ration devrait changer nos vies, mais ils sont aussi l'�p�e � double tranchant. Nous devons �tre revue modeste de ces mod�les, que ce soit par des institutions de recherche ou la r�glementation gouvernementale. Au cours des prochaines ann�es, ce domaine va certainement faire plus de progr�s. Quel que soit le r�sultat, l'avenir, devrait finalement il y aura un moment passionnant!

Lien original:

https://medium.com/sfu-big-data/evolution-of-natural-language-generation-c5d7295d6517

Route de la soie

Apprenez � conna�tre la Chine

Article pour l'�volution de l'histoire de g�n�ration de langage naturel!