Vous voulez �tudier la PNL, je ne comprends pas les mots et les phrases d'inclusion comment la ligne int�gr�s?

Lei Note du r�seau Feng: Cet article est une compilation de la recherche de Lei blog de groupe Feng, titre original The actuel meilleur de la Parole universelle incorporations et Sentence Plongements, auteur Thomas Wolf.

Traduction | Fu Teng, finition Wang Xingyu | Jiang Fan

Spots une petite annonce: programmes d'�tudes C dans le domaine de la PNL, AI Mu CS224n Stanford sont continuellement mis � jour en cours de niveau coll�gial, l'affichage gratuit et illimit�!

Les mots et phrases mod�le int�gr� est d�j� le composant de base d'un syst�me de NLP � une profondeur de l'apprentissage sur la base.

Les mots et phrases sont cod�es dans la densit� du vecteur de longueur fixe, afin d'am�liorer consid�rablement les performances de traitement des donn�es de texte.

� l'heure actuelle une tendance qui est la suivante: Comment construire syst�mes embarqu�s Universal . syst�mes embarqu�s universels qui sont d�j� dans beaucoup de litt�rature sur la base du syst�me de formation, ce syst�me peut �tre form� pour un certain nombre de mod�le de t�che en aval parmi les (analyse des sentiments, la classification, la traduction, etc.), afin de mettre � jour automatiquement les performances de ces mod�les de t�ches, parce que GM a �tudi� les syst�mes embarqu�s sur grands ensembles de donn�es pour caract�riser certaines des caract�ristiques de base d'un mot / phrase et t�ches pour ajuster le mod�le.

Ceci est une forme d'apprentissage de transfert.

� l'heure actuelle la caract�risation de l'apprentissage non supervis� de la phrase est d�j� la norme, et a dur� longtemps, mais au cours des derniers mois, en particulier � la fin de 2017 et au d�but de 2018, il y a eu beaucoup de supervision int�ressantes peuvent �tre migr�s l'apprentissage multi-t�ches et des programmes d'apprentissage.

Mots Actuellement communs / tendances des phrases dans le mod�le int�gr�. Dans cet article, nous allons introduire l'image ci-dessus mod�le dans le logo de la police noire. documentation pertinente sp�cifique figurant � la fin de cet article.

Cet article est seulement pour les derniers mots g�n�riques / phrase syst�mes embarqu�s probablement mis en place, en plus, un aper�u de quelques-uns des d�tails du mod�le, y compris:

Bonne performance / vitesse du mod�le de base: Par exemple FastText, sac de mots (BOW)
Le dernier mod�le: Elmo, Skip-pens�es, rapides-pens�es, InferSent, Sentence usage g�n�ral MILA / MSR Repr�sentations et encodeur Phrase universelle de Google

Le d�but de Let avec le mot mod�le int�gr� il.

Le d�veloppement du mot actuel mod�le int�gr�

Au cours des cinq derni�res ann�es, beaucoup de mots possibles m�thodes ont �t� d'inclusion propos�e. L'un des plus simple inclusion Word2vec et Glove, ils sont utilis�s dans les m�thodes non supervis�es, sont aussi � construire la th�orie de la distribution bas�e sur l'hypoth�se distributive (qui est, si le sens de certains mots apparaissent dans le m�me contexte, ils peuvent avoir la signification identique ou similaire ).

Bien que la m�me p�riode, il y a certaines �tudes sugg�rent une combinaison de connaissances traditionnelles et la m�thode s�mantique et syntaxique bas�e sur non surveill�e, mais entre 2017-2018 ans, la m�thode purement sans supervision encourageant encore des progr�s, le plus notable est le �FastText (Mod�le �tendu de word2vec) et Elmo (le dernier mot en fonction du contexte du mod�le vectoriel).

FastText Tomas Mikolov est une �quipe de travail remarquable, qui a fait exploser l'enthousiasme pour l'�tude des mots int�gr�s dans le mod�le. (Tomas Mikolov est �galement l'initiateur de l'architecture word2vec propos�e en 2013.)

FastText par rapport au vecteur d'origine word2vec am�liorations majeures comprennent le caract�re de ngrams bas� sur un mod�le. Ce mod�le permet au mod�le de calculer le mot int�gr� caract�risant le vecteur de donn�es de formation ne figure pas parmi les mots (� savoir, autre que le mot du dictionnaire).

vitesse vecteur FastText formation appel� rapide et fournit des mod�les pr�-formation bas�e sur Wiki Encyclop�die et ensemble de donn�es Crawl, prend en charge jusqu'� 157 types de langues. Ce sont le mod�le de r�f�rence tr�s important.

Profondeur mod�le de repr�sentation de mot de contexte (ELMO) int�gr� l'am�lioration des performances r�centes en termes �tonnamment similaires. Elmo est propos� et open source par l'Institut de recherche Allen AI et est NAACL 2018 inclus, sera pr�sent�e lors de l'Assembl�e g�n�rale au d�but de Juin 2018.

Elmo au contexte d'un mot de savoir beaucoup.

mod�le Elmo dans lequel chaque mot est donn� une repr�sentation, cette repr�sentation est une fonction, une fonction � laquelle ils appartiennent d�claration au nom de l'ensemble du corpus. Informatique embarqu�e � partir de deux mod�les de langage bidirectionnel (LM) de l'�tat interne, ainsi nomm� du mod�le de langage � Elmo �: Plongements de mod�les de langue.

Elmo caract�ristiques sp�cifiques de:

entr�e Elmo est le caract�re plut�t que des mots. Cela permet aux avantages du niveau de l'unit� de mot Elmo get, de sorte que le mod�le peut calculer la caract�risation significative (et FastText similaire) est en dehors des mots du dictionnaire.
Elmo est li�e combinaison de plusieurs couches de BILM activ�es. Diff�rents encodent mod�le de langue diff�rentes couches d'information du m�me mot (par exemple, POS identifiant peut �tre bien pr�dit mod�le biLSTM, tandis que le haut niveau bas peut BILM d�sambigu�sation sens achev�). La combinaison parall�le de toutes les couches peut recevoir une grande quantit� d'informations est ensuite combin� mot de vecteur de caract�risation, afin d'am�liorer les performances du mod�le de t�che en aval.

Ensuite, regardons les mod�les de phrase g�n�rale int�gr�e.

La mont�e de la phrase g�n�rique mod�le int�gr�

Il y a beaucoup de programmes concurrents peine int�gr�s dans la zone du mod�le. mod�les de base simples comme m�thode moyenne bas�e sur le mot int�gr� continue d'avoir un meilleur r�sultat, de nouvelles m�thodes de programmes d'apprentissage non supervis� et supervis� et un certain nombre de multi-t�ches, est apparu � la fin de 2017 et au d�but de 2018, et a men� une performance int�ressante mise � niveau.

Jetons rapidement un regard sur les nouvelles actuellement quatre types de m�thodes: � partir du mod�le simple vecteur de base moyenne de mot � certaines nouvelles m�thodes dirig�es et non supervis�s, et plusieurs programmes d'apprentissage multi-t�ches (comme pr�c�demment d�crit).

Parlons de consensus dans ce domaine, et qui est le plus simple: mot directe d'un vecteur int�gr� phrase moyenne (appel�e m�thode BOW), nous avons �t� en mesure de fournir des performances assez bonne base, et convient pour la t�che la plus en aval.

Ces m�thodes de calcul de base ont un meilleur algorithmes, plus de d�tails, reportez-vous Arora et al., Publi� en 2017 IPSC dans l'article. Le titre est: Un simple mais difficile � battre de base pour la peine Plongements. mode de r�alisation particulier consiste � utiliser l'un quelconque des incorporation de texte, puis phrase vecteur de mot qui est une int�gration pond�r�e lin�aire. Ensuite, le vecteur r�sultant est constituants normaux ont �t� �limin�s (par exemple, en �liminant les vecteurs de faibles projet�e sur la direction latitudinale du premier composant principal). motivation th�orique profonde et puissante derri�re cette m�thode simple. Cette th�orie est bas�e sur le principe du mod�le de g�n�ration est l'utilisation de mots pour g�n�rer le texte al�atoire vecteur de marche (ici, nous ne discuterons pas les d�tails de la th�orie).

Ceci est une face moulants (un dialogue social AI) mot chaud de dialogue sacs mot graphique. Trier sac de mots (BOW) est relativement l�che, mais tr�s miraculeuse �conomiser beaucoup de la s�mantique de contenu de l'information et de la syntaxe. Ceci est une conclusion int�ressante, les r�sultats ont �galement Conneau et d'autres, l'article r�alis� ACL 2018.

Au-del� de la moyenne simple, la premi�re proposition importante est l'utilisation de la formation sans supervision pour atteindre l'objectif. Ceci est aussi la m�thode de Jamie Skip-pens�es Kiros et ses coll�gues en 2015.

sch�ma d'int�gration de l'apprentissage bas� sur la peine sans supervision est en fait un sous-produit. L'objectif initial de ce sous-produit dans l'espoir que le mod�le peut apprendre � pr�dire une phrase coh�rente, ou tout au moins un r�sum� de la phrase coh�rente. Ces m�thodes (en th�orie) capables d'utiliser l'une des donn�es texte, tant qu'il y donn�es de phrases sommaires ou texte, et est coh�rente et organis�e de mani�re parall�le.

Le mod�le de saut-pens�es est un mod�le int�gr� de phrase typique bas� sur l'apprentissage non supervis�. Il peut �tre un autre mod�le �quivalent � ce mod�le phrase ench�ss�e mod�le skip-gramme. Ce mod�le prototype est bas� mot skip-gramme int�gr� fait. Elle se caract�rise par: la pr�diction d'un mot sp�cifique dans le contexte du mot possible, il est pr�f�rable de pr�voir le contexte d'une phrase phrases donn�es qui peuvent survenir. Le codage bas� sur un mod�le comprend un RNN - d�codeur, le codeur et - le d�codeur doit �tre utilis� pour reconstruire le contexte de la phrase form�, � condition qu'une phrase particuli�re a �t� accord�e.

Skip-pens�e cet article, il est une conclusion tr�s int�ressante que le programme d'expansion du vocabulaire. mots de panneau m�thode de traitement Kiros ne semble pas, en particulier dans la phase de formation de mod�le, le vecteur est appris des mots � partir de mots RNN espace enrobage et noy�s dans un grand mot suppl�mentaire parmi conversion lin�aire entre le mod�le (comme word2vec).

......

Vous voulez continuer � lire, s'il vous pla�t passer � notre communaut� AI Yanxishe: https: //club.leiphone.com/page/TextTranslation/708

Plus de contenu passionnant de faire l'IA Yanxishe.

Les diff�rents domaines, y compris la vision par ordinateur, la s�mantique de la parole, la cha�ne de blocs, pilote automatique, l'exploration de donn�es, le contr�le intelligent, langages de programmation et d'autres mises � jour quotidiennement.

Fin du t�l�phone peut analyser un acc�s de code � deux dimensions

Lei Feng Lei Feng net net

Route de la soie

Apprenez � conna�tre la Chine

Vous voulez �tudier la PNL, je ne comprends pas les mots et les phrases d'inclusion comment la ligne int�gr�s?

Le d�veloppement du mot actuel mod�le int�gr�

La mont�e de la phrase g�n�rique mod�le int�gr�