Google BERT open source sans effort d�tendu formation mod�le de langage naturel

Cet article est une compilation de technologie blog AI Yanxishe, le titre original:

Google Open Sources BERT � se entra�ner en langage naturel Mod�les sans casser la Banque

Auteur | Jesus Rodriguez

Traduction | Mich�e Une fa�on Relecture nord | sauce Fan Li

Finition | soeur ananas

Lien original:

https://towardsdatascience.com/google-open-sources-bert-to-train-natural-language-models-without-breaking-the-bank-813ef38018fc

Google BERT open source sans effort d�tendu formation mod�le de langage naturel

� l'heure actuelle le mod�le de traitement du langage naturel est une technologie de pointe de l'intelligence artificielle, ils sont beaucoup de syst�mes d'IA interagissent avec l'interface utilisateur. principal obstacle vient du mod�le de d�veloppement de la PNL repose sur des donn�es de marque de haute qualit�. Comme la langue est un m�canisme d'�change universel que tout ce qui peut �tre appliqu�, ce qui signifie qu'il est difficile de trouver un champs de donn�es d'annotation de sp�cifiques pour former le mod�le. Pour relever ce d�fi, le mod�le linguistique de formation PNL a d�cid� d'utiliser le principe de la grande quantit� de donn�es sans �tiquette. Tr�s c�l�bre mod�le de pr�-formation comprend Word2Vec, gants ou fastexte. Cependant, le mod�le de pr�-formation a ses propres d�fis, dans le contexte de l'expression de grandes quantit�s de donn�es �chouent souvent. R�cemment, des chercheurs de l'�quipe GOOGLE linguistique AI du projet de code open source BERT, une formation pr�-langue et les biblioth�ques de la sant�, ainsi que leurs r�sultats de formation obtenus de tr�s bons r�sultats.

Repr�sentations de codeur bi-directionnel Transformateurs (BERT) est issue d'une �tude interne de Google, mis en avant diff�rentes m�thode d'acquisition de donn�es dans un mod�le de pr�-formation d'un grand nombre de langue contextuelle dans. Ces expressions peuvent �tre utilis�es dans des domaines sp�cifiques des t�ches PNL, questions et r�ponses d�claration similaire, l'analyse des sentiments. Rel�chez projets open source, aussi bien dans la mise en uvre des documents techniques tensorflow pr�sent�s, ainsi qu'une s�rie de mod�le de pr�-formation.

R�cup�ration et contexte bidirectionnel

Maintenant, vous voudrez peut-�tre conna�tre un autre BERT et autre lieu de mod�le de pr�-formation. En th�orie, les techniques de formation en PNL peuvent �tre pr�d�finis sans contexte, le contexte peut �tre r�cup�r� avec l'autre. Contexte mod�le ind�pendant, ou similaire word2vec GloVegenerate seule expression de mot est un vocabulaire int�gr�. Par exemple, � football � Ce mot a la m�me s�mantique que la d�claration suivante: � Je suis all� � un match de football �, �J'ai eu quelques joueurs de football du Real Madrid �.

G�n�ration d'une r�cup�ration de mod�le de contexte n'est pas exprim� par une seule d�claration de mot, mais exprim� pour g�n�rer des phrases fond�es sur d'autres mots � dire dans les diff�rentes directions. Dans notre exemple, le contexte du mod�le requ�te recherche � football � selon le sens de l'expression � je suis all� .. � ou �j'ai rencontr� ... � produit plut�t que la � race �, � joueur du Real Madrid. � Essentiellement, le style peut �tre r�cup�r�, mod�le plus pr�-formation peut �tre un contexte sans contexte en profondeur, peut �tre la nature unidirectionnelle ou bidirectionnelle.

BERT en cr�ant un contexte de r�cup�ration qui signifie contextuellement de la s�mantique des mots, l'extension de l'approche mod�le de pr�-formation avant, enrichir le mod�le de langage. Atteint les deux sens, la recherche s�mantique contextuelle est pas aussi facile que cela puisse para�tre dans le mod�le de la PNL. Bidirectionnel plus grande difficult� r�side pas seulement dans le mod�le de formation d'un front et � l'arri�re d'un mot de mot comme contexte, le mot peut faire indirectement � la recherche de � eux-m�mes � dans un mod�le multi-couches. Google BERT utilise une architecture tr�s intelligent pour relever ce d�fi.

architecture

BERT mod�le d'architecture multicouche bas�e sur le d�codage de conversion dans les deux sens, et le principe de tensor2tensor biblioth�que est tr�s similaire. BERT a un mod�le OpenAI TPG ou Elmo et d'autres pr�-formation est tr�s similaire � l'architecture du r�seau. Cependant, comme indiqu� ci-dessous avec une connexion bidirectionnelle entre le convertisseur.

BERT plus grande contribution est l'utilisation de deux t�ches de pr�diction non surveill�e exotiques pour relever les d�fis mentionn�s pr�c�demment. Alors que le mot de telle sorte que dans le contexte de l'article dans � se reconna�tre � possible. Adresse BERT ce d�fi en utilisant une vari�t� de mission de pr�-formation: un bouclier et une pr�vision inf�rieure. Le premier mod�le de pr�-masquage environ 15% de la parole d'entr�e, ex�cuter toute la profondeur de la communication bidirectionnelle de convertisseur d�cod�, et seule la pr�diction de mots ombr�e, par exemple:

La seconde t�ches de pr�traitement g�n�r�s au hasard par l'instruction simple corpus, �tudier le lien entre les d�clarations. Compte tenu de deux d�clarations A et B, B de A est la d�claration apr�s? B corpus ou mot juste choisi au hasard?

Ces deux pr�-t�che combin�e rend BERT se sont enrichis, l'expression s�mantique bi-directionnelle dans presque toutes les t�ches de la PNL.

Utilisez BERT a deux phases: pr�-formation et de r�glage fin

Pr�formation: relativement cher (4 course sur les nuages 4 � 16 PUT jours), mais pour chaque langue, pour ex�cuter une seule fois. Afin d'att�nuer la gravit� de la t�che, Google a annonc� le lancement de plusieurs mod�les pr�-formation qui peut �tre utilis� sc�ne PNL.
Fin: tr�s pas cher, tout ce qui peut �tre fait sur le travail de papier peut �tre compl�t� dans un TPU nuage d'une heure, ou utiliser le GPU, puis prendre quelques heures. � partir du m�me mod�le de pr�-formation.

BERT pratique

Google BERT comme r�f�rence � d'autres bons syst�mes de PNL, a accompli des r�alisations remarquables. Plus important encore, tous les r�sultats obtenus bert sans changer la structure du r�seau de neurones en fonction de la t�che. Dans SQUAD V1.1, BERT et atteint 93,2% du score de F1 (calcul� score de pr�cision), d�passant la traduction humaine 91,2% et 91,6% du mod�le pr�c�dent.

BERT a �galement augment� de 7,6% de r�f�rence de COLLE de r�f�rence, et une t�che de collecte 9 types de compr�hension du langage naturel (NLU).

Apprendre un mod�le de langage de la migration r�cente a apport� beaucoup de empiriques am�liorer le spectacle d'un grand nombre de mod�le de pr�-formation non supervis�e est une partie importante de nombreux syst�mes de compr�hension linguistique. BERT indique que l'acquisition de deux voies, il est possible d'exprimer le contexte de la langue dans le mod�le de la PNL pr�-traitement. � l'heure actuelle tensorflow BERT permet aux d�veloppeurs de mettre en uvre cette technologie de pointe dans leur sc�ne PNL tout en maintenant la g�rer des co�ts de calcul. Lei Feng Lei Feng Lei r�seau de r�seau de r�seau Feng

Je veux continuer � voir les articles liens et r�f�rences connexes?

Appuyez sur et cliquez pour ouvrir le lien suivant:

AI Yanxishe contenu passionnant mis � jour tous les jours, pour voir plus de contenu:

CVPR 2018 R�sum�: La premi�re partie

Ce 25 projet d'apprentissage machine open source, la plupart des gens que je ne dis pas Ta

Comment am�liorer consid�rablement la vitesse de votre mod�le d'efficacit� de la formation?

Circonvolution avec quatre types de r�seaux de neurones, la classification des images de la mode d�tendue

En attendant vous interpr�tez:

Route de la soie

Apprenez � conna�tre la Chine

Google BERT open source sans effort d�tendu formation mod�le de langage naturel

R�cup�ration et contexte bidirectionnel

architecture

BERT pratique

CVPR 2018 R�sum�: La premi�re partie

Ce 25 projet d'apprentissage machine open source, la plupart des gens que je ne dis pas Ta

Comment am�liorer consid�rablement la vitesse de votre mod�le d'efficacit� de la formation?

Circonvolution avec quatre types de r�seaux de neurones, la classification des images de la mode d�tendue

2018,11 Top texte r�seau d'apprentissage machine Dix

Comment se d�marquer dans la science des donn�es d'entrevue

25 peut �tre plac� dans le lac des ensembles de donn�es de recherche de donn�es vocales

Un article que vous lisez avec un WaveNet: assistant Google synth�tiseur sonore