Source: tensorflow

Cet article sur 3144 mots lecture recommand�e 9 minutes .

Cet article d�crit comment atteindre �volutif, rapide et d�ploiement efficace par BERT �cosyst�me tensorflow de.

mod�les Transformer (en particulier �mod�le BERT ) A apport� de grands changements � la PNL et l'analyse des sentiments, l'extraction d'entit�s et les t�ches de traitement sur les questions du quiz, ont aussi une nouvelle perc�e. mod�le BERT permet aux donn�es scientifiques se tiennent sur les �paules de g�ants. Chaque entreprise a mod�le de pr�-formation par un grand corpus, ces donn�es scientifiques polyvalents migration des applications de mod�le Transformer form� pour apprendre, pour trouver des solutions novatrices � des probl�mes sp�cifiques dans leurs domaines.

mod�le BERT https://arxiv.org/abs/1810.04805

en �Concur Labs de SAP �(Www.concurlabs.com), nous esp�rons utiliser pour r�soudre certains probl�mes nouveaux voyages BERT et frais sur le terrain se pr�sentent. Nous voulons simplifier le raisonnement BERT. Malheureusement, nous avons essay� les solutions ne sont pas id�ales.

En partenariat avec l'�quipe Google / tensorflow, en utilisant ses derniers d�veloppements, nous avons finalement atteint l'objectif: coh�rent, simple et tr�s rapide raisonnement mod�le BERT. Ils profitent du plan de mise en uvre propos�e, nous pouvons pr�dire � partir du texte original pour compl�ter le classement en quelques millisecondes. Le regard de d�posons sur la fa�on dont les diff�rentes biblioth�ques et composants tensorflow nous aider � atteindre ce jalon.

Cet article vous donnera un aper�u de la fa�on d'atteindre �volutive, rapide et d�ploiement efficace par BERT �cosyst�me tensorflow de. Si vous �tes int�ress� par une compr�hension approfondie de son processus de mise en uvre, s'il vous pla�t voir la partie II (non encore publi�), pour plus d'informations sur la mise en uvre des �tapes de cet article. Si vous voulez essayer de d�montrer le d�ploiement, s'il vous pla�t voir La page de Concur Labs �(Bert.concurlabs.com), qui a trait � pr�senter notre projet de classification des sentiments.

A propos de Au service d'une note

Les m�thodes d�crites dans cet article permet aux d�veloppeurs de tirer parti de tensorflow Version �tendue (TFX) v0.21 ou plus pour former le mod�le tensorflow. Mais tensorflow service (v2.1) de la version actuelle ne comprend pas encore le soutien � tf.text apr�s mod�le de formation contenue dans l'op�rateur, et d�gagera v2.2 de lib�ration docker nuit offre un tel soutien.

Vous voulez voir le code directement?

Si vous voulez aller � l'exemple complet, voir bloc-notes colab , Qui g�n�rent une �tendue (TFX) complet tensorflow BERT mod�le d�ployable ligne d'affichage associ�, et le plan de calcul de mod�le comprend en outre l'�tape consistant � pr�traiter.

bloc-notes colab https://colab.sandbox.google.com/github/tensorflow/workshops/blob/master/blog/TFX_Pipeline_for_Bert_Preprocessing.ipynb

l'�tat du d�ploiement BERT quo

R�cemment, des progr�s mod�le Transformer tr�s rapidement. Malheureusement, cependant, le mod�le utilis� dans le processus de production est tr�s complexe, le r�sultat est pas satisfaisant. Id�alement, nous vous ferons parvenir le texte original au serveur, mais les mod�les BERT doivent pr�traiter le texte d'entr�e, puis nous pouvons arriver � pr�dire le mod�le r�el. Certaines solutions ant�rieures ont �t� de r�soudre ce probl�me en pr�traiter le texte au client, il existe d'autres solutions en effectuant une �tape interm�diaire sur le serveur pour traiter les donn�es d'entr�e. Ces deux approches ne sont pas appropri�s en raison de la n�cessit� de d�ployer une coordination suppl�mentaire (telles que la p�riode de commutation client / serveur), ou r�duire l'efficacit� du raisonnement (par exemple en raison des �tapes de conversion interm�diaires exigent une capacit� de traitement par lots de pr�vision sophistiqu�s).

Figure 1: Le d�ploiement actuel de BERT

Id�alement le d�ploiement est en quelque sorte comment?

Sur le mod�le de d�ploiement, le plus simple sera le mieux. Nous voulons d�ployer mod�le Transformer, et le calcul du mod�le comme la partie de pr�-traitement de la figure. En raison de pr�-int�gr� dans la carte de calcul du mod�le, on peut d�ployer un seul mod�le de serveur de mod�les, en supprimant les autres d�pendances de d�ploiement (client ou processus interm�diaire), alors l'avantage complet du serveur de mod�les (tels que la pr�diction des demandes de traitement par lots afin de tirer le meilleur parti de notre mat�riel de raisonnement).

BERT d�ploy� par �cosyst�me tensorflow

Tensorflow est un cadre tr�s efficace, il est non seulement le cadre de l'apprentissage de la machine fournit �galement un large �ventail d'�cosyst�mes contiennent toutes sortes de programmes de soutien et des outils, y compris. Pour nous est un outil tr�s utile �tensorflow Serving . Cet outil fournit un moyen simple, coh�rent et mod�le de d�ploiement �volutif .

tensorflow Serving https://tensorflow.google.cn/tfx/guide/serving
mod�le de d�ploiement �volutif https://tensorflow.google.cn/tfx/serving/serving_kubernetes

Un autre projet nous portons une attention particuli�re � l'�cosyst�me tensorflow Transformer . Avec cet outil, nous pouvons calculer l'�tape pr�traiter fa�on carte pour le mod�le de construction, afin que nous puissions exporter avec le mod�le d'apprentissage r�el de profondeur.

tensorflow Transformer https://tensorflow.google.cn/tfx/guide/tft

Tensorflow Transformer exige que tous les �tapes de pr�traitement sont exprim�s en tant qu'op�rateur tensorflow. Voil� pourquoi nous avons r�cemment mis au point texte tensorflow �Il y a des raisons extr�mement utiles. RaggedTensors �La nouvelle mise en uvre pour atteindre non seulement ouvert, et la biblioth�que fournit �galement les fonctions requises mode de r�alisation d'une �tape de pr�traitement du langage naturel.

RaggedTensors https://tensorflow.google.cn/guide/ragged_tensor

TensorFlowWorld 2019 �Un nouveau texte de fonction tensorflow est pr�vue dans BERT Tokenizer La mise en uvre compl�te. Pour cette raison, nous avons �t� en mesure d'exprimer notre pr�-traitement tensorflow quelques lignes de code. Nous utilisons �galement un autre outil de tensorflow pour atteindre notre objectif pour une ligne de mod�le coh�rent et d�ploiement: Tensorflow �tendu (TFX) . Nous exprimons notre soutien pipeline TFX ML gr�ce � la r�plication, afin de nous aider � d�ployer un mod�le d'apprentissage de la machine coh�rente.

TensorFlowWorld 2019 (Playlist) https://v.youku.com/v_show/id_XNDQyMDUyNzE4OA
BERT Tokenizer https://github.com/tensorflow/text/blob/master/tensorflow_text/python/ops/bert_tokenizer.py#L121

Figure 2: Utilisation de pipeline TFX tf.Text

Pr�par� par l'�tape de pr�-traitement op�rateur tensorflow

Id�al d�ploiement de mod�le accepte du texte brut en entr�e au mod�le, le mod�le fournira une pr�vision. Notre d�ploiement BERT est si simple, la cl� est exprim�e sous la forme d'une �tape de pr�traitement op�rateur tensorflow. BERT n�cessite le mod�le d'entr�e d'origine dans l'entr�e de texte ID jeton, le masque d'entr�e (masque d'entr�e), le type d'entr�e r�sultant ID (ID d'entr�e de type). Avec l'aide de tensorflow texte, et maintenant nous pouvons utiliser moins de lignes de code complet. Dans la deuxi�me partie de cet article, nous allons discuter du texte original pour convertir certains des d�tails de la structure de donn�es sp�cifique BERT, qui consiste � ajouter BERT jeton particulier.

vocab_file_path = load_bert_layer (). resolved_object.vocab_file.asset_path bert_tokenizer = text.BertTokenizer (vocab_lookup_table = vocab_file_path, token_out_type = tf.int64, lower_case = do_lower_case) ... input_word_ids = tokenize_text (texte) input_mask = tf.cast (input_word_ids > �0, tf.int64) input_mask = tf.reshape (input_mask,) zeros_dims = tf.stack (tf.shape (input_mask)) input_type_ids = tf.fill (zeros_dims, 0) input_type_ids = tf.cast (input_type_ids, tf.int64)

Figure 3: BERT tokenizer

Utilisez tensorflow Transform et ledit graphe de pr�-calcul de code peut �tre export� tensorflow avec le mod�le form�. Avec tensorflow Au service des derni�res mises � jour, le mod�le de d�ploiement BERT nous pouvons maintenant accepter du texte brut en entr�e. Regardez! Aucune autre d�pendances.

Utilisez tensorflow nous transformer pour apporter des avantages hargneux. D'une part, nous pouvons r�partition ordonn�e des responsabilit�s entre le pr�traitement et l'architecture du mod�le de donn�es au travail. D'autre part, nous pouvons facilement debug, les donn�es de test et g�n�rer des statistiques sur la pr�-production. Transformer sous forme de TFRecords de sortie composant apr�s jeu de la formation de conversion, disponible pour inspection. processus � Debugging � Transformer la sortie, nous avons trouv� quelques probl�mes mineurs, ces probl�mes ne causera pas la formation du mod�le d'�chec, mais peut affecter ses performances (par exemple un d�calage se produit dans le jeton). Techniquement parlant, pas besoin ici tensorflow Transformer. �tant donn� que chaque �chantillon de pr�-traitement ind�pendamment dans un corpus complet, on peut facilement �tre construit directement dans le calcul du mod�le de la figure. Mais nous l'avons trouv� plus facile de construire et d'assemblage de d�bogage de cette fa�on.

Figure 4: couche de BERT

Si vous �tes int�ress� par une compr�hension approfondie du processus de mise en uvre, nous vous recommandons de lire la deuxi�me partie de l'article (non encore publi�), qui a en profondeur l'exposition du processus de mise en uvre.

Quel est le d�ploiement id�al?

d�veloppement simplifi�

Tensorflow en utilisant une vari�t� d'outils, nous sommes en mesure de d�ployer le mod�le BERT de mani�re concise. L'�tape de pr�traitement pour int�grer la carte de calcul du mod�le, peut r�duire le risque de d�connexion entre les donn�es de formation et de raisonnement. Le mod�le de d�ploiement ne n�cessite pas de d�pendances clients suppl�mentaires ou serveur, ce qui r�duit encore les erreurs du mod�le de risque. Nous pouvons �tre d�ploy� de mani�re coh�rente par mod�le BERT tensorflow service, tout en optimisant l'utilisation du raisonnement en vrac comme une sorte de mod�le.

performance Raisonnement

Notre personnel d'essai initial de performance pleine d'espoir. Chaque mod�le de pr�diction pour calculer la pr�sentation BERT figure de l'�tape de pr�traitement comprenant le raisonnement, et le mod�le de la dur�e moyenne d'environ 15,5 ms (bas� sur une seule GPU V100, jusqu'� 128 jeton, demande grpc pour la construction d'une version non optimis�e de tensorflow GPU Servant et uncased base BERT mod�le de mesure d�riv�e). Ceci est le temps moyen il y a conclu que l'utilisation de BERT en termes de d�ploiement du client et de l'utilisation tensorflow service h�berg� mod�le de classification est � peu pr�s le m�me. Bien s�r, en fonction de votre machine et le mod�le, le r�sultat sera diff�rent.

plus d'informations

Si vous �tes int�ress� par une compr�hension approfondie du processus de mise en uvre, nous vous recommandons de lire la deuxi�me partie de l'article. Si vous voulez comprendre le code, Voir le portable Colab , Qui contient des exemples de l'utilisation du mod�le BERT pr�-form� mod�le de classification de sentiment de mise en uvre. Si vous voulez essayer de d�montrer le d�ploiement, s'il vous pla�t voir La page de Concur Labs , Que nous montrons les �motions li�es � la classification du projet.

colab https://colab.sandbox.google.com/github/tensorflow/workshops/blob/master/blog/TFX_Pipeline_for_Bert_Preprocessing.ipynb
La page de Concur Labs https://bert.concurlabs.com/

Si vous tensorflow int�ress� Extended (TFX) et tensorflow Transform le fonctionnement interne, s'il vous pla�t lire attentivement �Guide de l'utilisateur TFX Et voir venir O'Reilly a publi� l'article " Utilisation cycle de vie du mod�le d'apprentissage de machine de construction et de la ligne tensorflow assemblage automatis� � (Construction de machines d'apprentissage Pipelines, Automatiser Mod�le Life Cycles Avec tensorflow), a �t� publi� � l'avance en ligne.

Guide de l'utilisateur TFX https://tensorflow.google.cn/tfx/guide
Utilisation cycle de vie du mod�le d'apprentissage de machine de construction et de la ligne tensorflow assemblage automatis�

Pour plus d'informations sur TFX, consultez site officiel �(Tensorflow.google.com), en ajoutant groupe de discussion TFX , Lire attentivement les autres articles dans le num�ro public.

groupe de discussion TFX https://groups.google.com/a/tensorflow.org/forum/#!forum/tfx

Remerciements

Lisser la mise en uvre du projet ne peut pas faire sans le soutien fort de Catherine Nelson, Richard Puckett, Jessica Park, Robert Reed et �quipe Labs Concur. En outre, nous tenons � remercier Robby Neale, Robert Crowe, Irene Giannoumis, Terry Huang, Zohar Yahav, Konstantinos Katsiapis, les autres membres de l'�quipe Arno Eigenwillig et tensorflow pour leur participation � la mise en uvre du projet discut� en d�tail et fournir la biblioth�que de mises � jour. Nous remercions tout particuli�rement de Talenpair de Cole Howard, il est toujours capable de g�rer un point de vue li� � la discussion pr�sent�e �clairant en langage naturel.

- FIN -

attention Tsinghua - donn�es Acad�mie des sciences de Qingdao plate-forme publique micro-canal officiel " �AI pour envoyer des donn�es �� Sisters et n � � Les donn�es envoy�es THU �� Pour plus de conf�rences et de bien-�tre contenu de qualit�.

Route de la soie