OpenAI derni�res recherches: par apprentissage non supervis� pour am�liorer la compr�hension du langage

New Ji-won aujourd'hui

�Ji-won nouvelle compilation

Source: Open AI

Compile: Pen, Craig

[New Ji-won EXAMEN Sur la base d'un syst�me �volutif, t�che ind�pendante, OpenAI contient des t�ches linguistiques diff�rentes pour obtenir des r�sultats optimaux dans un groupe, la m�thode est une combinaison de deux concepts existants: La formation pr�-migration et apprentissage non supervis� . Ces r�sultats d�montrent qu'il existe des m�thodes d'apprentissage supervis� peuvent �tre combin�s avec la pr�-formation parfaite sans supervision. L'id�e de beaucoup de gens dans le pass� explor�, OpenAI l'espoir de stimuler plus de r�sultats de recherche, et ensuite appliquer cette id�e � une plus grande, plus diversifi�e sur l'ensemble de donn�es.

Notre syst�me est divis� en deux �tapes: Tout d'abord, nous avons form� une migration par mani�re non supervis�e sur un grand mod�le d'apprentissage des ensembles de donn�es, le processus de formation en utilisant un des r�sultats de formation de mod�le de langage comme un signal, notre jeu de donn�es supervis� plus petit sur ce mod�le est peaufin� pour l'aider � r�soudre une t�che sp�cifique. Ceci est une m�thode d�velopp�e dans notre ancienne neurone sentiment Effectu� (neurones �motionnels) apr�s avoir travaill� dans le sentiment t�che des neurones, nous notons que, pour former le mod�le gr�ce � l'utilisation de donn�es suffisantes, l'apprentissage non supervis� peut �tre assez discriminant caract�ristiques surprenantes. Ici, nous voudrions explorer davantage cette id�e: Pouvons-nous d�velopper un mod�le � un mod�le de mode non supervis� est form� pour utiliser beaucoup de donn�es, puis affiner le mod�le, afin d'obtenir de bonnes performances dans diverses t�ches? Nos r�sultats indiquent que l'effet de cette approche est �tonnamment bonne. Le m�me mod�le de base peut �tre peaufin� pour des t�ches diff�rentes en fonction de la t�che.

Cette �tude est une m�thode introduite dans la s�quence d'approche fond�e sur l'apprentissage semi-supervis� montre comment LSTM de pr�-formation non supervis�e Et puis supervis� peaufinage pour am�liorer la capacit� de classification de textes. Elle �tend �galement la recherche ULMFiT, le montre l'�tude comment affiner un mod�le de donn�es unique agnostique langage LSTM pour obtenir des performances optimales dans une vari�t� de jeu de donn�es de classification texte. Nos spectacles de travail comment migrer mod�le d'apprentissage de cette fa�on, de sorte qu'un plus large �ventail de t�ches en plus de la classification de texte r�ussir, telles que le raisonnement de bon sens, la similarit� s�mantique et la compr�hension en lecture et ainsi de suite. Il Elmo similaire, mais appartiennent � des questions de travail ind�pendant, qui comprend un pr�-formation, vous souhaitez utiliser pour la t�che particuli�re de l'architecture de mod�le pour obtenir des r�sultats optimaux.

Nous accordage param�tre de quelques-uns pour atteindre notre objectif. Tous les jeux de donn�es en utilisant une seule langue � l'ancien mod�le, il n'y a pas de combinaison, et la plupart des r�sultats sont exactement les m�mes r�glages ultra-param�tres.

Notre approche COPA, RACE, et trois ensembles de donn�es ROCStories Performance sur ont particuli�rement bien perform�, ces ensembles de donn�es sont utilis�s pour tester le raisonnement de bon sens et � la lecture. Notre mod�le sur ces ensembles de donn�es pour obtenir des r�sultats optimaux. Ces ensembles de donn�es d'identification sont consid�r�es comme plus besoin des phrases raisonnement et la connaissance critique du monde, ce qui indique que notre mod�le pour am�liorer ces capacit�s, notamment par l'apprentissage non supervis�. Au-dessus indiquent que la technologie sans supervision promettant de d�velopper la compr�hension du langage complexe.

Route de la soie

Apprenez � conna�tre la Chine

OpenAI derni�res recherches: par apprentissage non supervis� pour am�liorer la compr�hension du langage