PNL deux h�g�monie: OpenAI et attaque GPT-2 � t�tu �

Source @unsplash

Wen | cerveau globule polaire

Tous les aspects de la technologie de traitement du langage naturel (NLP) est en train de changer la vie de nos vies.

haut-parleurs de salon Smart progr�s rapides sur un dialogue quotidien avec vous, m�me pas commencer � vous dire � gag � en fonction de vos habitudes de passe-temps.

Service � la client�le d'affaires �lectrique r�pond toujours la premi�re fois, ont pu �tre trait�es � votre question, vous ne trouvez pas aussi TA peut juste �tre un service � la client�le intelligente. version r�alit� de � test de Turing � sur une base quotidienne.

Toujours v�rifier les informations �trang�res que vous pourriez avoir �t� habitu� � une page web ou moteur de recherche un peu de traduction, la grande qualit� de traduction assez de bon pour vous faire sentir comme l'apprentissage d'une langue �trang�re est une perte de temps.

Gratuit, ennuy� lorsque vous brossez un flux vid�o court, toujours accro trouv� plus tard de plus en plus de temps, en fait, derri�re elle est une des recommandations de la plate-forme d'algorithmes en langage naturel bas� sur l'optimisation de vos habitudes de navigation, attention longtemps effectu�es.

Si l'enl�vement, nous voulons revoir bri�vement la transition des mises � jour ces derni�res ann�es, la PNL a �t� la tra�abilit� sur cette technologie torrent. Arri�re eau abondante, source d'eau partout technique pour comprendre le contexte de l'�volution de la PNL.

PNL deux h�g�monie: OpenAI et attaque GPT-2 � t�tu �

attention PNL doit savoir, 2018 a �t� une ann�e de pare-chocs champ PNL d�veloppement.

Juin 2018, OpenAI a publi� un rapport intitul� � Am�liorer la compr�hension de langue par g�n�rative pr�-formation � th�se d�velopp�e sur la base du � mod�le linguistique pr�-formation � TPG, il la premi�re utilisation du r�seau au lieu de Transformer LSTM comme mod�le de langage, et � 12 t�che PNL 9 t�che d'obtenir la performance SOTA. TPG, mais pour diverses raisons n'a pas eu plus d'attention.

L'approche fondamentale est de TPG sans supervision pr�-form� sur un vaste corpus d'�chelle, puis un r�glage fin (fine-tune) fa�on pour les t�ches sp�cifiques � un ensemble de donn�es beaucoup plus petit supervis�, le mod�le ind�pendant con�u pour les t�ches individuelles des conseils peuvent �tre obtenus de tr�s bonnes performances dans les multiples t�ches uniques.

Jusqu'� Octobre, le BERT de Google (Bidirectionnel Encoder Repr�sentation de Transformers) sortent, une fois lib�r�s ils auront une large attention. mod�le BERT a gagn� la performance SOTA dans les 11 t�ches de la PNL, est que le personnel technique Google a d�clar�: � BERT a ouvert une nouvelle �re de la PNL � d�claration. En fait, alors que le BERT et GPT utilise exactement le m�me mod�le � deux �tages, le premier il est mod�le de langage pr�-form� sans supervision, suivi par l'utilisation en mode Fine-Tuning pour r�soudre la t�che en aval. La diff�rence est que BERT utilise un mod�le double langage ELMO similaire dans la phase de pr�-formation et l'utilisation de plus grandes donn�es � l'�chelle de pr�-formation.

BERT dans l'�tiquetage de la s�quence des t�ches en aval (y compris la PNL de transformation, comme mot chinois, le marquage de la parole, la reconnaissance des entit�s nomm�es, l'�tiquetage du r�le s�mantique et similaires; la seconde est des t�ches de classification, telles que la classification de texte, l'informatique affective, la d�termination de la relation de la phrase, comme entailment, QA , r��criture s�mantique, le raisonnement du langage naturel, les t�ches g�n�ratives, telles que la traduction automatique, texte summarization, phrase de la po�sie, plug-parler, etc.) ci-dessus, puissante et mission universelle �blouissante performance, il est devenu enhardi �clats de la PNL .

Apr�s seulement quatre mois, GPT-2 lib�ration OpenAI. Ce mod�le PNL massif non supervis�, peut g�n�rer des paragraphes coh�rents de texte, la mise en une performance de 7 SOTA pour les grands ensembles de donn�es, et peut sans pr�-form�s pour compl�ter la compr�hension de la lecture, les questions et les r�ponses, et beaucoup la traduction automatique dans diff�rentes langues t�ches de mod�lisation.

Tout d'abord, CPT-2, BERT et TPG, comme une continuation du transformateur auto-attention (de la note) que la structure sous-jacente.

les chercheurs OpenAI insistent sur les donn�es de formation non supervis�es peuvent provenir d'une telle pens�e: apprentissage supervis� un mod�le de langage fera que traiter des t�ches sp�cifiques bien perform�, alors que la mauvaise performance de g�n�ralisation, mais une simple augmentation de l'�chantillon de formation, il est t�che difficile � r�aliser une expansion efficace. Ils ont donc choisi d'utiliser le module d'attention migrate d'apprendre � construire des mod�les capables d'effectuer un certain nombre de t�ches de la PNL en cas z�ro-shot d'un ensemble plus g�n�ral de la base de donn�es.

Contrairement � BERT que la structure du mod�le CPT-2 continue GPT1.0 � mod�le de langage � sens unique. � GPT-2 para�t �tre qu'un seul objectif: �tant donn� un texte devant tous les mots, pour pr�dire le mot suivant. Cette insistance obstin�e, nous pouvons voir les OpenAI Solutions.

Il s�lectionne l'expansion des param�tres du mod�le Transformer 48 couches, contenant 1,5 milliard de param�tres du mod�le Transformer pour trouver un jeu de donn�es de 8 millions de pages (WebText) sous forme de donn�es de formation non supervis�es. Autrement dit, GPT-2 est une extension directe du mod�le de GPT, form� sur la quantit� de donn�es d�passe 10 fois le param�tre de quantit� de plus de 10 fois. Cela permet GPT-2 utilise une approche de � violence � plus direct, le nombre de param�tres du mod�le seul pour am�liorer la capacit� et d'accro�tre les donn�es de formation � plus de BERT.

GPT-2 comme un g�n�rateur de texte, il suffit de commencer � taper en quelques mots, ce programme sera bas� sur leur propre jugement, je d�cide comment �crire suivant. En bref, le mod�le GPT-2 comme un langage universel qui peut �tre utilis� pour cr�er assistant d'�criture AI, un dialogue de robot plus puissant, sans supervision et une meilleure traduction des syst�mes de reconnaissance vocale.

OpenAI imaginer les gens pourraient utiliser � des fins malveillantes GPT-2 pour g�n�rer nouvelles trompeuses, usurper l'identit� d'une autre personne la fraude en ligne, la production automatique du contenu malveillant ou m�dias sociaux faux, produire automatiquement le courrier ind�sirable ou contenu phishing. Ainsi, OpenAI pendant la lib�ration GPT2 d�clar� que � ce mod�le a un risque fort d'�tre un abus malveillant, � a choisi de ne pas faire un mod�le de formation compl�te de l'open source, un mouvement qui a attir� des discussions intenses et machine chercheurs d'apprentissage de l'industrie traitement du langage naturel .

Que ce soit une moquerie au monde ext�rieur sur leurs propres produits, � trop fier � ou OpenAI pour � d�lib�r�ment hype �, GPT-2 � cr�er d�lib�r�ment de fausses nouvelles, � la force des fins de relations publiques vraiment incroyables � tout le monde dans l'industrie. La force des masses pendant qu'ils mangent le melon Tucao, alors qu'ils ne peuvent pas attendre d'explorer la puissante capacit� de g�n�rer de GPT-2.

Apr�s pr�s d'un an, GPT-2 dans les � adopteurs pr�coces � � participer � l'open source et les d�veloppeurs sont prudents, faire la mise � jour �blouissante �volution.

phase GPT-2 de l'open source: amener le carnaval des d�veloppeurs terreuses

Accompagn� par la controverse et les d�veloppeurs mont�e en fl�che voix, OpenAI encore jug� prudent, on a choisi d'ouvrir en plusieurs phases. 8 mois plus tard, il mis en sc�ne a publi� un � petit � 124 mod�le millions de param�tre (avec 500 Mo sur le disque), � taille moyenne � 355 mod�le millions de param�tres (1.5GB ont sur le disque), et un mod�le de 774 millions de param�tres (il 3Go sur le disque). Jusqu'au 6 Novembre, il a �t� officiellement lib�r� le code complet contient un maximum de 1,5 milliard la version param�tre TPG-2 de la derni�re section.

Jusqu'� la version compl�te publi�e, OpenAI n'a pas trouv� de code clair, des documents ou toute autre utilisation abusive de la preuve, qui est le r�sultat d ' � abus de GPT-2 � a �t� craint n'a pas eu lieu, mais OpenAI croient encore qu'une version compl�te en m�me temps �galement laisser des personnes malicieuses d'avoir la possibilit� d'am�liorer encore la capacit� d'�chapper � la d�tection.

Ainsi, en m�me temps que les diff�rentes versions GPT-2 ont �t� lib�r�s, OpenAI lui-m�me avec un certain nombre de p�riodiques �quipe change de mod�le TPG-2, l'authentification utilise l'effet de GPT-2, tout en �vitant le risque d'une mauvaise utilisation du mod�le de langage, le texte d'essai parfait d�tecteur de g�n�ration. En m�me temps, OpenAI travaille �galement aussi avec un certain nombre d'institutions de recherche, comme l'�tude de la sensibilit� de l'information num�rique de langage humain g�n�r� par le mod�le, l'�tude de la possibilit� de GPT-2 de l'utilisation malveillante des statistiques pour le TPG-2 peut �tre g�n�r� texte d�tection de.

Peu importe quel point OpenAI attention, avec la sortie de diff�rents param�tres de capacit� du mod�le, les d�veloppeurs ext�rieurs ne peut pas attendre d'explorer une vari�t� de directions.

Avril 2019, scientifique de donn�es BuzzFeed Max Woolf en utilisant un package Python avec 117 millions sur les param�tres de � petite � version de la g�n�ration de texte OpenAI mod�le TPG-2 et affiner le script g�n�r�, ouvrez un � Lite GPT-2 � afin de mieux aider les personnes g�n�rer un texte, ce qui peut donner beaucoup de contenu inattendu.

En OpenAI progressivement processus open source, les deux �tudiants dipl�m�s de l'Universit� Brown a pris la t�te une copie param�tre 1,5 milliard la quantit� de GPT-2, et nommez-le OpenGPT-2. Processus, qu'ils utilisent leur propre code de formation scratch mod�le TPG-2 seulement d�pens� environ 50000 $. L'ensemble de donn�es utilis� dans le proc�d� d�crit les documents OpenAI se r�f�rent �galement autant que possible. Il y a beaucoup d'utilisateurs enthousiastes du test apr�s que lesdits effets de texte de sortie OpenGPT-2 est mieux que TPG param�tre version 2 � 7,74 Yi de OpenAI. Bien s�r, certaines personnes pensent, et il n'y a pas de meilleur que le mod�le TPG-2 a cr�� un effet de texte.

Alors que dans le pays, situ� � Nanjing, un homme nomm� � Zeyao Du � d�veloppeurs, open source sur GitHub GPT-2 chinois, il peut �tre utilis� pour �crire de la po�sie, le journalisme, romans et pi�ces de th��tre, ou d'un mod�le de formation linguistique commun. Cet effet peut �tre obtenu Guards mod�le GPT-2 utilise le param�tre de 1,5 milliard. Il est actuellement des r�sultats pr�-formation ouverts et Colab Demo d�mo, cliquez trois fois, on peut g�n�rer une histoire chinoise personnalis�e.

mod�le TPG-2 et de nombreuses tentatives de plus. Singapour, un lyc�en Rishabh Anand ouvrir un � client � GPT-2 l�ger --gpt2-client, il est un entrep�t d'emballage d'origine GPT-2, simplement 5 lignes de code pour mettre en uvre la g�n�ration de texte.

Plusieurs chercheurs de la Chine g�n�re de haute qualit� avec le mod�le TPG de la po�sie classique chinoise. Par exemple, dans le document mentionn� un � Qilu Bon Voyage � :. �J'ai entendu des oies traversent le ciel d'automne, r�ve tout � coup Qingcheng vieux amis parcourent la route sans entrer dans Qinglin Ma, d�p�che jaune main est propri�taire d'un bateau dans sa vie Chi entreprise Shan. vieux, quel jour du minist�re chinois ou mauvais s�jour. phase Andhra des mots d'autrefois, en �tat d'�bri�t� avec une bouteille collines Wan ". Un adieu l�ger plat, �criture comme pleine de vicissitudes de la vie, pleine de tristesse. Il est difficile de ne pas rendre les gens se demander: Est-ce un mod�le de langage ont vraiment des sentiments?

mod�le TPG-2 peut �galement �tre utilis� sur la musique. OpenAI lanc� DNN --MuseNet pour g�n�rer un morceau de musique, il est un mod�le de langue GPT-2 Sparse Transformer m�me technologie sans supervision g�n�rale qui permet MuseNet pr�dire la note suivante sur la base d'un ensemble de notes donn�e. Le mod�le peut �tre utilis� dans 10 diff�rents instruments de musique en 4 minutes de musique et d'en apprendre davantage sur les diff�rents styles de musique de Bach, Mozart, les Beatles et d'autres compositeurs l�-bas. Il pourrait �ventuellement �tre une fusion de diff�rents styles musicaux pour cr�er une nouvelle uvre musicale.

Nous �tions tr�s int�ress�s par un caract�re AI un d�veloppeur fait par jeu d'aventure GPT-2 - � donjon AI. � Plusieurs s�ries de texte de dialogue, AI peut vous aider � commencer un voyage � Chevalier Dragon � inattendu, ou une visite � City Detective �. Dans la prochaine industrie du jeu, l'histoire de la cr�ation du script AI, peut-�tre plus imaginatif?

Ann�e, plus d'applications open source apportent GPT-2 suffisamment lib�r� pour �blouissante d'appel. Derri�re de l'agitation et de la prosp�rit�, en plus du risque prudent sur l'open source, OpenAI fait face � ce probl�me?

PNL Tyran Race: mariage OpenAI apr�s Microsoft GPT-2 commercial

En fait, nous BERT et la tendance de l'�volution de GPT-2, nous pouvons voir un mod�le de plus grande capacit� � usage humain, la formation illimit�e sans supervision, vous pouvez aller � cr�er plus et mieux conforme � la connaissance du contenu du langage humain. Mais elle a aussi des moyens pour calculer le temps, un processus de formation mod�le machine � ultra grande �chelle d'apprentissage GPU GPU Cluster compter sur super cher, longtemps. Cela signifie que le mode � br�ler �, permet aux joueurs de recueillir plus d'PNL finalement � la t�te de l'entreprise, une ar�ne de joueur Tyran minoritaire.

Il est pr�visible que si la relance cette ann�e OpenAI TPG-3.0, ou choisir un sens �lev� mod�le de langage de probabilit�, mais prendra � plus grande �chelle et d'�largir le mod�le de donn�es de formation, juste dur et BERT. PNL r�alisations dans le domaine de l'application seront mises � jour � nouveau.

Mais de l'autre c�t� pour voir, de sorte que le � br�ler � du mod�le de formation linguistique de d�veloppement, il n'y a pas de perspectives claires pour l'application commerciale. OpenAI avait aussi � faire face � des choix difficiles � � suivre les sentiments technologiques de l'esprit � ou commercial � de se plier � la r�alit�, � le.

La r�ponse devrait d�j� clair. En Juillet 2019, OpenAI d'accepter l'investissement de 1 milliard $ de Microsoft. Selon la d�claration officielle, OpenAI travaillera avec Microsoft pour d�velopper de nouvelles technologies de l'intelligence artificielle pour la plate-forme cloud Microsoft Azure, et conclu un accord exclusif avec Microsoft � l'expansion des capacit�s de veille artificielle � grande �chelle � pour honorer l'intelligence artificielle universelle (AGI) de engagement ".

Son essence est le OpenAI sur la recherche en intelligence artificielle � br�ler � et son embarras commercial, ce qui rend encore plus besoin d'une telle somme de � parrain �. Microsoft Prenez mod�les GPT-2 ont param�tre 1,5 milliard, par exemple, il utilise la formation v3 TPU 256, toutes les heures co�te $ 2048. Il est pr�visible que si l'on veut regarder la lib�ration GPT-3.0, le co�t sera consacr� principalement sur les ressources informatiques au-dessus des nuages.

Microsoft va devenir les fournisseurs cloud computing OpenAI exclusifs. La technologie de l'intelligence artificielle de OpenAI �galement de sortie � travers le nuage Azure. Avenir, OpenAI fera partie de la technologie sous licence � Microsoft, puis la commercialisation de ces technologies par Microsoft et vendus � des partenaires.

Soutenir cette �norme quantit� de co�ts, de sorte que OpenAI ont une confiance plus ad�quate. R�sum�es ci-dessus, TPG-2 continue �tape par �tape pour commencer � publier autre ordre de grandeur des param�tres du mod�le apr�s Ao�t, et tous ouverts en Novembre. De toute �vidence, la direction commerciale GPT-2 � l'avenir, peut-�tre plus d'aide la b�n�diction de Microsoft Azure. Par exemple, vous pouvez am�liorer la collaboration future et Office365, participer � l'automatisation assist� bureau �crit le texte des corrections de bugs de syntaxe impliqu�s, peuvent �galement cr�er un syst�me r�pondant � la vraie question plus naturelle.

R�ve �tait jeune amour, on voudrait voler vers l'avant. Les id�aux de AGI en r�alit� n�cessaire dans la pratique commerciale. Il est pr�visible qu'en 2020, Google face � une combinaison de Microsoft et OpenAI, apportera plus de vagues commercialisation de la PNL.

Route de la soie

Apprenez � conna�tre la Chine

PNL deux h�g�monie: OpenAI et attaque GPT-2 � t�tu �

PNL deux h�g�monie: OpenAI et attaque GPT-2 � t�tu �

phase GPT-2 de l'open source: amener le carnaval des d�veloppeurs terreuses

PNL Tyran Race: mariage OpenAI apr�s Microsoft GPT-2 commercial