2019 Dix sujet br�lant domaine ML & PNL

2019 pass�, pour l'industrie de l'IA, l'ann�e �coul�e peut �tre d�crit comme � Liu Yong Jin, � un an, d'une part, l'ensemble du sentiment communautaire de la recherche en IA, et promouvoir le d�veloppement rapide de la technologie AI et, d'autre part, la rapide limitations derri�re le d�veloppement de la technologie sont devenues de plus en plus important, les chercheurs �tudient activement ces limites, et de montrer leurs comp�tences � une nouvelle m�thode de recherche et d'innombrables.

Mais de l'avant et ont une plus grande influence sur les m�thodes et la recherche, et quoi? Il est utile de continuer d'explorer plus loin dans l'ann�e � venir et combien?

PNL domaine du travail bien connu blogueur Dr Sebastian Ruder bas� sur ses recherches a pr�par� un � 2019 Top Ten sujet br�lant champ ML & PNL, � le rapport de synth�se.

Nous voyons comment il a dit:

Cet article r�sume mon avis, dix paru en 2019 et ML PNL domaines les plus passionnants de la recherche et ont une influence. Pour chaque point chaud, je vais r�sumer les progr�s importants r�alis�s au cours de l'ann�e �coul�e, bri�vement pourquoi je pense qu'il est important de faire un peu et les perspectives d'avenir.

Ce qui suit sont dix sujet br�lant:

pr�-formation g�n�rale sans supervision

sous- r�seau � Gagner � la loterie �

noyau nerveux Tangent

apprentissage des langues multiples Unsupervised

Une collecte de donn�es de base solide

ML et la PNL pour la recherche scientifique

NLG r�paration des erreurs de d�codage

mod�le de pr�-formation am�lior�e

Transformateur efficace, de longue port�e

Plus fiable m�thode d'analyse

Tout d'abord, la pr�-formation sans supervision g�n�rale

1, ce qui est arriv�?

Par BERT (Devlin et al., 2019) et sa variante d'impact � chaud, l'ann�e derni�re, pr�formation sans supervision est un domaine de la PNL populaire de la recherche. BERT diverses variantes utilis�es dans l'environnement multi-mode, concerne principalement l'image, la vid�o et l'environnement de texte (comme indiqu� ci-dessous).

VideoBERT (Sun et al., 2019), l'une des derni�res variantes multimodales BERT, selon la formule (ci-dessus) pour g�n�rer une vid�o � jeton �, et (ci-dessous) prescience jeton �chelles de temps diff�rentes selon le jeton vid�o.

pr�-formation Unsupervised ont commenc� � � envahir � le champ pr�c�dent domin� par les m�thodes de surveillance. Par exemple:

En biologie, les chercheurs ont le mod�le linguistique transformateur pr�-form� dans la s�quence de la prot�ine (Rives et al, 2019.);

Dans la vision par ordinateur, certains chercheurs utilisent notamment CPC (H�naff et al., 2019) auto-surveillance, MoCo (He et al., 2019) et PARRI (Misra & van der Maaten, 2019) et le g�n�rateur BigBiGAN (Donahue & Simonyan, 2019), y compris proc�d� �chantillon pour am�liorer l'efficacit� et am�liorer l'image de g�n�ration IMAGEnet;

Dans le discours, l'utilisation de CNN multi-couche (Schneider et al., 2019) ou dans les deux sens CPC (Kawakami et al., 2019) repr�sente le savant, la performance en moins de donn�es de formation que le meilleur mod�le actuel.

2. Pourquoi est-il important?

mod�le de pr�-formation non supervis�s peuvent �tre form�s sur les donn�es avec moins d'�chantillons �tiquet�s, ce qui offre de nouvelles possibilit�s pour de nombreux domaines auparavant incapables de r�pondre aux besoins de donn�es de l'application.

3, ensuite?

pr�-formation est encore beaucoup Unsupervised place � l'am�lioration, m�me si elle est � ce jour dans un seul champ ont fait de grands progr�s, l'avenir se concentrera sur la fa�on d'int�grer plus �troitement les donn�es multimodaux, sera une question int�ressante.

En second lieu, le sous-r�seau � billet gagnant �

1, ce qui est arriv�?

Frankle et Carbin dans une �tude 2019 dans le ph�nom�ne de � winning ticket �, qui est une initialisation al�atoire, avant de sous-r�seau r�seau d'alimentation avant-intensive apr�s une excellente initialisation, de sorte que la formation seule peut atteindre ces sous-r�seaux et la formation tout au long de r�seau similaire de pr�cision, comme le montre la figure.

Test de loterie gagnant-r�seau (lignes solides) � des vitesses diff�rentes avec une pr�cision sous-r�seau de la taille d'�chantillonnage al�atoire (ligne pointill�e) (Frankle & Carbin, 2019).

Bien que la proc�dure d'�lagage initiale applique uniquement aux petites t�ches visuelles, mais le travail plus tard (Frankle et al., 2019) plut�t que l'�lagage d'initialisation de l'application dans la formation initiale, ce qui rend le programme d'�lagage se trouve dans le mod�le sous-compact plus profond. Yu et al., (2019) ont �galement des mod�les PNL et RL trouv� LSTM et transformateur d'initialisation � gagner la loterie �.

En d�pit de � billet de loterie gagnant � il est encore difficile � trouver, mais les bonnes nouvelles sont que ces � billet de loterie gagnant � semble avoir transmissibilit� (Morcos et al., 2019) entre les diff�rents ensembles de donn�es et optimiseur.

2. Pourquoi est-il important?

Aujourd'hui, les r�seaux de neurones deviennent plus grandes et plus, les co�ts de formation et les pr�visions sont �galement en augmentation. Si nous pouvons identifier le petit sous-r�seau a des performances comparables, il peut �tre form� et raisonner avec moins de ressources, ce qui peut acc�l�rer le mod�le de vitesse it�rative et calculer et bord offres informatiques nouveaux sc�narios d'application pour l'appareil.

3, ensuite?

� l'heure actuelle trouv� le prix � billet de loterie gagnant � est encore trop �lev�, il ne peut pas offrir des avantages r�els dans les param�tres de ressources informatiques. processus �mondage moins sensibles au bruit et m�thode plus robuste de coupe jetable ou rem�dier � cette situation.

En particulier, l'�tude des causes de � gagner � la loterie �, pourrait aussi nous aider � mieux comprendre l'initialisation du r�seau de neurones et la dynamique d'apprentissage.

En troisi�me lieu, le noyau du nerf tangente

1, ce qui est arriv�?

Cette recherche peut �tre un peu contre-intuitif, il est facile d'effectuer des recherches sp�cifiques infiniment vaste r�seau de neurones r�seau de neurones plus �troite que dans la th�orie.

Des �tudes ont montr� que, en cas d'infiniment grande, le r�seau de neurones peut �tre approximativement tangentiel avec le noyau des cellules nerveuses (neurones du noyau Tangent, NTK;. Jacot et al, 2018) est un mod�le lin�aire. Sa dynamique figure illustrant le processus de formation.

processus d'apprentissage du mod�le dynamique lin�aire NTK avec diff�rents facteurs de , NTK visualis�e sous la forme d'une ellipse (Source: le blog de Rajat).

Dans la pratique, cependant, les performances de ces mod�les ne sont pas en tant que mod�le de profondeur limit�e (Novak et al, 2019;.. Allen-Zhu et al, 2019; Bietti & Mairal, 2019), ce qui limite les nouvelles d�couvertes aux m�thodes standard.

Cependant, des travaux r�cents (.. Li et al, 2019; Arora et al, 2019) ont consid�rablement r�duit l'�cart de performance avec la m�thode standard (Pour plus de d�tails, s'il vous pla�t se r�f�rer Chip Huyen pour d'autres NeurIPS connexes 2019 papier �crit par Bowen, https: // huyenchip. com / 2019/12/18 / key-tendances-neurips-2019.html).

2. Pourquoi est-il important?

NTK peut-�tre l'outil le plus puissant que nous analyser le comportement de la th�orie des r�seaux de neurones, m�me si elle a ses limites, le r�seau de neurones r�el qui est encore mieux que la performance de NTK m�thode correspondante.

Bien que jusqu'� pr�sent, les connaissances th�oriques de recherche ne sont pas traduites en gains sur l'exp�rience, mais cela peut nous aider � ouvrir l'apprentissage de la profondeur de la bo�te noire.

3, ensuite?

Et l'�cart entre la m�thode standard, semble �tre principalement en raison de la largeur limit�e de ces m�thodes en cons�quence, ce qui peut se refl�ter dans les travaux futurs. Il est �galement pr�vu pour aider � convertir une limite inf�rieure th�orique de l'opinion largeur infinie de r�glage plus r�aliste.

Enfin, NTK ou de formation pour nous de clarifier la dynamique et le comportement de la g�n�ralisation des r�seaux de neurones.

Quatri�mement, les langues multiples d'apprentissage non supervis�

1, ce qui est arriv�?

Au fil des ans, la repr�sentation interlangage ax�e sur le niveau de repr�sentation des mots. Sur la base de pr�-formation sur l'ann�e �coul�e a �t� t�moin d'un multi-langues sans supervision telles que BERT, XLM (Conneau & Lample, 2019) et XLM-R (Conneau et al., 2019) et d'autres d�veloppement multiplateforme profondeur du mod�le linguistique.

Bien que ces mod�les ne pas utiliser aucun signal clair � travers les langues, mais ils ne partagent pas l'effet de g�n�ralisation m�me dans le vocabulaire interlangage ou mis en uvre en situation de formation commune, il est surprenant encore (Artetxe et al, 2019;. Karthikeyan et al, 2019. Wu et al., 2019).

Le mod�le de profondeur a �galement apport� des am�liorations dans MT sans supervision (Song et al, 2019;. Conneau & Lample, 2019), l'ann�e pr�c�dente (2018) a fait des progr�s consid�rables sur la base, l'ann�e derni�re et de la m�thode statistique est plus fond�e sur des principes et des nerfs combin�, l'acc�s � am�liorer (Artetxe et al., 2019).

Un autre progr�s int�ressant est que le corollaire du mod�le multi-langage profond de la repr�sentation anglaise existante pr�-formation (Artetxe et al, 2019;. Tran, 2020), comme indiqu� ci-dessous.

Quatre �tapes Artetxe et al. (2019) des m�thodes de migration monolingues.

2. Pourquoi est-il important?

Pr�t � l'emploi repr�sentation interlangage de l'�chantillon de langue non-anglais requis moins mod�le de formation. De plus, si les donn�es marqu�es en anglais peuvent �tre utilis�s, ces m�thodes peuvent atteindre presque z�ro transfert d'�chantillon gratuit. En fin de compte, ces m�thodes peuvent nous aider � mieux comprendre la relation entre les diff�rentes langues.

3, ensuite?

On ne sait pas pourquoi ces m�thodes sont si efficaces en l'absence de toute supervision interlangage. Une meilleure compr�hension de ces travaux de m�thodes, nous permettra de concevoir une m�thode plus puissante, il peut r�v�ler quelques id�es sur les diff�rentes structures linguistiques.

De plus, il ne faut pas se concentrer uniquement sur le transfert z�ro de l'�chantillon, vous devez �galement tenir compte des petits probl�mes d'apprentissage de l'�chantillon dans la langue cible.

Cinqui�mement, ensemble plus robuste des donn�es de base

Les d�veloppements en cours, �tant donn� un certain d�sordre des choses.

-Nie et al. (2019), cit� de Shakespeare � Hamlet � (Il y a quelque chose de pourri dans l'�tat de Denmak, l'�tat du Danemark, �tant donn� un certain d�sordre des choses)

1 ,, Qu'est-il arriv�?

Pour r�cemment mis au point des ensembles de donn�es tels que la PNL HellaSWAG (Zellers et al., 2019), le mod�le le plus avanc� est �galement difficile � traiter.

Les chercheurs doivent �chantillons de filtres manuellement, ces exemples et conserve clairement le mod�le le plus avanc� de l'�chec du traitement (voir exemple ci-dessous s'il vous pla�t). Peut �tre r�p�t� plusieurs fois, � les gens dans la boucle � du processus de gestion de la confrontation, afin de cr�er un plus difficile les m�thodes actuelles de collecte de donn�es, par exemple, a r�cemment propos� dans accusatoire NLI de (Nie et al., 2019) de r�f�rence, nous pouvons atteindre cet objectif le point.

phrases � choix multiples de compl�tions ensembles de donn�es HellaSWAG par exemple, m�me les derniers mod�les sont �galement difficiles � r�pondre. Les exemples les plus difficiles sont situ�s dans un complexe � zone aurif�re Locke �, � peu pr�s deux ans et trois phrases g�n�r�es contexte de la phrase (Zellers et al., 2019).

2. Pourquoi est-il important?

De nombreux chercheurs ont observ� que le mod�le actuel ne pas apprendre la PNL devrait apprendre le contenu, au lieu d'utiliser la surface combin�e et peu profonde m�thode de donn�es d'indices inspir�s (aussi connu comme � moment Hans intelligent �). Comme la collecte de donn�es devient plus difficile d'apprendre robuste, nous esp�rons (� la force) le mod�le final pour �tudier les donn�es r�elles relations potentielles.

3, ensuite?

Comme le mod�le pour le mieux, la plupart de l'ensemble de donn�es devront continuer � am�liorer, sinon il va bient�t devenir obsol�te. infrastructures d�di�es et les outils n�cessaires pour faciliter le processus.

En outre, il convient ex�cuter la m�thode appropri�e sur l'ensemble de donn�es, par exemple, y compris l'utilisation de diff�rentes variantes de donn�es (par exemple, l'entr�e n'a pas �t� termin�e) et le mod�le d'un proc�d� simple, de sorte que la version initiale de l'ensemble de donn�es en tant que solide.

Sixi�me, ML et la PNL pour la recherche scientifique

1, ce qui est arriv�?

l'apprentissage de la machine a fait des progr�s consid�rables dans les questions de sciences fondamentales. Par exemple, la recherche (Pfau et al., 2019) The Protein Folding DNN et l'�quation de Schr�dinger multiples d'�lectrons.

Dans le traitement du langage naturel, m�me des m�thodes standard, l'influence des domaines d'expertise combin�e peut �tre g�n�r� en excitant. En cas de l'utilisation de mots technologie int�gr�e pour analyser la litt�rature scientifique des connaissances mat�rielles potentiel (Tshitoyan et al., 2019), � utiliser pour pr�dire si le mat�riau a certaines propri�t�s (voir la figure).

La pr�diction de mots r�sum� de formation int�gr� obtenu � diff�rentes p�riodes de temps qui a �tudi� la mati�re en tant que mat�riau ferro�lectrique (A), un mat�riau photovolta�que (b) et TIs (C), par rapport � tous les mat�riaux candidats dans le r�sum� de l'avenir, sont plus susceptibles de mener des recherches (Tshitoyan et al., 2019) pour la premi�re 50 mati�re pr�visions.

En biologie, un certain nombre de donn�es (par exemple, les g�nes et prot�ines) sont essentiellement les donn�es de s�quence. Ainsi, transformateurs naturels et similaires peuvent �tre m�thode LSTM PNL pour la classification des prot�ines (Strodthoff et al, 2019;. Rives et al, 2019.).

2. Pourquoi est-il important?

ML science est sans doute l'une des applications les plus influentes. Les solutions peuvent avoir un impact significatif sur de nombreux autres domaines, et d'aider � r�soudre des probl�mes pratiques.

3, ensuite?

De la mod�lisation �nerg�tique des probl�mes physiques (Greydanus et al., 2019) pour r�soudre l'�quation diff�rentielle (Lample et Charton, 2020), la m�thode ML a connu une expansion dans de nouvelles applications scientifiques. Regardez l'application en 2020 sur la question de ce qui aura le plus grand impact est aussi tr�s int�ressant.

Sept de d�codage NLG de r�paration d'erreur

1, ce qui est arriv�?

Bien que le mod�le plus puissant, mais la g�n�ration de langage naturel (NLG) est encore produire souvent en double ou un non-sens, comme indiqu� ci-dessous.

GPT-2 recherche en utilisant un faisceau de lumi�re et le g�n�rateur d'�chantillon pur (avidit�) r�p�titions (bleu) et un non-sens (rouge) (Holtzman, et al., 2019).

Le fait que cela est principalement le r�sultat de la formation de vraisemblance maximale. Je suis heureux de voir qu'il ya eu des �tudes visant � am�liorer ce travail, en m�me temps, la mod�lisation a �galement fait des progr�s. Cette am�lioration est obtenue par un proc�d� utilisant la nouvelle ou d'�chantillonnage, telles que l'�chantillonnage nucl�aire (Holtzman, et al., 2019), ou obtenu en utilisant une nouvelle fonction de perte (Welleck et al., 2019).

Une autre d�couverte surprenante est que plus la recherche ne sera pas apporter une meilleure g�n�ration: le mod�le actuel dans une certaine mesure en fonction de la recherche de faisceau imparfait et rechercher des erreurs. Dans le cas de la traduction automatique, la recherche pr�cise retourne g�n�ralement la traduction vide (Stahlberg et Byrne, 2019). Cela indique que la recherche et le progr�s mod�lisation doit aller de pair.

2. Pourquoi est-il important?

g�n�ration de langage naturel PNL est l'une des t�ches les plus courantes. Dans les �tudes PNL et ML, la plupart des journaux ont mis l'accent sur le mod�le am�lior�, tandis que le reste du processus est souvent ignor�e.

Pour la NLG, de noter que notre mod�le est encore imparfait, et la sortie peut �tre am�lior�e en r�parant processus de recherche ou de formation.

3, ensuite?

Malgr� le mod�le plus puissant et l'apprentissage de transfert dans l'application r�ussie de NLG (Song et al, 2019;.. Wolf et al, 2019) provoque le mod�le pour pr�dire il y a encore beaucoup de d�fauts, d'identifier et de comprendre ces d�fauts, l'�tude sera important � l'avenir direction.

Huit, am�lior� mod�le de pr�-formation

1, ce qui est arriv�?

L'ann�e derni�re, je suis heureux de constater que les chercheurs ont propos� une m�thode permettant d'ajouter de nouvelles fonctionnalit�s � un mod�le de pr�-formation. Certaines m�thodes utilis�es pour am�liorer la base de connaissances mod�le de pr�-formation pour am�liorer le nom de l'entit� de mod�lisation (Liu et al., 2019) et rappelle le fait que (Logan et al., 2019). D'autres �tudes, le mod�le pr�-formation capable d'effectuer un raisonnement arithm�tique simple (Andor et al., 2019) par l'acc�s au programme ex�cutable � un grand nombre pr�d�fini.

�tant donn� que la plupart des mod�les ont un �cart faible d'induction et peuvent apprendre la plupart des connaissances � partir de donn�es, am�liorant ainsi le mod�le de pr�-formation Une autre m�thode consiste � am�liorer les donn�es de formation lui-m�me, comme la connaissance de capture (Bosselut et al., 2019), la figure suivante spectacles.

La norme de diligence a longtemps transformateur. mod�les form�s � l'�tranger peuvent �tre pr�dits triplets r�f�rentiel d'objets en fonction des th�mes donn�s et les relations (Bosselut et al., 2019).

2. Pourquoi est-il important?

Mod�le devient de plus en plus puissant, mais le mod�le ne peut pas apprendre beaucoup du texte. Surtout quand le traitement des t�ches plus complexes, les donn�es disponibles peuvent �tre tr�s limit�es, le fait qu'ils ne peuvent pas utiliser le bon sens pour apprendre ou raisonnement explicite, et peut souvent avoir besoin d'une plus forte d�viation par induction.

3, ensuite?

Comme le mod�le est appliqu� � des probl�mes plus difficiles, une combinaison de modifications deviendra de plus en plus n�cessaire. Programme combin� � l'avenir, nous pouvons combiner puissant mod�le de pr�-formation et d'apprentissage (Pierrot et al., 2019).

Neuf, efficace et � long terme du transformateur

1, ce qui est arriv�?

L'ann�e derni�re, l'architecture Transformer pour obtenir des am�liorations (Vaswani et al., 2017). Transformateur-XL par exemple (Dai et al., 2019) et transformateur de compression (Rae et al., 2020) afin que l'architecture peut mieux saisir les d�pendances � longue port�e.

Le transformateur comprim� (m�moire � grain fin) au-del� de l'activation comprim� dans une m�moire plus rugueuse de compression (Rae et al., 2020).

En m�me temps, de nombreuses tentatives en utilisant diff�rentes m�thodes m�canisme d'attention (g�n�ralement rares) pour am�liorer l'efficacit� du transformateur, comme l'utilisation d'une attention clairsem�e d'adaptation (Correia et al., 2019), la dur�e d'attention adaptative (Sukhbaatar et al. , 2019), le produit de la cl� de l'attention (Lample et al., 2019), et un hash locale sensible (Kitaev et al., 2020) et d'autres m�thodes pour am�liorer l'efficacit� du transformateur.

aspects pr�-formation sur le transformateur, il y a eu des variantes plus efficaces, comme l'utilisation des param�tres partag�s ALBERT (Lan et al., 2020) et une utilisation plus efficace de la mission pr�-formation ELECTRA (Clark et al., 2020). Cependant, il y a des pr�-form�s, bien que certains mod�les n'utilisent pas le transformateur, mais plus efficace, comme un mod�le de m�tafichier VAMPIRE (Gururangan et al., 2019) et � base de QRNN MULTIFIT (Eisenschlos et al., 2019).

Une autre tendance dans ce domaine est le grand mod�le raffin� BERT en petits mod�les (Tang et al, 2019;.. Tsai et al, 2019; Sanh et al, 2019.).

2. Pourquoi est-il important?

Depuis l'architecture Transformer depuis l'introduction, il a �t� tr�s influent. Il fait partie de la PNL dans la plupart des derniers mod�les, et a �t� appliqu�e avec succ�s dans de nombreux autres domaines (voir la section 1 et 6). Ainsi, il est susceptible de produire � effet d'entra�nement � forte de toute am�lioration l'architecture Transformer.

3, ensuite?

Ces am�liorations praticiens b�n�ficient obtenus du transformateur peut prendre un certain temps, mais, compte tenu de l'universalit� et la facilit� d'utilisation du mod�le de pr�-formation, cette fois il ne sera pas trop long.

Dans l'ensemble, l'accent mis sur l'architecture du mod�le d'efficacit� esp�rons continuer � �tre le centre d'attention, la parcimonie est l'une des principales tendances.

Dix, la m�thode d'analyse plus fiable

1, ce qui est arriv�?

Au cours de la derni�re ann�e, ML L'une des grandes tendances et de la recherche PNL est que le nombre de mod�les de documents augmente.

En fait, l'ann�e derni�re mon pr�f�r� de plusieurs papiers, des papiers que ce type de mod�les d'analyse. Plus t�t en 2019, Belinkov et verre a fait un tr�s bon rapport pour l'analyse.

Dans mon esprit, la premi�re fois que beaucoup d'un engagement � l'analyse d'un seul papiers BERT mod�le ph�nom�nes (tels papiers sont appel�s BERTology) au cours de l'ann�e �coul�e. Dans ce cas, le mod�le de pr�vision vise � comprendre certaines propri�t�s pour former la sonde de capture, la grammaire, etc., est devenu un outil commun (voir ci-dessous).

Des �tudes ont montr� que, pour la mise en la connaissance de la langue de la sonde (Liu et al., 2019).

I particuli�rement appr�ci� les sondes de papier plus fiables (Liu et al, 2019;. Hewitt & Liang, 2019). La fiabilit� est �galement sur le chemin des sujets de recherche sur le d�veloppement du dialogue pour savoir si l'attention peut fournir une interpr�tation significative (Jain et Wallace, 2019; Wiegreffe & Pinter, 2019; Wallace, 2019).

Suivre papier r�cent sur le 2020 et les mod�les ACL interpr�tabilit� pour l'analyse du mod�le PNL, le meilleur exemple est que les gens ont continu� d'int�r�t dans la m�thode d'analyse.

2. Pourquoi est-il important?

En fait, les m�thodes d'analyse les plus avanc�es � utiliser est souvent une bo�te noire. Afin de d�velopper de meilleurs mod�les et les appliquer dans le monde r�el, nous devons comprendre pourquoi le mod�le de prendre certaines d�cisions. Cependant, nos m�thodes actuelles utilis�es pour interpr�ter les pr�dictions du mod�le sont encore tr�s limit�es.

3, ensuite?

Nous devons faire davantage pour expliquer pr�dire hors de port�e visuelle, parce que ces pr�dictions sont g�n�ralement peu fiables. Une tendance importante dans cette direction, l'ensemble de donn�es fournit une interpr�tation plus humaine (Camburu et al, 2018;. Rajani et al, 2019;. Nie et al, 2019).. Lei Feng Lei Feng Lei r�seau de r�seau de r�seau Feng

Et le travail de tous les documents pertinents mentionn�s dans le texte, vous pouvez avoir acc�s � l'adresse d'origine https://ruder.io/research-highlights-2019/.

Route de la soie

Apprenez � conna�tre la Chine

2019 Dix sujet br�lant domaine ML & PNL

Tout d'abord, la pr�-formation sans supervision g�n�rale

En second lieu, le sous-r�seau � billet gagnant �

En troisi�me lieu, le noyau du nerf tangente

Quatri�mement, les langues multiples d'apprentissage non supervis�

Cinqui�mement, ensemble plus robuste des donn�es de base

Sixi�me, ML et la PNL pour la recherche scientifique

Sept de d�codage NLG de r�paration d'erreur

Huit, am�lior� mod�le de pr�-formation

Neuf, efficace et � long terme du transformateur

Dix, la m�thode d'analyse plus fiable