Livre d'aujourd'hui | apprentissage multi-t�che s�mantique; neuronal r�current, la perte de l'avion; MT-BioNER etc.

annuaire

Utiliser la g�om�trie de la sc�ne des poids de perte des incertitudes de conception et s�mantique apprentissage multi-t�ches

Comprendre la g�n�ralisation des r�seaux de neurones r�currents

pertes en forme de morceaux lin�aires activation sensiblement plane r�seau de neurones

MT-BioNER: la structure du mod�le d'apprentissage multi-t�che BERT reconnaissance d'entit�s nomm�es dans le domaine m�dical

Hi�rarchique multi-t�ches ax�es sur l'apprentissage de la repr�sentation s�mantique

Utiliser la g�om�trie de la sc�ne des poids de perte des incertitudes de conception et s�mantique apprentissage multi-t�ches

Titre de la th�se: multi-t�ches d'apprentissage utilisant l'incertitude pour peser les pertes pour la sc�ne et la g�om�trie S�mantique

Auteur: Alex Kendall / Yarin Gal / Roberto Cipolla

Publi�: 24/04/2018

Documents lien: https //Paper.yanxishe.com/review/17097 de = :? leiphonecolumn_paperreview0421

raison recommand�e

l'apprentissage multi-t�ches de plus en plus la mission a jou� un r�le de catalyseur dans la vitesse de formation et les scores de performance, etc., mais le calcul de la perte, la perte de la fa�on de d�terminer le poids de chaque poids sous-t�che est une difficult� majeure, car � proximit� de la meilleure perte de poids souvent accompagn� la performance pire qu'un mod�le unique de la valeur de la perte de poids. De la t�che d'incertitude d'homog�n�isation (homosc�dastique d'incertitude) point de vue, l'utilisation de la r�gression simplifi�e, le mod�le de classification, plusieurs t�ches d'analyse de r�gression, la fonction objective mod�le de r�gression multi-t�ches + t�ches de classification, a propos� la diffusion de l'information pour tirer profit de l'ensemble de donn�es la conception et la m�thode de formation de poids lourds.

mod�le multi-t�ches comme d�crit ci-dessus con�u pour vaincre tout le mod�le unique t�che et atteint SOTA, en m�me temps, les auteurs prouvent que cette perte est con�ue avec des informations solides pour les param�tres d'initialisation.

Du point de vue de la th�orie bay�sienne, propos� une m�thode alternative pour ajuster manuellement les param�tres pour d�terminer la perte de poids de la fonction multi-t�ches, non seulement efficace, forte et l'intelligibilit�. Cette approche ne peut pas �tre la panac�e, mais pr�sente certainement un sous-espace de recherche viable, a propos� une nouvelle fa�on de fonctionner de perte de conception d'apprentissage multi-t�ches.

Comprendre la g�n�ralisation des r�seaux de neurones r�currents

Titre de la th�se: Comprendre G�n�ralisation dans les r�seaux de neurones r�currents

Auteur: Zhuozhuo Tu / Fengxiang Il / Dacheng Tao

Publi�: 26/09/2019

Documents lien: https: //paper.yanxishe.com/review/17096 de = leiphonecolumn_paperreview0421?

raison recommand�e

Ce document a �t� inclus en 2020 IPSC, de Cheng Group Amoy

Dans cet article, nous d�crivons l'analyse th�orique des performances de g�n�ralisation des r�seaux de neurones r�currents. Nous avons d'abord Matrice 1- norme et Norm Fisher-Rao a propos� une nouvelle g�n�ralisation limite des r�seaux de neurones r�currents. norme d�finie Fisher-Rao du lemme d�pend de la structure � propos de gradient RNN. La nouvelle fronti�re est la matrice de covariance de donn�es admises d'entr�e de g�n�ralisation est d�finie positive, ce qui peut limiter son application dans la pratique. Pour r�soudre ce probl�me, nous proposons d'ajouter un bruit al�atoire dans les donn�es d'entr�e et prouv�e par un bruit al�atoire (donn�es de bruit al�atoire est l'expansion d'entr�e) une fronti�re de formation de g�n�ralisation. Par rapport aux r�sultats pr�c�dents, les limites que nous G�n�ralisation aucune d�pendance �vidente de la taille du r�seau. Nous avons �galement constat� que la norme r�seau de neurones r�current Fisher-Rao (RNN) peut �tre interpr�t� comme une mesure du gradient, gradient dans lequel ils peuvent mesurer non seulement de resserrer les fronti�res, mais �tablit aussi la relation entre la g�n�ralisation et de l'�ducabilit�. Sur cette base, nous avons analys� l'influence des caract�ristiques de g�n�ralisation de covariance de la th�orie des r�seaux de neurones, et discuter de la formation de poids et comment gradient d'att�nuation peut am�liorer la g�n�ralisation des r�seaux de neurones des cultures.

pertes en forme de morceaux lin�aires activation sensiblement plane r�seau de neurones

Th�se Titre: activations lin�aires par morceaux de forme sensiblement les surfaces de perte de r�seaux de neurones

Auteur: Fengxiang Il / Bohan Wang / Dacheng Tao

Publi�: 26/09/2019

Documents lien: https //Paper.yanxishe.com/review/17095 de = :? leiphonecolumn_paperreview0421

raison recommand�e

Ce document a �t� inclus IPSC 2020, loin du grand groupe de poterie Union Centre d'intelligence artificielle Fr�re � l'Universit� de Sydney.

Comprendre le plan de neurones pertes de r�seau pour comprendre la profondeur de l'apprentissage est essentiel. Cet article d�crit comment lin�aire par morceaux fonction d'activation perte de r�seau de neurones de forme plane essentiellement. On montre d'abord beaucoup de perte de r�seaux planaires avec minimum pseudo locaux illimit�s, ces valeurs minimum pseudo local est d�fini comme le risque minimum que l'exp�rience globale minimum local plus �lev�. Nos r�sultats sugg�rent que l'activation du r�seau et lin�aire par morceaux lin�aire r�seau de neurones a �t� bien �tudi� les personnes diff�rentes dans la nature. Dans la pratique, ce r�sultat applique � la plupart de la perte de la fonction et le r�seau de neurones ayant une fonction d'activation lin�aire par morceaux de profondeur arbitraire (non compris une fonction lin�aire). Pour l'essentiel, l'hypoth�se la plus fondamentale est conforme � la situation r�elle, � savoir la couche de sortie est plus �troite que tout de la couche cach�e. En outre, l'utilisation du plan limite non diff�rentiable lin�aire ayant une perte par morceaux activ� r�seau neuronal en une pluralit� d'�l�ments lin�aires multiples lisses. La configuration des minima locaux sous forme de fond pseudo-vall�e dans une unit�: sont reli�s entre eux par une exp�rience de chemin continue un risque constant. Pour seul r�seau de couche cach�e, nous d�montrons encore un minimum de toutes les unit�s locales constitue une classe d'�quivalence, ils sont concentr�s sur un fond ri, ce sont l'unit� minimale globale.

MT-BioNER: la structure du mod�le d'apprentissage multi-t�che BERT reconnaissance d'entit�s nomm�es dans le domaine m�dical

Titre de la th�se: MT-BioNER: multi-t�ches d'apprentissage pour la reconnaissance d'entit�s nomm�es biom�dicale utilisant des transformateurs profonds Bidirectionnel

Auteur: Muhammad Raza Khan / Morteza Ziyadi / Mohamed Abdelhady

Publi�: 24/01/2020

Documents lien: https //Paper.yanxishe.com/review/16879 de = :? leiphonecolumn_paperreview0421

raison recommand�e

Pour aider � l'assistant de chat de formation, Microsoft a propos� un mod�le bas� sur le mod�le de pr�-formation BERT multit�ches reconnaissance d'entit�s nomm�es (NER) sur plusieurs ensembles de donn�es de diff�rents domaines m�dicaux, l'approche sp�cifique est le mod�le de formation pr�-BERT pour la couche commune ( couche d'�mission), une t�che sous-ensemble (t�che couche sp�cifique) de chaque ensemble de champs de donn�es, chacun des poids des sous-t�che sont 1 pour le calcul de la perte de poids. Pendant ce temps, pour sans perte de pr�cision, d'am�liorer efficacement l'efficacit� du temps et des aspects spatiaux du mod�le, une vari�t� de la formation des techniques exp�rimentales, la couche BERT a choisi des couches de formation et de partage ensemble, et un champ de jeu de donn�es s�lectionn� de fa�on al�atoire la formation mini-lot.

En toute justice, les auteurs ont choisi de tester les ensembles de donn�es publiques, mod�le espace-temps de l'efficacit�, les scores de performance sont � SOTA.

Ceci est une des m�thodes d'apprentissage multi-t�ches classique, avec ses propres mots de l'auteur, cette caract�ristique du mod�le est simple et efficace, avec softmax remplacer CRF, mini-lot choisi au hasard, ainsi que des auteurs pr�-form�s en discuter, mais n'a pas rejoint l'exp�rience m�thode BERT de pr�-formation � nouveau, ont r�solu beaucoup de mes questions. En m�me temps, parce que l'id�e est simple, les auteurs expliquent en d�tail pour l'exp�rience, l'apprentissage peut �tre tr�s forte.

Le code n'est pas d�crit ici, mais fournit des ensembles de donn�es utilis�s.

Hi�rarchique multi-t�ches ax�es sur l'apprentissage de la repr�sentation s�mantique

Titre de la th�se: Une hi�rarchique multi-t�che approche pour l'apprentissage Plongements de t�ches s�mantiques

Auteur: Victor Sanh / Thomas Wolf / Sebastian Ruder

Publi�: 26/11/2018

Documents lien: https //Paper.yanxishe.com/review/16753 de = :? leiphonecolumn_paperreview0421

raison recommand�e

Dans cet article, apprendre � utiliser multi-t�ches (apprentissage multi-t�ches) pour obtenir une repr�sentation s�mantique plus riche d'informations, la m�thode sp�cifique est de concevoir un mod�le de r�seau hi�rarchique pour le contexte d'extraction de caract�ristiques d'une phrase, et � partir de cette fonction, NER s�quentiellement con�u (entit�s nomm�es Recognition), EMD (Entit� Mention de d�tection), RE (parent� Extraction), les t�ches CR (cor�f�rence r�solution). Chaque t�che a laquelle sa propre structure de formation BiLSTM et re�oit en m�me temps un �l�ment de contexte de t�che de couche sup�rieure, les caract�ristiques s�mantiques inf�rieures en entr�e. processus de formation, apr�s la fin d'une mise � jour, s�lectionnera au hasard une t�che et l'ensemble de donn�es correspondant pour le prochain cycle de formation. En outre, les auteurs ont tent� l'�change d'informations entre les t�ches en utilisant une combinaison de diff�rentes formations sous-t�che et de la hi�rarchie � observer.

En effet, que ce soit la vitesse ou le score F1, ce mod�le multi-t�ches qu'un seul mod�le de t�che (y compris la mise en place d'un mod�le d'information de syntaxe suppl�mentaires) doivent �tre excellent. Pendant ce temps, les auteurs ont extrait des couches d'information, sur plusieurs missions (sondage des t�ches) analyse la repr�sentation s�mantique de l'information les m�thodes d'apprentissage multi-t�ches apprises en d�tail.

De nombreuses �tudes ont d�montr� qu'un mod�le d'apprentissage multi-t�che bien con�ue est tr�s efficace, mais aussi difficile � concevoir. Dans cet article, la repr�sentation s�mantique de l'apprentissage multi-t�ches tir�es de l'�tude comment �liminer catastrophique oubli� (oubli de catastropic), la connaissance s�mantique efficace l'apprentissage d'autres t�ches et ainsi de suite, avec de bons r�sultats.

�change d'emploi

AI a maintenant Yanxishe Ali et un grand divertissement, vue d�gag�e, recherche Sogou, le millet et d'autres soci�t�s bien connues ont atteint un contact pour vous aider � trouver un emploi meilleur emploi, mettre en place une communaut� au sein de la communaut� AI pour pousser un emploi, recherche d'emploi Stage petit partenaire peut analyser le code dans le groupe, a �galement salu� les �l�ves � lire l'�change de l'apprentissage. (Le groupe a une heure d'entreprise, le recrutement du personnel du projet)

Lei Feng Lei Feng Lei r�seau de r�seau de r�seau Feng

Route de la soie

Apprenez � conna�tre la Chine

Livre d'aujourd'hui | apprentissage multi-t�che s�mantique; neuronal r�current, la perte de l'avion; MT-BioNER etc.

annuaire

Utiliser la g�om�trie de la sc�ne des poids de perte des incertitudes de conception et s�mantique apprentissage multi-t�ches

Comprendre la g�n�ralisation des r�seaux de neurones r�currents

pertes en forme de morceaux lin�aires activation sensiblement plane r�seau de neurones

MT-BioNER: la structure du mod�le d'apprentissage multi-t�che BERT reconnaissance d'entit�s nomm�es dans le domaine m�dical

Hi�rarchique multi-t�ches ax�es sur l'apprentissage de la repr�sentation s�mantique

�change d'emploi