Mod�le de diff�rence interpr�tabilit�? Vous consid�rez encore les incertitudes?

Note de Lei Feng r�seau AI Technology Review: L'auteur est de scientifique des donn�es taboola Inbar Naor, sa recherche est d'explorer l'application de l'apprentissage dans le syst�me de recommandation de profondeur, l'auteur d�crit l'incertitude du mod�le de donn�es dans les questions scientifiques, et d'explorer l'incertitude de la fa�on de d�boguer un mod�le. Lei Feng r�seau AI Technology Review a �t� compil� conform�ment au texte original.

Lorsque la profondeur du r�seau de neurones (DNN) deviennent plus puissants quand ils sont ensemble augmentent la complexit� et cette complexit� a �galement apport� une nouvelle s�rie de d�fis pour les chercheurs, y compris le mod�le interpr�table le sexe.

Interpr�tabilit� pour la construction de plus puissant et a la capacit� d'attaquer le mod�le contradictoire en termes de r�sistance critique. De plus, lorsque nous avons besoin d'un nouveau, mais d'�tre �tude approfondie sur le terrain du mod�le de conception, si l'on peut expliquer le mod�le de m�canisme op�rationnel, ce qui nous aidera � de meilleurs mod�les de conception et d'analyse.

Au cours des derni�res ann�es, parce que conscient de l'importance mod�le interpr�tabilit�, les chercheurs ont mis au point plusieurs m�thodes, et � la conf�rence de l'ann�e derni�re NIPS a �galement une exposition de recherche d�di� (atelier) pour discuter du sujet. La fourniture d'un proc�d� de l'intelligibilit� de mod�le comprenant:

CHAUX: Ceci est une approximation partiellement lin�aire (approximation lin�aire locale) est expliqu� par le mod�le de pr�diction.
Maximise la valeur d'activation (activation Maximization): Cette m�thode peut �tre utilis�e pour d�terminer le mode d'entr�e (motifs) d'entr�e est bien entendu que le mod�le de r�ponse maximum (r�ponse Model).
propose la visualisation.
La couche de r�seau de neurones est incorpor� une profondeur de l'interpr�table d'espace de petite dimension.
M�thodes d'emprunt de la psychologie cognitive pour expliquer.
KDD 2018 r�seau papier Lei Feng AI Technology Review article pr�sente � la p�riode de la � nouvelle m�thode r�volutionnaire pour expliquer avec pr�cision et de mani�re coh�rente la profondeur du r�seau de neurones �
�valuation des incertitudes - ce qui est l'objet de cet article.

Mais avant de commencer Delve dans la fa�on d'utiliser l'incertitude pour expliquer le mod�le et le d�bogage, nous allons comprendre pourquoi l'incertitude est si importante.

Pourquoi avons-nous besoin de se concentrer sur l'incertitude?

Un exemple notable est les applications � haut risque. Supposons que vous concevez un mod�le pour aider les m�decins � d�cider sur les meilleures options de traitement pour les patients. Dans ce cas, nous ne payons que l'attention sur la pr�cision du mod�le pour pr�dire les r�sultats, mais aussi pr�occup� par le degr� de certitude des r�sultats du mod�le de pr�diction. Si le r�sultat de l'incertitude est trop �lev�e, doit �tre examin�e attentivement le m�decin.

v�hicules autonomes est un autre exemple int�ressant. Lorsque le mod�le est incertain s'il y a des pi�tons sur la route, nous pouvons utiliser cette information pour r�duire la vitesse ou d�clencher une alarme pour le traitement du conducteur.

L'incertitude peut aussi nous aider � r�soudre le probl�me parce que l'�chantillon de donn�es (exemples de donn�es) a caus�. Si le mod�le n'est pas �tudi� �chantillon similaire aux donn�es cibles, les r�sultats pr�vus de ses objectifs est le meilleur �chantillon de � Je suis d�sol�, je ne sais pas. � Cela emp�che le peuple afro-am�ricains croient � tort que les gorilles erreurs embarrassantes telles que les photographies avant Google. En effet, l'erreur de jeu de formation parfois caus�e par une diversification insuffisante.

L'incertitude du dernier mode d'application est qu'il peut �tre utilis� comme outil pour le mod�le de d�bogage praticien, qui est l'objet de cet article. Nous parlerons plus tard, mais avant cela, regardons les diff�rents types d'incertitude.

Type d'incertitude

Il existe actuellement diff�rents types d'incertitudes et de mod�lisation, et chacun a un but diff�rent.

L'incertitude du mod�le, qui est la perception de l'incertitude (incertitude �pist�mique): Supposons que vous ayez un seul point de donn�es, et que vous voulez savoir quel type de mod�le lin�aire explique le mieux vos donn�es. Mais la r�alit� est, quand vous n'�tes pas en mesure de d�terminer quelle ligne est juste - nous avons besoin de plus de donn�es!

� gauche: manque de r�sultats de donn�es dans un degr� �lev� d'incertitude. A droite: Plus l'incertitude des donn�es est plus faible.

l'incertitude cognitive explique l'incertitude dans les param�tres du mod�le. Nous ne sommes pas s�r de ce que le bon mod�le qui d�crit le mieux les donn�es de poids, mais il a plus de donn�es a pu r�duire cette incertitude. Cette incertitude est tr�s important dans les applications � haut risque et le traitement de petites donn�es rares.

Par exemple, supposons que vous voulez cr�er un peut d�terminer si l'image d'entr�e des animaux peut manger votre mod�le. Ensuite, votre mod�le ne contient que les lions et les girafes ensembles de donn�es ont �t� form�s et donne maintenant une image de zombie comme entr�e. Parce que le mod�le n'est pas appris image zombie, donc pr�dire l'incertitude du r�sultat sera �lev�. Cette incertitude appartiennent r�sultats du mod�le, et si vous vous concentrez sur les donn�es fournies plus l'image de zombie, l'incertitude du mod�le sera r�duit.

L'incertitude des donn�es Ou appel� incertitude al�atoire (Aleatoric d'incertitude), se r�f�re � l'observation du bruit propre. Parfois, l'�v�nement lui-m�me est al�atoire, dans ce cas, nous obtenons plus de donn�es n'a pas aid�, parce que la partie inh�rente du bruit des donn�es.

Pour comprendre cela, revenons au mod�le des pr�dateurs de la discrimination. Notre mod�le peut d�terminer la pr�sence d'une image de lion, et donc pr�dire que vous pourriez �tre mang�. Toutefois, si vous n'�tes pas lions affam�s maintenant quoi? Cette incertitude provient de donn�es. Un autre exemple est qu'il ya deux ressemble � un serpent, mais l'un des toxiques, l'autre ne sont pas toxiques.

l'incertitude al�atoire peut �tre divis� en deux cat�gories:

�cart d'incertitude (incertitude homosc�dastique): A cette �poque, toutes les entr�es ont la m�me incertitude.

H�t�rosc�dasticit� incertitude (incertitude h�t�rosc�dastique): Cette incertitude d�pend des donn�es d'entr�e. Par exemple, le mod�le de pr�diction de l'information de profondeur d'image, paroi plane sans relief (mur sans relief) de l'image a une forte ligne de fuite (les lignes de fuite) ayant une plus grande incertitude.

L'incertitude de mesure (incertitude de mesure) : Une autre source d'incertitude de la mesure elle-m�me. Lors de la mesure de la pr�sence de bruit, l'incertitude augmentera. Dans le mod�le des pr�dateurs de discrimination, si certaines des images sont captur�es par la mauvaise qualit� de la cam�ra vid�o, il est possible d'endommager la confiance du mod�le. Ou en train de tirer sur un Hippopotame en col�re, car nous courons et le tournage, ce qui entra�ne une image floue.

bruit �tiquettes (�tiquettes Noisy) : En apprentissage supervis�, nous utilisons des balises pour former le mod�le. Et si l'�tiquette elle-m�me avec le bruit, l'incertitude augmentera.

Cependant, actuellement il y a plusieurs fa�ons de mettre en uvre diff�rents types de mod�lisation des incertitudes. Ces m�thodes sont d�crites dans les articles suivants de cette s�rie. Maintenant, supposons qu'il existe un mod�le de bo�te noire a expos� son incertitude des pr�visions, que si nous aidons � ce mod�le pour le d�boguer?

Prenons un mod�le taboola par exemple, le mod�le peut �tre utilis� pour pr�dire la probabilit� d'un utilisateur en cliquant sur un contenu recommand�.

Utiliser le mod�le de d�bogage incertitude

Ce mod�le a un certain nombre de caract�ristiques fournies par la classification repr�sentation vectorielle int�gr�e, cependant, il est difficile d'apprendre la valeur du vecteur commun rare embarqu� (plongement G�n�ralis�e). solution commune � ce probl�me est d'utiliser un vocabulaire sp�cial Out of (MHV) vecteur int�gr�.

Pensez � un des articles de l'annonceur, si tous les annonceurs rares partagent le m�me vecteur embarqu� MHV, le mod�le du point de vue, ils sont fondamentalement du m�me annonceur. Cet annonceurs MHV Il existe de nombreux produits diff�rents, chaque produit a un autre taux de clics (CTR). Si nous utilisons les annonceurs seulement comme clics pr�dicteur de taux, le MHV produira une forte incertitude.

Pour v�rifier la sortie du mod�le MHV degr� �lev� d'incertitude, nous avons utilis� un ensemble et de v�rifier tous les annonceurs vecteur int�gr� converti MHV. Ensuite, nous avons examin� avant et apr�s le mod�le de conversion de vecteur incertitude. Comme pr�vu, en raison de la conversion de vecteur d'incertitude, l'augmentation du mod�le. Si vous donnez aux annonceurs une richesse de vecteur d'information int�gr�, l'incertitude du mod�le sera r�duit.

Nous pouvons le r�p�ter pour diff�rentes fonctions, puis trouver ceux qui utilisent MHV les r�sultats de la fonction int�gr�e dans une incertitude plus faible lorsque le remplacement du vecteur. Ces caract�ristiques sont uninformative, ou parce que nous leur fournissons de la fa�on dont le mod�le est faux.

On peut m�me employer une granularit� plus fine: Certains annonceurs il y a une grande variabilit� entre les clics taux pour les diff�rents produits, et d'autres de la taux de clics publicitaires est � peu pr�s la m�me chose. Nous esp�rons que ce mod�le a une plus grande incertitude des premiers annonceurs de classe. Par cons�quent, une strat�gie d'analyse utile est de se concentrer sur la corr�lation entre les annonceurs et l'incertitude clics variabilit� de la fr�quence. Si la corr�lation est pas positif, cela signifie que le mod�le ne comprend pas l'incertitude associ�e � chaque annonceur. Cet outil nous permet de comprendre l'architecture du mod�le de processus de formation ou que ce soit par la question et indiquer si nous devons encore d�boguer.

Nous pouvons effectuer une analyse similaire et voir si les questions li�es � une incertitude particuli�re r�duira le nombre de fois nous l'avons montr� (� savoir plus d'utilisateurs / exposition locale). De m�me, nous voulons que le mod�le devienne plus d�termin�, si le mod�le est encore incertain, nous allons continuer � d�boguer.

Un autre exemple est cool les caract�ristiques de titre: un titre unique avec des mots rares devrait apporter une forte incertitude du mod�le. Cela est d� � l'absence de r�sultats du mod�le li� � l'exp�rience d'apprentissage. Nous pouvons v�rifier � partir centralis�e pour identifier les titres rares qui contiennent des mots et d'estimer l'incertitude du mod�le sur ces titres. Ensuite, nous allons utiliser un titre pour re-former le mod�le, puis observer l'incertitude du mod�le si ces titres ont diminu�. Nous avons pu obtenir une meilleure compr�hension du tableau ci-dessous.

conclusion

L'incertitude dans de nombreux domaines est un gros probl�me. La clart� dans la t�che sp�cifique en question appartient � quel type d'incertitude est tr�s important. Une fois que vous savez comment mod�le, vous pouvez les utiliser de diff�rentes mani�res. Dans cet article, nous avons discut� de la fa�on de les utiliser pour le mod�le de d�bogage. Dans le prochain article, nous allons discuter des diff�rentes m�thodes d'estimation de l'incertitude obtenues � partir du mod�le.

Via � Utilisation de l'incertitude pour votre mod�le Interpr�tez �, les commentaires compil�s par la technologie r�seau Lei Feng AI.

Route de la soie

Apprenez � conna�tre la Chine

Mod�le de diff�rence interpr�tabilit�? Vous consid�rez encore les incertitudes?

Pourquoi avons-nous besoin de se concentrer sur l'incertitude?

Type d'incertitude

Utiliser le mod�le de d�bogage incertitude

conclusion