blanc apprentissage machine ici, vous apporter une compr�hension globale de l'�valuation du classificateur

Lei Feng r�seau AI Yanxishe presse: S�lectionnez l'�valuation correcte est essentielle � votre classificateur. Si vous choisissez bien, vous pourriez tomber dans ce dilemme: vous consid�rez-vous une bonne performance du mod�le, mais ce n'est pas.

R�cemment, un article sur un aper�u de towardsdatascience dans l'�valuation du classificateur, et doit �tre utilis� dans tout sc�nario, Lei Feng r�seau AI Yanxishe compiler le contenu sont r�sum�s comme suit:

Dans cet article, vous apprendrez pourquoi l'�valuation de classificateur plus difficile, pourquoi, dans la plupart des cas, une pr�cision de classification apparemment �lev� de performance de classement n'a pas �t� si bon, ce qui est le classificateur d'�valuation correcte, vous devriez l'utilisation de ces �valuation et quand, comment comptez-vous cr�er un taux de pr�cision de classificateur.

annuaire

�valuation Pourquoi est-il si important?
Matrice de confusion
Pr�cision et rappel
F-Score
pr�cision compromis et le rappel de
Courbes et rappel de
ROC, courbe AUC et ROC, la valeur d'AUC
r�sum�

�valuation Pourquoi est-il si important?

En g�n�ral, l'�valuation d'un classificateur qu'un algorithme de r�gression est beaucoup plus difficile � �valuer. Le c�l�bre jeu de donn�es MNIST est un bon exemple, il contient plus d'un 0-9 �crits � la main des photos num�riques. Si nous voulons construire un classificateur pour d�terminer si une valeur de 6 � construire un algorithme toutes les entr�es class�es comme non-6, alors vous concentrer recevoir une pr�cision de 90% des donn�es MNIST parce que l'ensemble de donn�es est seulement d'environ 10% des images 6. Ceci est un probl�me majeur dans l'apprentissage de la machine, mais aussi vous avez besoin de plus de quelques raisons d'utiliser votre test d'�valuation classificateur.

Matrice de confusion

Tout d'abord, vous pouvez regarder la matrice de confusion, il est �galement appel�e matrice d'erreur. Il est une forme d�crivant la performance du mod�le d'apprentissage supervis� sur les donn�es de test, o� la valeur r�elle est inconnue. Chaque rang�e de la matrice repr�sente un exemple de la classe pr�vue, par exemple et chaque colonne (ou vice versa) indique la cat�gorie actuelle. La raison pour laquelle elle est appel�e � matrice de confusion � est que vous pouvez facilement l'utiliser pour voir le syst�me en place qui confondre les deux cat�gories.

Vous pouvez voir la figure ci-dessous � l'aide du sklearn de sortie fonction � confusion_matrix � r�sultant des ensembles de donn�es MNIST:

Chaque ligne repr�sente une classe r�elle, chaque colonne repr�sente une pr�diction de la cat�gorie.

La premi�re ligne est en fait le num�ro � non-6 � d'images (classe n�gative). Parmi eux, 53,459 images ont �t� correctement class�s comme � non-6 � (appel�e � classe r�elle �). Les 623 images restantes ont �t� mal class�es comme � 6 � (fausse classe positive).

La deuxi�me ligne repr�sente la v�ritable image � 6 �. Parmi eux, 473 photos sont mal class�es comme � non-6 � (classe faux n�gatif), 5445 images sont correctement class�s comme � 6 � (le vrai genre).

S'il vous pla�t noter la classification parfaite sera 100% correct, ce qui signifie qu'il ne vraiment vrai de classe de classe et n�gative.

Pr�cision et rappel

Une matrice de confusion peut vous donner beaucoup de bonnes informations sur la fa�on dont votre (classification) mod�les font, mais il y a un moyen pour vous d'obtenir plus d'informations, telles que le calcul exact de la classification des taux (de pr�cision). De toute �vidence, il est pr�vu que la pr�cision des �chantillons positifs (pr�cision), et il est souvent et le rappel (Recall, � savoir des exemples positifs proportion d�tect�s correctement de tous les cas positifs) vus ensemble.

sklearn dispose d'une fonction int�gr�e pour calculer une pr�cision et de rappel de:

Nous avons maintenant un meilleur indicateur de l'�valuation du classificateur. Notre mod�le pr�dit l'image de la situation � 6 � 89% est correcte. Il nous dit qu'il se rappellera 92% de vraiment � 6 � Pr�visions des exemples est � 6. �

Bien s�r, il existe de meilleures m�thodes d'�valuation.

valeur F-

Vous pouvez mettre la pr�cision et la vitesse de rappel fusionn� en un seul indice d'�valuation, qui est appel�e � valeur F- � (�galement connue sous le nom de la � valeur F1- �). Si vous voulez comparer deux classificateurs, la valeur F- serait utile. Il est l'utilisation de pr�cision et de rappel calcul�e moyenne harmonique, et de faibles valeurs donnera plus de poids. En cons�quence, seuls les taux de pr�cision et de rappel sont �lev�s lorsque le classificateur obtenir une grande valeur F-1. F peut �tre facilement calcul� les valeurs sklearn.

A partir de la figure, vous pouvez voir notre mod�le a �t� F-1 valeur de 0,9:

Cependant la valeur F- est pas une panac�e � Saint Graal � pr�cision et rappeler classificateur � proximit� F-1 aura un meilleur score. Ceci est un probl�me, parce que parfois vous voulez que le taux exact, et parfois souhaitez taux de rappel. En fait, plus le taux de pr�cision entra�nera une baisse des taux de rappel, et vice versa. Ceci est appel� pr�cision de compromis et le taux de rappel, nous discuterons dans le chapitre suivant.

pr�cision compromis et le rappel de

Pour mieux expliquer, je vais vous donner quelques exemples pour illustrer le taux �lev� de pr�cision quand il veut, quand il veut un taux �lev� de rappel.

Taux �lev� de pr�cision:

Si vous �tes un classificateur form� est utilis� pour d�tecter si pour les enfants de voir la vid�o appropri�e ou non, vous voudrez peut-�tre � un taux �lev� de pr�cision. Cela signifie que vous voulez obtenir classificateur peut rejeter un grand nombre de vid�os pour les enfants, mais ne vous donnera pas la vid�o contient du contenu adulte, il sera donc plus d'assurance. (En d'autres termes, un taux de pr�cision tr�s �lev�)

Taux �lev� de rappel:

Si vous voulez former un classificateur pour d�tecter les personnes qui tentent de p�n�trer dans le b�timent, ce qui n�cessite un taux �lev� de rappel. Classificateur peut �tre seulement 25 pour cent le taux de pr�cision (et donc la cause des fausses alarmes), tant que le classificateur taux de rappel de 99% et presque chaque fois que quelqu'un essaie de p�n�trer dans votre volont� � la police, mais semble �tre un bon classificateur.

Pour mieux comprendre ce compromis, nous examinons comment classificateur descente de gradient stochastique (SGD) pour prendre des d�cisions de classement sur MNIST ensemble de donn�es. Pour chaque image devant �tre tri�s, qui calcule le score bas� sur une fonction de d�cision, et l'image est class�e comme une valeur num�rique (score plus grande que lorsque la valeur de seuil) ou d'une autre valeur num�rique (lorsque le score est inf�rieur � la valeur de seuil).

La figure suivante montre le score num�rique �crit � la main du bas (� gauche) � disposition haute (� droite). Supposons que vous ayez un classificateur, qui est utilis� pour d�tecter un � 5 �, et le seuil est situ� au milieu de l'image (o� le centre de la fl�che). Ensuite, vous verrez quatre classes r�el (exemple r�el de � 5 �) et une classe de faux positifs (en fait un � 6 �) � droite de ce seuil. Ce seuil sera de 80% le taux de pr�cision (quatre cinqui�mes), mais il ne peut tout de six vraie trouvaille quatre � � 5 � de l'image, de sorte que le rappel �tait de 67% (six points quatre). Si vous �tes au seuil � droite de la fl�che, ce qui se traduira par une plus grande pr�cision de taux, mais avec un taux de rappel plus faible, et vice-versa (si vous d�placez la valeur de seuil � la gauche de la fl�che).

Taux d'exactitude / courbe de rappel

Compromis entre la pr�cision et le taux de pr�cision de rappel peut �tre - courbe de rappel est observ�e, il vous permet de voir quel meilleur seuil.

Une autre approche est le taux de pr�cision et de rappel � une courbe trac�e:

Dans la figure, on peut clairement voir que lorsqu'environ taux de pr�cision de 95%, le taux de pr�cision accrue, une diminution de rappel rapide. D'apr�s les images ci-dessus deux, vous pouvez choisir un taux d'offrir le meilleur seuil de pr�cision compromis entre / rappel pour vos t�ches en cours d'apprentissage de la machine. Si vous voulez taux de pr�cision de 85%, vous pouvez voir le premier graphique, la valeur seuil est d'environ 50000.

ROC, courbe AUC et ROC, la valeur d'AUC

courbe ROC est un autre outil pour l'�valuation et la comparaison des deux classificateurs. Et courbes pr�cision / rappel ont beaucoup de similitudes, bien s�r, ils sont diff�rents. Il a vraiment la classe de taux (vrai taux positif, � savoir Recall) et fausse classe taux positif (proportion de cas de n�gatif) correspond � une classification erron�e figure dans le dessin, au lieu d'utiliser la pr�cision et le rappel.

Bien s�r, il a �galement �t� un compromis. Classificateurs g�n�rent plus fausse classe positif, le taux r�el de la classe sera plus �lev�. La ligne rouge repr�sente la moyenne d'un classificateur compl�tement al�atoire, le classificateur doit former une courbe loin que possible.

zone de passage (AUC), mesur�e sous la courbe ROC, courbe ROC fournit une m�thode pour comparer les performances des deux classificateurs. Cette zone est appel�e valeurs ROC AUC, AUC ROC 100% classification correcte de la valeur de 1.

Un classificateur compl�tement al�atoire ROC AUC de 0,5. La figure MNIST est le mod�le de sortie:

r�sum�

Gr�ce � la description ci-dessus, nous apprendrons si l'�valuation et de classification, ainsi que des outils permettant d'�valuer. De plus, apprendre aussi comment avec pr�cision et rappeler un compromis, et comment comparer la performance de la courbe ROC ASC diff�rents classificateurs.

Nous avons aussi appris que la classification de haute pr�cision ne pas satisfaisant que cela puisse para�tre: En raison du taux moyen de grande pr�cision la baisse des taux de rappel.

La prochaine fois que vous entendez quelqu'un dire qu'un classement avec un taux de pr�cision de 99% ou de pr�cision, vous savez que vous devriez demander � d'autres indicateurs, il a expliqu� comment ce poste.

Liens vers les ressources

https://en.wikipedia.org/wiki/Confusion_matrix

https://github.com/Donges-Niklas/Classification-Basics/blob/master/Classification_Basics.ipynb

https://www.amazon.de/Hands-Machine-Learning-Scikit-Learn-TensorFlow/dp/1491962291/ref=sr_1_1?ie=UTF8&qid=1522746048&sr=8-1&keywords=hands+on+machine+learning

via towardsdatascience

Lei Feng r�seau de compilateur de finition AI Yanxishe.

Route de la soie

Apprenez � conna�tre la Chine

blanc apprentissage machine ici, vous apporter une compr�hension globale de l'�valuation du classificateur