Li Feifei Pr�sident de l'Universit� de Stanford notes de cours CS231n: K & lin�aire classification du plus proche voisin

Lei Feng note de r�seau AI Technology Review: Ce cours est Li conf�rencier Feifei cours Stanford CS231n vision informatique, Zhuhai College de l'Universit� de Jilin, Zhao Yifan ont �t� consolid�es zone des notes. Remarque Si une erreur, s'il vous pla�t laissez-moi savoir. section correspondante pr�sente: une classification du pilote de donn�es d'image: K le plus proche classificateur lin�aire voisin. La section pr�c�dente: Computer Vision Histoire et introduction

Les photos reviennent pour discuter KNN:

Nous pouvons voir qu'il est en fait pas tr�s bonne performance. Ici, en rouge et vert, la pr�cision de la classification de l'image d�pend de la valeur de son voisin le plus proche, vous pouvez voir l'effet de la performance de KNN est pas tr�s bon, mais si vous utilisez une plus grande valeur de K, le r�sultat de l'op�ration de vote, il peut atteindre les trois premiers, ou cinq, m�me toute la gamme de donn�es.

Lorsque vous utilisez cette m�thode pour r�cup�rer une donn�e adjacente, il est pr�vu que cela produira une plus grande robustesse au bruit. Il y a une autre option, qui est, quand un algorithme du plus proche voisin K-, d�terminer comment les donn�es comparant la valeur de distance par rapport � c�t� de transmettre diff�rents.

Par exemple, � ce jour, ont montr� la distance L1 a �t� discut�, qui est la somme de la diff�rence absolue entre les pixels, un autre choix commun est la distance L2 est la distance euclidienne, � savoir, en prenant la place de la somme des racines, et ce comme la distance.

Choisissez une mesure de distance diff�rente est en fait un sujet tr�s int�ressant, parce que dans des dimensions diff�rentes, faire des hypoth�ses diff�rentes sur la g�om�trie ou de la topologie de l'espace sous-jacente pr�vue dans.

En ce qui concerne la distance L1 et la distance L2 repr�sent�e dans ce qui suit sur la base de ce fait, un carr� et un cercle autour de l'origine, chaque point sur la L1 sont � �gale distance de l'origine du carr� de la distance, la distance sera similaire est un cercle, on dirait que vous attendez.

Il a mis en �vidence une question int�ressante entre les deux m�thodes:

distance L1 d�pend du syst�me de coordonn�es de votre choix, si vous choisissez la distance entre l'axe L1, le point va changer, changer aucun effet sur la distance axe L2, quelle que soit la fa�on dont le type de coordonn�es, une distance L2 est d�termin�e valeur.
Si vous entrez dans un certain nombre de vecteurs de caract�ristiques, certaines des valeurs dans le vecteur il y a une t�che importante, L1 peut �tre plus appropri�.
Mais si c'est juste un vecteur commun d'un espace qui ne conna�t pas la signification des diff�rents �l�ments, alors L2 serait plus appropri� pour certains.

Un autre point:

En utilisant diff�rentes mesures de distance, K- classificateur voisin le plus proche peut �tre g�n�ralis� � de nombreux types de donn�es, plut�t qu'un vecteur, non seulement l'image. Par exemple, supposons que vous voulez classer le texte, alors seulement besoin de sp�cifier une fonction de distance KNN qui permet de mesurer la distance entre deux mots ou deux mots. Ainsi, en sp�cifiant simplement une mesure de distance diff�rente, il peut tr�s bien �tre utilis� dans l'algorithme pratiquement tout type de donn�es.

Choisissez une mesure de distance diff�rente est une question int�ressante en g�om�trie.

La gauche peut voir un ensemble de distances L1, L2 de la droite est utilis�e.

Comme on peut le voir, le classificateur limite de d�cision est en fait une grande diff�rence:

L1 tend � fronti�re de d�cision avec l'axe, car la L1 en fonction du choix des coordonn�es;
L2 sorte de la distance et les coordonn�es ne sera pas affect�e, mais la fronti�re plac� l� o� il est le plus naturel.

Comment d�terminer ces param�tres en fonction des questions et des donn�es ultra?

S�lectionnez une grande pr�cision peut �tre donn� l'ensemble de la formation, les param�tres les plus performants super. Ceci est en fait une tr�s mauvaise id�e, ne le faites pas.

Par exemple, avant que l'algorithme de classification voisin le plus proche K-, en supposant que K = 1, classez toujours parfaitement les donn�es de formation, donc si cette strat�gie toujours choisir K = 1, mais comme on le voit dans le cas avant, dans la pratique K prend une valeur plus grande, bien que la formation se concentrera sur les points de donn�es erron�es, mais pour le mieux n'a pas �t� vu dans l'ensemble de la formation de la performance de classification des donn�es, dans la finale � l'apprentissage de la machine, soucieux de ne pas adapter l'ensemble de la formation possible, mais de rendre les donn�es inconnues classificateur en dehors de l'ensemble de la formation sur une meilleure performance.

Une autre id�e est de diviser les donn�es en deux parties, l'ensemble de la formation, une autre partie de l'ensemble de test, l'algorithme de formation avec des param�tres diff�rents dans le jeu super formation, le classificateur form� est utilis� dans un ensemble de test, puis s�lectionnez une groupe a montr� les meilleurs param�tres de super sur l'ensemble de test.

Cela semble �tre une strat�gie raisonnable, mais en fait est tr�s mauvais. Parce que le but est de comprendre comment les performances de l'algorithme d'apprentissage machine, la m�thode est juste un ensemble de test des estimations qui montrent comment l'algorithme sur les donn�es n'a pas rencontr�, si diff�rents param�tres tels une strat�gie diff�rente de l'algorithme ultra-formation, puis s�lectionnez le plus performant des param�tres super-ensemble sur le test, il est susceptible de s�lectionner un groupe d'hyper-param�tres, laissez l'algorithme sur cet ensemble de jeux de tests de bons r�sultats, mais les performances de ce groupe de jeu de test ne peut pas �tre repr�sent�e � l'autorit� invisible sur les donn�es de performance.

pratique plus courante consiste � s�parer les donn�es en trois groupes: la majorit� de l'ensemble de la formation et un ensemble de validation, un ensemble de test. , Ex�cut�e sur l'ensemble de la formation diff�rents param�tres de formation ultra-�valuation sur l'ensemble de validation, puis s�lectionnez un ensemble de param�tres pour �valuer la meilleure, puis mettre cet ensemble de donn�es dans l'ensemble de test pour une course, est d'�crire du papier donn�es, ce sont les performances de l'algorithme sur les nouvelles donn�es ne se voit pas.

Il y a une m�thode con�ue param�tre ultra est la validation crois�e.

Plus couramment utilis� sur les petits ensembles de donn�es, comment couramment utilis� dans l'�tude approfondie. L'id�e est de supprimer l'ensemble des donn�es de test, l'ensemble du jeu de test de r�tention de donn�es utilis�e pour la derni�re dans le cadre de, pour le reste des donn�es est divis� en plusieurs parties, dans ce cas, chacun d'eux � son tour comme l'ensemble de validation.

Apr�s validation crois�e, de sorte qu'une carte sera:

L'axe des abscisses repr�sente la valeur du param�tre classificateur voisin le plus proche K- K, l'axe y repr�sente la diff�rence de pr�cision de classification des donn�es K. Dans cet exemple, avec une 5 fois la validation crois�e, ce qui signifie que pour chaque valeur K de l'algorithme sont fait cinq tests pour savoir comment se comporter.

Utiliser la validation crois�e K fois pourrait �tre une bonne fa�on de le quantifier, il peut �tre observ� la performance de l'algorithme de variance sur un ensemble diff�rent de validation, en m�me temps, conduira non seulement � mieux conna�tre, mais aussi pour voir l'effet de l'algorithme de distribution.

En fait, KNN est rarement utilis� dans la classification d'images, y compris les raisons de tous les probl�mes mentionn�s. Tout d'abord, il est une tr�s longue dur�e de fonctionnement pendant le test, et il ne correspond pas aux exigences mentionn�es juste, un autre probl�me est que, comme la distance euclidienne ou distance L1 une telle mesure utilis�e dans l'image de comparaison est vraiment pas appropri�. Cette fonction vectoris� pas de distance appropri�e indique le degr� de similitude entre l'image visuelle.

La figure figure � gauche et � droite trois filles apr�s des photos de diff�rents traitements, s'ils calculent la distance euclidienne et uvres d'art, sera la m�me r�ponse, qui n'a pas voulu. L2 peut le sentir ne rentre pas dans l'image entre la perception visuelle des diff�rences.

Il y a aussi un probl�me appel� mal�diction de la dimensionnalit�, si vous vous souvenez de la description des voisins K, il est un peu comme un point de formation de l'espace de l'�chantillon en morceaux, ce qui signifie que si vous voulez avoir un meilleur r�sultat de la classification, les donn�es peuvent n�cessiter une formation intensive r�partis dans l'espace. Dans le cas contraire, le point le plus proche de la distance r�elle peut �tre tr�s loin.

Le probl�me est, vous voulez �tre dens�ment r�partis dans l'espace de donn�es, des moyens de formation que les donn�es de fa�on exponentielle.

R�sum�:

Nous pr�sentons les id�es de base KNN font la classification d'images, avec l'ensemble de la formation d'images et l'�tiquette correspondante, on peut pr�dire l'ensemble de test de classification des donn�es.

Ce qui suit d�crit le r�seau de neurones, le r�seau de neurones sera g�n�ralement assimil� � jouer haut.

Il peut �tre combin� diff�rents types de composants de r�seau neuronal ensemble pour construire autre r�seau de convolution grand, l'un des blocs de construction de base qui se voit dans une �tude approfondie des diff�rents types d'applications. Certains laboratoires de recherche des l�gendes d'images tels exemples se rapportant � la nature modulaire des r�seaux de neurones vient.

Une image d'entr�e et d�livre une description descriptive de la phrase de l'image. Un tel travail est effectu� par une convolution image r�seau de neurones d'int�r�t et une pr�occupation que la langue du r�seau de neurones r�current compos� de ces deux r�seaux sur le dernier train pour obtenir un syst�me super puissant pour faire grand chose.

De tels param�tres lin�aires mod�le de classificateur est le plus exemple simple:

Param�tre du mod�le a en fait deux parties diff�rentes � cette image comme un exemple, un groupe de chats gauche, il y a un param�tre de poids ensemble, commun�ment appel� W, parfois appel� . Maintenant �crire certaines fonctions incluent les donn�es d'entr�e x et les param�tres thetav, correspondra � une sortie num�rique 10 ICRA-10 en 10 cat�gories correspondant aux points correspondants. D'apr�s la description ci-dessus, par exemple, une plus grande fraction du chat, et x est plus susceptible d'entrer dans la surface du chat.

Dans le dernier set param�tres aucun algorithme voisin, il a remplac� normalement r�serv� � tous les types de jeu de formation et utilis� dans l'essai. Mais maintenant, dans une approche param�trique, les donn�es de formation seront r�sum�es et toutes les connaissances n�cessaires pour utiliser ces param�tres W, dans un temps de test, les donn�es de formation proprement dite n'est plus n�cessaire, seulement besoin d'utiliser le param�tre W, ce qui rend le mod�le plus efficace et peut m�me fonctionner sur les petits appareils tels que les t�l�phones mobiles.

�tude approfondie, toute la description sont sur la structure correcte de la fonction F peut �tre pr�par� par l'imagination des formes diff�rentes fonctions, avec des poids complexes et des donn�es de combinaison, qui peuvent correspondre � diff�rentes architectures de r�seau neuronal.

Par cons�quent, F (X) = Wx est un moyen simple classificateur lin�aire, si l'�quation ci-dessus peut dimensionner hors de la solution, � condition que la valeur de l'image d'entr�e est de 32 * 32 * 3, puis de les amener � des valeurs qui se d�veloppe dans un 3072 vecteur colonne � long terme, vous voulez venir � marquer 10 classe. Pour cette image, veulent obtenir les 10 derniers chiffres, pour donner les scores correspondants pour chaque cat�gorie, qui est, est maintenant 10 W * 3072 matrice, X est la matrice de 3072 * 10, et donc, une fois les deux phases se multiplient, nous donnerons un vecteur de colonne, un score de 10 cat�gories.

Habituellement ajouter un terme de biais, il est souvent un vecteur de 10 �l�ments, il ne Interagir avec les donn�es de formation, mais seulement � certaines des donn�es ind�pendamment de la valeur de d�calage.

Voici un exemple de simple. La gauche est une image simple, de sorte que le travail est le classificateur lin�aire 2 * 2 dessin d'image dans un vecteur de colonne avec quatre �l�ments.

L'hypoth�se ici que trois cas, la matrice de poids est maintenant 4 * 3, peut �tre comprise comme m�thode de classification presque lin�aire de correspondance de gabarit, chaque rang�e de la matrice correspond � une image mod�le. Le produit ou le produit scalaire des rangs de la matrice d'entr�e, pour obtenir ainsi des pixels de l'image. Le calcul du produit scalaire peut �tre obtenu entre la matrice et les images � base de pixels, il existe une similitude, le d�calage des donn�es d'�chelle en regard de chaque classe et une quantit� de d�calage de polarisation.

Si elle est bas�e sur cette perspective de mise en correspondance de mod�le, pensez classificateur, en fait, vous pouvez prendre le vecteur de ligne de la matrice de poids, et de les restaurer sous forme d'images. Dans cet exemple, � un bon lin�aire classificateur sur l'image d'apprentissage, la partie inf�rieure de l'ensemble de donn�es d'apprentissage est un vecteur ligne de la matrice de pond�ration correspondant � la visualisation d�pendant de la classe 10 des r�sultats.

Par exemple, l'avion par les classes moyennes semblent bleu mod�le similaire marbr� graphiques fond bleu et la composition, qui produit un avion classificateur lin�aire peut �tre � la recherche graphique et le sentiment point bleu comme mod�le, et ensuite faire ces actes ce classement est plus comme un avion. La cat�gorie de voiture du mod�le peut �tre vu au milieu d'une tache rouge comme des objets, ainsi que dans la partie sup�rieure du pare-brise est un point bleu comme des objets.

Mais ceux-ci semblent �tranges, ce n'est pas une chose r�elle, donc il y a un probl�me, classificateur lin�aire ne peut apprendre un mod�le pour chaque cat�gorie, cette cat�gorie s'il y avait un certain type de variante, il va tenter de obtenir la moyenne de toutes ces diff�rentes variantes, et utiliser un seul mod�le pour identifier chacune de ces cat�gories.

Un autre point de vue sur le classificateur:

Retour � l'image, comme un point de l'espace et des hautes latitudes du concept peut �tre consid�r� de chaque image sont espace de grande dimension un point, et maintenant ce classificateur est une tentative de classificateur lin�aire pour tirer sur la surface de ces limites de d�cision lin�aire de diviser une classe et les autres cat�gories restantes. Dans le coin sup�rieur gauche, a vu le plan de l'�chantillon utilis� pour la formation, de formation, cette classification tentera de tracer une ligne droite pour diviser cet avion bleu et d'autres cat�gories.

Si vous regardez le processus de formation, les lignes commenceront au hasard, puis transformer rapidement une tentative de s�parer les donn�es zone correcte.

Mais lorsque l'espace de grande dimension � partir du point de vue du classificateur lin�aire, classificateur lin�aire peut voir les probl�mes qui peuvent survenir � nouveau:

Pour construire un �chec complet de classificateur lin�aire de l'�chantillon de donn�es ne sont pas difficiles. A gauche, consid�rons un ensemble de donn�es de deux cat�gories, toutes ces donn�es peuvent ou partiellement artificielle. Ensemble de donn�es a deux rouge et le bleu, le bleu et le nombre de pixels dans l'image, cela est sup�rieur � 0 et est un nombre impair, un nombre quelconque de pixels plus grand que l'image de la propri�t� de la cat�gorie rouge 0.

Si vous avez vraiment de dessiner ces diff�rents domaines de la prise de d�cision, vous pouvez voir les pixels bleus dans la cat�gorie bizarre a deux quadrants dans l'avion, ou m�me deux quarts de cercle oppos�s. Donc, il n'y a aucun moyen de tracer une ligne droite � une division distincte du bleu et rouge, c'est le sort d'un classificateur lin�aire.

D'autres cas difficiles � r�soudre classificateur lin�aire est un probl�me multi-classification. Du c�t� droit, il peut �tre pr�sent dans la cat�gorie bleue trois quarts de cercle diff�rents, et tous les autres sont une autre cat�gorie. Donc, pour quelque chose comme les chevaux vus dans les exemples pr�c�dents, bien s�r, il y aura des cas dans la r�alit�, dans les chevaux de l'espace de pixels, il peut sembler une t�te � gauche, une autre t�te regardant vers la droite. Il n'y a pas de bonne fa�on de tracer une limites lin�aires entre ces deux cat�gories.

Lorsque plusieurs donn�es de modalit�, qui est o� le classificateur lin�aire peut avoir des difficult�s.

Il y a beaucoup de classificateur lin�aire de probl�mes, mais il est un algorithme super simple, facile � utiliser et � comprendre.

(Fin)

Route de la soie

Apprenez � conna�tre la Chine

Li Feifei Pr�sident de l'Universit� de Stanford notes de cours CS231n: K & lin�aire classification du plus proche voisin