[New Ji-won EXAMEN Gr�ce � un code d�taill�, comment installer PyTorch depuis le d�but, �tape par �tape, pour diriger le lecteur est familier avec ordinateur portable PyTorch et Jupyter, l'utilisation finale PyTorch r�aliser une r�gression lin�aire, la r�gression logistique et la classification d'image, tr�s appropri� pour les d�butants 0 base.

Effectuer un classement d'images par r�gression logistique de PyTorch

MNIST donn�es num�riques manuscrites r�dig�es � partir de la base de donn�es. 28px composition de l'image en niveaux de gris et une �tiquette qui multiplie chaque images de chiffres manuscrits (0 � 9) de 28px.

Pr�sentation de la torche, et torchvision MNIST

Rechercher lengh:

Cet ensemble de donn�es a 60.000 images peuvent �tre utilis�es pour former le mod�le. Il y a une s�rie de tests suppl�mentaires de 10.000 images peuvent �tre cr��es par le passage du train = False � la classe MNIST.

L'image est une classe PIL.Image.Image d'objet, l'image 28x28 et les tags. PIL est la Python Imaging Library Pillow.

Nous pouvons utiliser des images de vue matplotlib Jupyter dans, Matplotlib Python est le fait que les donn�es scientifiques de tra�age et biblioth�que graphique.

Regardez l'ensemble des donn�es de quelques images:

En plus du matplotlib d'importation, a �galement ajout� une d�claration sp�ciale% en ligne de matplotlib, dit Jupyter pour dessiner des graphiques pour ordinateur portable.

Sans cette d�claration, alors, l'image Jupyter sera affich� dans une fen�tre pop-up. % Au d�but de l'instruction appel�e commande magique IPython pour configurer le comportement Jupyter lui-m�me.

PyTorch pas directement sur l'image, vous devez convertir l'image en un tenseur.

ensemble de donn�es PyTorch nous permet de d�finir une ou plusieurs fonctions de conversion qui sont appliqu�es � l'image au moment du chargement.

torchvision.transforms contient beaucoup de cette fonction pr�d�finie, nous utiliserons la transformation ToTensor convertit l'image en PyTorchtensor.

Maintenant, l'image est convertie en tenseur 1x28x28. Une premi�re dimension de canal de couleur pour le suivi. Etant donn� que l'ensemble de donn�es d'image est MNIST niveau de gris, de sorte qu'un seul canal. D'autres ensembles de donn�es ont des images en couleur, il y a trois canaux dans ce cas: le rouge, le vert et le bleu (RVB).

Le regard de d�posons sur quelques exemples de valeurs dans le tenseur:

0 repr�sente le noir et blanc pour 1, les valeurs interm�diaires repr�sentent les diff�rentes nuances de gris. Ah, vous pouvez �galement utiliser plt.imshow le tenseur dessin� sous forme d'images.

S'il vous pla�t noter que nous devons transf�rer � la plt.imshow matrice 28x28, sans la n�cessit� de la taille du canal.

Nous avons �galement adopt� une cartographie couleur (CMAP = � gris �), des moyens que nous voulons voir l'image en �chelle de gris.

Formation et validation des ensembles de donn�es

Lors de la construction d'une machine dans le monde r�el des mod�les d'apprentissage, l'ensemble de donn�es est divis� en trois parties est tr�s commun:

Formation ensemble: pour la formation du mod�le, � savoir, le calcul de la perte et le droit d'utiliser une descente de gradient pour ajuster les poids Mod�le

Kit de validation: utilis� pour �valuer au cours de mod�le de formation, les param�tres ultra-r�glage (taux d'apprentissage, etc.) et choisir la meilleure version du mod�le

La pr�cision finale utilis�e pour comparer diff�rents mod�les ou diff�rents types de m�thodes de mod�lisation et le mod�le de reporting: L'ensemble de test

Dans ensemble de donn�es MNIST, il y a 60000 � 10000 images de formation et des images de test. Ensemble de test est standardis� afin que les diff�rents chercheurs rapportent les r�sultats pour le m�me ensemble d'images de ses mod�les.

Parce qu'il n'y a pas d'ensemble pr�d�fini de validation, il faut manuellement 60000 images divis�s en ensembles de donn�es de formation et de validation

D�finissons une fonction qui s�lectionne au hasard une partie donn�e de l'ensemble de validation d'images.

split_indices index de tableau m�lang�es au hasard 0,1, ... n-1, et la s�paration de la partie souhait�e de l'ensemble de validation.

Avant de cr�er un ensemble de validation est tr�s important pour la lecture al�atoire d'index, parce que les images de formation sont g�n�ralement class�s par l'image de l'�tiquette cible est 0 et 1 de l'image est ensuite suivie par image 2 s, et ainsi de suite.

Si nous choisissons de seulement 20% de l'ensemble de validation en choisissant les derniers 20% des images, l'ensemble de validation comprendra que 8s et 9s de l'image, tout ensemble de formation ne contiendra pas 8s et 9s de l'image, il est donc impossible de former un bon mod�le.

Nous ajustons au hasard l'index et s�lectionnez une petite partie (20%) comme un ensemble de validation.

Vous pouvez maintenant cr�er PyTorch utiliser SubsetRandomSampler pour chaque chargeur de donn�es, �l�ments d'�chantillonnage al�atoire SubsetRandomSampler d'une liste d'index donn�, tout en cr�ant des donn�es par lots.

mod�le

Maintenant, nous sommes pr�ts chargeur de donn�es, nous pouvons d�finir notre mod�le.

Mod�le de r�gression logistique avec presque le m�me mod�le de r�gression lin�aire, � savoir la pr�sence des poids et des matrices de polarisation, et l'utilisation de simples op�rations de matrice (pred = x @ w.t () + b) pour obtenir un signal de sortie
Tout comme nous utilisons la r�gression lin�aire, on peut utiliser nn.Linear pour cr�er des mod�les plut�t que de d�finir manuellement et initialiser la matrice
Depuis nn.Linear souhaitable est un tenseur pour chaque �chantillon de formation, de sorte que chaque tenseur 1x28x28 image avant d'�tre livr� au mod�le doit �tre aplati dans une taille de 784 (28 * 28) du tenseur
La sortie de chaque image est la taille du tenseur 10, chaque �l�ment tenseur repr�sente la probabilit� qu'une marque cible particulier (par exemple, de 0 � 9) de la. Pr�dites juste une image de l'�tiquette avec la plus grande �tiquette de probabilit�

Nous examinons les poids et les pr�jug�s

Bien que nos param�tres de volume programm� quantit� de 7850, mais l'id�e g�n�rale est similaire. Nos ensemble de donn�es, et obtenir le premier lot, il contient 100 images, le transfert au mod�le.

Ensuite, diriger la sortie de l'erreur. En raison de la forme de nos donn�es d'entr�e est incorrecte. Notre forme d'image 1x28x28, mais nous en avons besoin d'�tre 784 vecteur.

Que nous avons besoin, � Zhanping. � Nous utiliserons un tenseur de .reshape m�thode, qui nous permettra de mani�re efficace � voir � chaque plan d'image comme vecteur, sans modifier les donn�es sous-jacentes.

Pour inclure cette fonctionnalit� suppl�mentaire dans notre mod�le, nous devons d�finir un mod�le personnalis� en �tendant la classe nn.Module de PyTorch.

Dans __init__ m�thode constructeur, nous utilisons l'exemple de poids nn.Linear et parti pris.

m�thode appel�e avant lorsque nous avons adopt� un certain nombre d'entr�es au mod�le, nous allons entrer dans le tenseur aplatir, puis passer � self.linear.

xb.reshape (-1,28 * 28) � PyTorch sp�cifi�, nous voulons voir xbtensor ayant deux dimensions, o� la longueur le long de la seconde dimension est de 28 * 28 (� savoir, 784).

.Reshape un param�tre peut �tre r�gl� � -1 (dans ce cas, la premi�re dimension), de sorte PyTorch calcul� automatiquement en fonction de la forme du tenseur d'origine.

Notez que le mod�le et ne pas avoir les attributs .weight de .BIAS (car ils sont dans des propri�t�s .lin�aire), mais il a une m�thode .parameters qui retourne une liste des poids et biais et peuvent �tre utilis�s optimiseur PyTorch.

Notre nouveau peut �tre utilis� comme mod�le personnalis� avant. Voyons voir si elle est valide.

Pour chaque image d'entr�e 100, nous obtenons 10 sorties, pour chaque cat�gorie a. Comme mentionn� pr�c�demment, nous esp�rons que ces r�sultats ont repr�sente la probabilit�, mais cette fin, chaque �l�ment des lignes de sortie doit �tre comprise entre 1 et ajouter entre 0-1, c'est clairement pas le cas ici.

Pour convertir la ligne de sortie probabilit�, nous utilisons la fonction softmax, qui a la formule suivante:

Tout d'abord, par la somme de tous les �l�ments pour veiller � ce qu'ils ajoutent � celui que nous allons lignes de sortie chaque �l�ment est remplac� yi e ^ yi, de sorte que tous les �l�ments sont positifs, nous chaque �l�ment.

Bien qu'il soit facile de r�aliser la fonction softmax, nous utiliserons pour obtenir PyTorch fourni, car il applique tenseur multidimensionnel (la ligne de sortie de la liste dans notre exemple).

softmax torch.nn.functional fonction incluse dans le paquet, et exige que nous devons appliquer la dimension sp�cifi�e de softmax.

Enfin, nous pouvons simplement s�lectionner un index pour chaque ligne d'�l�ments de sortie avec la plus forte probabilit� pour d�terminer l'�tiquette pr�vue de chaque image.

Cela se fait � l'aide torch.max, elle renvoie l'index du plus grand �l�ment et les �l�ments les plus long d'une dimension particuli�re du tenseur.

L'impression num�rique est au-dessus de la premi�re �tiquette de pr�diction des images de formation. Nous les comparer avec l'�tiquette r�elle.

De toute �vidence, les pr�visions et l'�tiquette de l'�tiquette r�elle est compl�tement diff�rent. En effet, nous avons commenc� � utiliser des poids et des biais au hasard initialis�s.

Nous devons former le mod�le, qui est, � l'aide d'une descente de gradient ajuster les poids pour faire de meilleures pr�dictions.

�valuer et mesurer la perte de la fonction

Comme avec la r�gression lin�aire, nous avons besoin d'une m�thode pour �valuer la mise en uvre du mod�le. Une fa�on naturelle est de trouver le pourcentage de l'�tiquette de pr�dictions correctes, que la pr�cision de la pr�diction.

== op�rateur effectue un �l�ment par deux tenseur de comparaison ayant la m�me forme, le tenseur de m�me forme et les rendements pour l'�l�ment in�gale contient 0, 1 pour les �l�ments �quivalents contiennent.

Le r�sultat est transmis � des rendements de torch.sum le nombre d'�tiquettes correctement pr�dit. Enfin, nous avons divis� par le nombre total d'images pour obtenir une pr�cision.

Laissez-nous d'abord calculer la pr�cision des donn�es du mod�le actuel. De toute �vidence, nous nous attendons � ce sera tr�s mauvais.

Bien que la pr�cision est une bonne fa�on que nous (les humains) mod�le d'�valuation, mais il ne peut pas �tre utilis� fonction de perte en utilisant le mod�le d'optimisation de descente de gradient pour les raisons suivantes:

Ce n'est pas une caract�ristique distincte. == torch.max et sont non-fonctionnement continu et non diff�rentiable, donc on ne peut pas utiliser la pr�cision de calcul du poids et du gradient de l'�cart

Il ne consid�re pas le mod�le de probabilit� r�elle de pr�dire, et ne peut donc pas fournir suffisamment de r�troaction � des am�liorations suppl�mentaires

Pour ces raisons, l'exactitude de l'�valuation est un bon indicateur de classement, mais pas une bonne fonction de perte. Le classement est couramment utilis� fonction de perte d'entropie crois�e, qui a la formule suivante:

Bien qu'il semble compliqu�, mais en fait, il est tr�s simple:

Pour chaque ligne de sortie, le pr�dit la probabilit� de s�lection de la bonne �tiquette. Par exemple. Si la probabilit� pr�dite de l'image est et que l'�tiquette correcte est 1, nous s�lectionnons les �l�ments appropri�s 0,3 et ignorer le reste du
Puis, en prenant le nombre de la probabilit� s�lectionn�e. Si la probabilit� est �lev�e, qui est proche de 1, son nombre est tr�s faible valeur n�gative, proche de z�ro. Si la probabilit� est faible (proche de 0), le nombre est tr�s grande valeur de n�gatif. Nous allons �galement r�sultat multipli� par -1, le r�sultat est un grand facteur pr�dictif positif de perte d�favorable du dernier pour obtenir l'entropie crois�e moyenne de toutes les lignes de sortie pour obtenir une perte globale de donn�es par lots

Et la pr�cision des diff�rents entropie crois�e est une fonction continue et d�rivable, il fournit �galement une bonne r�troaction dans le mod�le d'am�lioration progressive (conduit d'�tiquetage propres � une faible probabilit� de perte est l�g�rement plus �lev�). Cela en fait un bon choix pour la perte de la fonction.

PyTorch fournir un tenseur efficace et facile � atteindre l'entropie crois�e, dans le cadre de torch.nn.functionalpackage.

De plus, il effectue �galement SOFTMAX en interne, afin que nous puissions exporter le mod�le pass� directement sans les convertir en probabilit�s.

Etant donn� que l'entropie crois�e est la moyenne de la probabilit� pr�dite de logarithme n�gatif correcte de l'�tiquette, de sorte que l'explication des r�sultats sur le nombre d'�chantillons de formation pour toutes les m�thodes, par exemple un 2,23 e ^ -2,23, valeur moyenne d'environ 0,1, comme pr�vu �tiquette correcte probabilit�. R�duire les pertes et am�liorer le mod�le.

optimisation

Nous utiliserons optimiseur optim.SGD lors de la mise � jour la formation des poids et des biais, mais des taux plus �lev�s d'apprentissage, 1E-3.

la taille des lots, le taux d'apprentissage et d'autres param�tres n�cessaires pour s�lectionner l'avance dans les mod�les d'apprentissage de la machine de formation et de super appel�s param�tres.

Le choix des bons param�tres pour le mod�le ultra-pr�cis de la formation est essentielle dans un d�lai raisonnable, et est un domaine de recherche et d'exp�rimentation. Ne h�sitez pas � essayer diff�rents taux d'apprentissage et de voir comment il affecte le processus de formation.

entra�neur

Maintenant que nous avons d�fini le chargeur de donn�es, le mod�le, la perte de fonction et optimiseur, nous sommes pr�ts � former le mod�le.

processus de formation est presque la m�me r�gression lin�aire. Cependant, nous augmenterons la fonction d'ajustement, nous avons d�fini plus haut, � utiliser � la fin de chaque jeu de validation d'�poque pour �valuer le mod�le de pr�cision et de la perte.

Nous d�finissons d'abord une fonction loss_batch:

Calcul de la perte d'un certain nombre de donn�es
Si un optimiseur, vous pouvez choisir d'effectuer l'�tape de mise � jour de descente de gradient
En variante, en utilisant la m�trique est calcul�e cible pr�dite et r�elle (par exemple, la pr�cision)

Optimizer est un param�tre optionnel pour assurer que nous pouvons r�utiliser loss_batch pour calculer la perte sur l'ensemble de validation.

Nous avons �galement le traitement par lots en raison de la longueur de la partie de retour, car il est tr�s utile compositions / m�trique qui la perte de l'ensemble des donn�es.

Ensuite, nous d�finissons une fonction d'�valuer, v�rifier qu'il calcule l'ensemble global de perte.

Si vous ne pouvez pas comprendre le r�le de cette fonction imm�diatement, essayez d'ex�cuter chaque instruction dans une cellule s�par�e, puis voir les r�sultats.

Nous devons �galement d�finir la pr�cision de l'ensemble des op�rations par lots afin de diriger la sortie, afin que nous puissions �tre utilis� comme une mesure d'ajustement.

S'il vous pla�t noter que nous ne devons SOFTMAX appliqu�e � la sortie, parce que l'ordre relatif des r�sultats, il ne change pas.

En effet, e ^ x est une fonction croissante, qui est, si y1 > �y2, alors e ^ y1 > �e ^ y2, et la m�me chose est vraie de la valeur apr�s le calcul de la moyenne pour obtenir un softmax.

Voyons voir comment le mod�le en utilisant les poids initiaux et jeu de polarisation � effectuer sur l'ensemble de validation.

Pr�cision initiale inf�rieure � 10%, ce qui est des attentes de la population du mod�le d'initialisation al�atoire (car il a une chance d'obtenir un dixi�me de l'�tiquette par une estimation al�atoire).

S'il vous pla�t noter �galement que nous utilisons .format m�thodes et les cha�nes de message pour imprimer seulement les quatre premiers chiffres apr�s la virgule.

Nous pouvons maintenant d�finir loss_batch facilement et d'�valuer la fonction d'ajustement.

Nous sommes maintenant pr�ts � former le mod�le. Formons cinq �poque et d'observer les r�sultats.

Eh bien! Plus au point eploch

ligne d'affichage plus intuitif aux r�sultats de la figure.

Il ressort clairement de l'image ci-dessus, m�me apr�s une tr�s longue p�riode de formation, le mod�le ne peut pas �tre plus de 90% seuil de pr�cision.

Une raison possible est que le taux d'apprentissage peut �tre trop �lev�. Les param�tres du mod�le peuvent �tre autour du param�tre optimal d�fini avec la plus faible perte de � rebond �.

Vous pouvez essayer de r�duire la vitesse d'apprentissage et de formation plusieurs �poque, pour voir si �a aide.

La raison la plus probable est que le mod�le est pas assez fort. Si vous vous rappelez notre hypoth�se de d�part, nous supposons que la sortie (dans cette classe probabilit� cas) sont entr�s (intensit� de pixel) de la fonction lin�aire de la matrice de poids en effectuant la multiplication de la matrice et en ajoutant l'�cart obtenu.

Ceci est une hypoth�se assez faible, il ne peut pas exister en r�alit� comme une relation lin�aire entre le pixel et une image d'intensit� num�rique, il repr�sente.

Bien qu'il soit pour des ensembles de donn�es simples comme MNIST (afin que nous puissions atteindre 85% de pr�cision) fonctionnent tr�s bien, mais nous avons besoin de mod�les plus complexes pour saisir la relation non lin�aire entre les pixels d'image et des �tiquettes pour identifier les objets de tous les jours, animaux de t�ches complexes.

En utilisant une image test unique

Bien que jusqu'� pr�sent, nous avons suivi la pr�cision globale du mod�le, mais le mod�le consid�rons quelques exemples d'images sur le r�sultat est une bonne id�e.

Utilisons le test pr�d�fini 10.000 images de quelques-uns de l'ensemble de donn�es d'image pour tester nos mod�les. Nous utilisons d'abord ToTensor transformer pour recr�er l'ensemble de donn�es de test.

�chantillon seul ensemble de donn�es d'image:

D�finissons une fonction d'aide predict_image, qui retourne un tenseur d'�tiquette de pr�diction d'image.

img.unsqueeze juste ajouter le montant au d�but de 1x28x28 Zhang une autre dimension, ce qui en fait 1x1x28x28 mod�le tenseur comme un lot contenant une seule image.

En recueillant davantage de donn�es de formation, augmenter / diminuer la complexit� des param�tres du mod�le et passer � d�terminer la mauvaise performance de notre mod�le peut nous aider � am�liorer la position du mod�le.

Enfin, penchons-nous sur l'ensemble de test global de perte sur le mod�le et la pr�cision.

Nous esp�rons que la pr�cision sur l'ensemble de validation / pertes similaires. Sinon, nous devrons peut-�tre un meilleur ensemble de validation, qui a un ensemble similaire de donn�es de test et de la distribution (g�n�ralement � partir des donn�es du monde r�el).

mod�le Sauvegarde et chargement

�tant donn� que nous avons beaucoup de temps pour former le mod�le et obtenir une pr�cision raisonnable, �conomisant ainsi des matrices de poids et de biais sur le disque est une bonne id�e, pour que nous puissions mod�le plus tard r�utilisation � partir de z�ro et �viter le recyclage. Voici comment enregistrer le mod�le.

Proc�d� de .state_dict renvoie un OrderedDict, dans lequel le mod�le contient un mappage vers la droite sur les propri�t�s de tous les poids et la matrice de polarisation.

Pour charger le poids du mod�le, nous pouvons instancier une nouvelle classe d'objets MnistModel et utiliser .load_state_dict m�thode.

En tant que contr�le d'int�grit�, comme, laissez-nous v�rifier que ce mod�le a le m�me qu'avant et la perte de pr�cision sur l'ensemble de test.

D'accord. Il est fait. Il est all� � engager notre part. Si vous avez oubli� comment faire fonctionner:

Les liens de r�f�rence:

https://medium.com/jovian-io/pytorch-basics-tensors-and-gradients-eb2f6e8a6eee

https://medium.com/jovian-io/linear-regression-with-pytorch-3dde91d60b50

https://medium.com/jovian-io/image-classification-using-logistic-regression-in-pytorch-ebb96cc9eb79

[2019 Ji-won nouveau compte � rebours au sommet de la technologie AI 16 jours]

201927 Mars le nouveau-won Ji et le D�partement de pouvoir AI, AI tenue � Beijing Pacific festival --2019 nouveau h�tel a ouvert en Ji-won Summit AI Technology. Sommet des " noyau nuage intelligente du monde � Le th�me, mise au point et de d�velopper la puce AI nuage intelligent, remodeler l'avenir de la situation mondiale AI.

En m�me temps, un certain nombre de nouveaux Zhi Yuan sera publi� � l'autorit� du site du sommet Livre blanc AI l'innovation mise au point de la cha�ne industrielle active les commentaires influents chercheurs chinois AI, AI aider la Chine � atteindre au-del� de la comp�tition de classe mondiale dans.

Acheter code � deux dimensions

Billets de ligne active lien: 2019 nouveau Sommet AI Zhiyuan Technology - noyau nuage intelligente du monde _ la vie urbaine excitante, tous dans la ligne active! !

Route de la soie

Apprenez � conna�tre la Chine

Apprendre � partir de z�ro PyTorch (bas): r�gression logistique et classification des images

Effectuer un classement d'images par r�gression logistique de PyTorch