Rectifie Perceptron (Perceptron de)

Perceptron (Perceptron) est une classification de seconde classe mod�le de classification lin�aire, qui est un exemple du vecteur de caract�ristique d'entr�e, la sortie des instances de la classe, en prenant des valeurs de +1 et -1 deux. Perceptron dans l'espace d'entr�e correspondant aux exemples positifs et n�gatifs est divis� en deux mod�le discriminant hyperplan de s�paration appartient. Perceptron apprentissage destin� � obtenir des donn�es de formation pour la s�paration divis�e linear hyperplan, introduit pour cette fonction de perte de classification erron�e sur la base de la minimisation de la fonction de perte en utilisant une m�thode de descente de gradient, on obtient perceptron mod�le. Perceptron algorithme d'apprentissage est simple et facile � r�aliser les avantages de la forme originale et est divis� en double forme. Perceptron est la base du r�seau de neurones et de support vector machine.

Dessiner attention: il est tout simplement un mod�le lin�aire d'une classification dichotomique, perceptron l'apprentissage se fait par l'ensemble de donn�es de formation, obtenu mod�le Perceptron, les param�tres du mod�le qui est requis.

perceptron Mod�le

De l'espace d'entr�e � l'espace de sortie comme une fonction appel�e perceptron:

poids connus w (poids) ou le vecteur de poids, b est appel�e le d�calage (biais).

mod�le principe perceptron: pour chaque poids d'attribut w, du produit des poids et des sommes poids des valeurs d'attribut, cette valeur et une valeur de seuil (0/1) sont compar�s, il peut �tre d�termin� si un travail dans cet exemple, le candidat.
Perceptron interpr�tation g�om�trique: �quations lin�aires repr�sente une g�om�trie de classifieur lin�aire: ligne, plan, hyperplan.

Rn correspondant � l'espace de fonctionnalit� dans un hyperplan S, o� w est le vecteur hyperplan normale , b est l'hyperplan d'interception. L'espace de fonction hyperplane est divis�e en deux parties, deux parties des points situ�s sont divis�s en types positifs et n�gatifs. Ainsi, un hyperplan de s�paration hyperplan est appel� S (s�paration des hyperplans).

Lei Feng r�seau REMARQUE: Par exemple, dans le cas d'un plan � deux dimensions, la limite est une ligne droite, y = WTX, la valeur limite correspondante y est �gal � 0, ce cas est pour cette ligne, la ligne de division est proc�d� W vecteur.

Perceptron est une �tude rapide, et pourquoi il est rectifie?

1. En supposant que les ensembles lin�airement s�parables de donn�es cible d'apprentissage perceptif est d'obtenir un ensemble d'apprentissage peuvent �tre des exemples positifs et n�gatifs Exemples de points s�par�s compl�tement correct points hyperplan. Pour trouver l'hyperplan, � savoir la d�termination perceptron param�tres du mod�le w, b, une strat�gie d'apprentissage est d�termin�e, � savoir la d�finition de (exp�rience) fonction de perte et de minimiser la fonction de perte.

Une fonction de perte de la s�lection naturelle est le nombre total de points mal class�s, mais pas la fonction de perte w, b est continuellement fonction diff�rentiables, l'optimisation est pas facile. Une autre option est la fonction de perte pour calculer les points distance totale hyperplan mal class�s. l'entr�e de bit de X0X0 � la distance spatiale S hyperplan dans un quelconque de:

De tout point � l'hyperplan

Perte de signe d�finition de la fonction Perceptron (w.x + b) apprendre � (focus):

Fonction de perte

Une perte de fonction de l'�chantillon particulier, les erreurs de classification lorsque la fonction est une fonction lin�aire de w et b, et est �gal � 0 lorsqu'il est correctement class�, de sorte que lorsque la fonction de perte w et b en continu fonction diff�rentiable.

Plan cl�: strat�gie d'apprentissage Perceptron est l'hypoth�se que la perte d'espace fonction s�lectionn�e smallest param�tres du mod�le de Perceptron w et b, qui est, le mod�le Perceptron.

2. algorithme d'apprentissage Perceptron dans la r�solution des probl�mes d'optimisation Perceptron fonction de perte, l'optimisation de la m�thode est une m�thode de descente de gradient stochastique.

algorithme d'apprentissage:

Entr�e: donn�es d'apprentissage T, le taux d'apprentissage

Sortie: w, b; perceptron mod�le f (x) = signe (+ w.x b)

(1) s�lectionner la valeur initiale w0, b0

(2) mise au point sur les donn�es d'apprentissage pour s�lectionner (xi, yi)

(3) Si yi (w.xi + b) (4) Allez � (2), jusqu'� ce qu'il n'y a pas de point de consigne de formation mal class�s (mauvaise classification r�p�tera point a �t� mis � jour)

S�lectionnez une w0 hyperplane, b0w0, b0, puis en utilisant une m�thode de descente de gradient pour minimiser la fonction objectif en continu

pente

Classification erron�e d'un point s�lectionn� de fa�on al�atoire (xi, yi) (xi, yi), de w, b est mise � jour:

O� est la taille de pas, aussi connu comme le taux d'apprentissage. Une telle fonction it�rative de perte attendue L (w, b) diminue de fa�on continue jusqu'� ce que 0.

Cet algorithme d'apprentissage d'explication intuitive: quand une instance de classe de mani�re erron�e class�, � savoir, sur le mauvais c�t� de l'hyperplan de s�paration, la valeur d'ajustement w, b de la partie mobile de l'hyperplan de s�paration � un point de tri, afin de r�duire la classification erron�e du point � l'hyperplan, l'hyperplan jusqu'apr�s le point qu'il est class� par erreur correctement class�.

Dans un premier temps, juste un peu, les deux premiers fils de m�me type � savoir le vecteur normal pour obtenir un classement initial en tant que plan vertical (ligne)

Initiale (Source: cours National Taiwan University Professeur Lin)

Lorsqu'une erreur est d�tect�e, la correction par le d�but de la rotation, �tre tri�s optimis�

jusqu'� ce qu'il ne cesse de tester des erreurs

enfin

Mais l'algorithme PLA vraiment arr�ter?

Examiner deux cas: les donn�es lin�airement s�parables, les donn�es lin�airement ins�parable

Remarque PLA condition d'arr�t est que toutes les donn�es classifi�es sont correctes, les donn�es sont clairement pas le temps PLA lin�aire peut pas �tre arr�t�, alors nous pouvons utiliser l'algorithme Pocket utilisant trouver avide une bonne id�e.

donn�es lin�airement s�parables:

Il doit �tre parfait w (appel� Wf), de sorte que tous (xi, yi), yi = signe (* wf xi) trouv�:

Les �l�ments suivants se sont r�v�l�s �tre des donn�es en temps lin�aire, simple perceptron algorithme converge. (Ceci est selon la d�finition Lin, je me sens relativement clair, vous pouvez voir un chapitre d�taill� � m�thode d'apprentissage statistique �)

Cosinus de l'angle et de la quantit� de vecteur est non sup�rieur � 1, la valeur de T se trouve limit�e. T = 1, � savoir, 1 volume des deux vecteurs co�ncide avec le vecteur, nous avons prouv� algorithme de simples PLA peut ainsi converger.

Donn�es lin�aire ins�parables:

Algorithme de poche Lorsque les donn�es n'est pas lin�aire en temps partag� (pr�sence de bruit), un algorithme simple PLA ne peut �videmment pas converger. Nous devons discuter comment obtenir des r�sultats similaires. Nous voulons faire le droit dans la mesure du possible, tous les r�sultats, � savoir:

Wg est � la recherche d'un probl�me NP-dur! trouver que des solutions approximatives. L'algorithme est le suivant:

Algorithme Pocket

La diff�rence entre l'APL et simple: un nombre limit� d'it�rations (d�finie � l'avance), l'erreur al�atoire de trouver des points de donn�es (au lieu de bouclage), que lorsque le meilleur wg nouvellement acquis w obtenir encore mieux qu'avant, est mis � jour wg (je me r�f�re ici aux bons points en moins d'erreurs). En raison de la comparaison avec les pr�c�dents taux d'erreur est calcul� apr�s wg w pour d�cider de la mise � jour wg, de sorte que l'algorithme de poche pour �tre moins efficace que la m�thode simple de PLA.

r�f�rence:

� M�thodes d'apprentissage statistique � Chapitre II � pierre angulaire de l'apprentissage de la machine � de l'Universit� nationale de Taiwan, 8, 9

Lei Feng r�seau (num�ro public: Lei Feng net) Lecture connexe:

Machine Tongguo � partir de z�ro pour obtenir un mod�le de perception, j'ai appris ces

� partir de concepts math�matiques, l'article vous emm�ne � comprendre ce qui est Perceptron

Route de la soie