fonction commune de la perte et le r�sum� de l'�valuation (avec le code)

Auteur: Dong Wenhui

longueur pr�sente 4500 mots lecture recommand�e 10+ minutes

Cet article r�sume la fonction de perte commune et l'�valuation pour vous.

Remarque: Dans ce d�marquage papier � �crire, l'effet d'affichage ouvert peut �tre obtenu avec une meilleure d�marquage ~

## 1. La fonction de perte:

### 1.1 R�gression:

#### 1. La fonction de co�t quadratique (m�thode des moindres carr�s):

$$ L (Y, f (x)) = \ sum_ {i = 1} ^ n (Y-f (X)) ^ 2 $$

La r�gression utilis�e par la fonction de perte, la r�gression lin�aire, peut �tre obtenue par l'estimation du maximum de vraisemblance (MLE). Calculer une distance entre la valeur pr�dite et la valeur r�elle de la place. Il est plus courant le r�el ** erreur quadratique moyenne (MSE) **:

$$ L (Y, f (x)) = \ frac {1} {m} \ sum_ {i = 1} ^ n (Y-f (X)) ^ 2 $$

#### 2 erreur absolue moyenne (L1) - MAE:

$$ L (Y, f (x)) = \ sum_ {i = 1} ^ n | Y-f (x) | $$

** MAE est la diff�rence entre la valeur cible et la valeur pr�dite La somme des valeurs absolues ** il peut �tre utilis� pour mesurer la distance par rapport � la valeur pr�dite et la valeur r�elle. ** Mais il ne peut �tre donn�, les valeurs pr�dites du mod�le est petite ou grande que la valeur r�elle. **

#### 3 MAE (L1) VS MSE (L2):

* ** Calcul de la MSE est simple, mais il y a plus robuste aux valeurs aberrantes MAE: **

Quand il y a une anomalie dans le point de donn�es, en utilisant le mod�le de calcul de la perte sera au d�triment des erreurs de RMSE au d�triment des autres �chantillons, la direction de r�duction de l'erreur de mise � jour des valeurs aberrantes. Cependant, cela r�duira la performance globale du mod�le.

> Peut-�tre compris intuitivement: Si nous r�duisons l'erreur quadratique moyenne est donn�e uniquement � une valeur pr�dite pour tous les points d'�chantillonnage, cette valeur doit �tre la moyenne de toute la valeur cible. Mais si elle est r�duite MAE, cette valeur sera la m�diane de l'�chantillon cible de tous les points. Il est bien connu pour les valeurs aberrantes, la m�diane est plus robuste que la moyenne, donc aux valeurs aberrantes est MAE plus stable que le MSE.

* ** NN en gradient de mise � jour est toujours le MAE m�me, alors que le MSE est diff�rent **:

Avec un gradient de MSE augmente la perte de la perte, alors qu'il r�duira la perte tend � z�ro.

* ** perte recommandations s�lectionnez: **

* ** MSE: ** Si le point anormal repr�sente une exception tr�s importante dans les affaires et les besoins � d�tecter.

* ** MAE: ** Si seulement les valeurs aberrantes que des donn�es corrompues.

4. Perte Huber ####:

L _ {\ delta} (y, f (x)) = \ left \ {\ begin {array} {ll} {\ frac {1} {2} (YF (x)) ^ {2}} et {\ text {for} | YF (x) | \ leq \ delta} \ {\ delta | YF (x) | - \ frac {1} {2} \ delta ^ {2}} et {\ texte {sinon}} \ end {array} \ right.

perte de Huber est une erreur absolue, mais l'erreur est faible, il devient une erreur quadratique. Lorsque la perte Huber $ Est entre $, ce qui �quivaut � l'erreur quadratique moyenne, tandis que $ $ Et $ Lorsque le $ est MAE.

### 1.2 Classification:

1. LogLoss ####:

J (\ theta) = - \ frac {1} {m} \ sum_ {i = 1} ^ {m} \ left

** dichotomique ** fonction de perte de t�che couramment utilis�e dans le LR, obtenu par la fonction log-vraisemblance prend. Autrement dit, ** entropie crois�e ** Fonction de perte.

2. Indice fonction de #### perte:

$$ L (y, f (x)) = \ frac {1} {m} \ sum_ {i = 1} ^ n {exp } $$

fonction de perte utilis�e dans AdaBoost dans.

## 2. �valuation:

Comment �valuer le mod�le d'algorithme d'apprentissage de la machine est tout projet une partie tr�s importante. Classification choisissent g�n�ralement la pr�cision (Pr�cision) ou de l'ASC en tant que mesure, les probl�mes de r�gression en utilisant MSE, mais ces indicateurs ne suffit pas de juger de la qualit� d'un mod�le, ce qui suit, je vais inclure l'�valuation individuelle possible. La plupart des fonctions ci-dessus de la perte peut �tre directement utilis� comme un indice d'�valuation �tait apparu bri�vement ci-dessus.

### 2.1 r�gression:

. ** 1 MAE:

** L'erreur absolue moyenne (moyenne d'erreur absolue), la plage $

Route de la soie

Apprenez � conna�tre la Chine

fonction commune de la perte et le r�sum� de l'�valuation (avec le code)