algorithmes d'apprentissage machine exigent des tests au hasard combien de fois, juste assez pour refl�ter objectivement la performance efficace du mod�le?

Lei Note du r�seau Feng: L'auteur est australien Jason Brownlee bien connu des experts en mati�re d'apprentissage de la machine, la pr�vision des s�ries chronologiques, ont surtout l'exp�rience. D'origine �ditent leurs blog. Lei Feng r�seau compil�.

Jason Brownlee

Il existe de nombreux algorithmes d'apprentissage automatique al�atoire m�me probl�me: le m�me algorithme, les m�mes donn�es pour calculer le r�sultat �tait diff�rent � chaque fois. Cela signifie que lors d'un algorithme de test al�atoire ou un algorithme de comparaison lorsque le test doit �tre r�p�t� plusieurs fois, puis les utiliser pour �valuer le mod�le moyen.

Donc, pour un probl�me donn�, algorithmes d'apprentissage machine exigent des tests au hasard combien de fois, juste assez pour refl�ter objectivement la performance efficace du mod�le?

Recommandations g�n�rales sur r�p�t�es 30 fois ou m�me 100 fois. Certains des milliers de fois, m�me r�p�t�e, au m�pris total de la diminution d'effet marginal.

Pour les mesurer algorithmes d'apprentissage machine al�atoire requis performance des tests de r�p�titions, dans ce tutoriel, je vais vous apprendre � utiliser des m�thodes statistiques pour estimer correctement.

Pr�sentation du didacticiel

Ce tutoriel divis� en quatre parties:

g�n�ration de donn�es

Analyse fondamentale

Analyse de l'impact des r�p�titions

calcul d'erreur standard

Ce tutoriel utilise le langage Python, la version 2 ou 3 peuvent �tre, pour une marche silencieuse le code exemple, veillez � installer SciPy, NumPy, Pandas et biblioth�que Matplotlib.

nous avons commenc� ici tutoriel

1. Les donn�es g�n�r�es

La premi�re �tape consiste � g�n�rer les donn�es disponibles.

On suppose un r�seau de neurones ou un autre algorithme al�atoire sur l'ensemble d'apprentissage de donn�es d'apprentissage est r�p�t�e 1000 fois, et le mod�le de racine d'erreur quadratique moyenne enregistr�e sur l'appareil d'essai (RMSE). En tant que condition sine qua non pour la suite tutoriel d'analyse, nous supposons une distribution normale utilis�e.

Assurez-vous de regarder les mod�les de distribution des r�sultats, les r�sultats g�n�ralement gaussienne (c.-�-normal).

Nous �tudierons pr�g�n�r�s par la population �chantillon, faire des �tudes de suivi est tr�s utile, parce que le programme a g�n�r� l'�chantillon global �cart moyen et standard sur sa finalisation, mais cela est souvent inconnue dans l'application pratique.

Nous entendons = 60, �cart type = 10 g�n�re des donn�es de test en tant que param�tres.

Le code suivant est g�n�r� 1000 nombres al�atoires, le r�sultat est sauvegard� le fichier results.csv.

Nous utilisons le code en fonction de semences de graines de g�n�rateur de nombres al�atoires pour assurer que chaque code est compatible avec les donn�es obtenues terme. Utilisez la fonction de g�n�ration de nombres al�atoires normal normal, la fonction pour enregistrer les donn�es au format ASCII savetxt.

Apr�s l'ex�cution de ce code, nous obtenons un fichier nomm� results.csv de, qui d�tient 1.000 nombres al�atoires qui repr�sentent les r�sultats de la simulation d'algorithmes randomis�s ex�cuter de fa�on r�p�titive.

Voici les 10 derni�res lignes des donn�es de fichiers.

6.160564991742511864e + 01

5.879850024371251038e + 01

6.385602292344325548e + 01

6.718290735754342791e + 01

7.291188902850875309e + 01

5.883555851728335995e + 01

3.722702003339634302e + 01

5.930375460544870947e + 01

6.353870426882840405e + 01

5.813044983467250404e + 01

Maintenant, nous allons mettre ces donn�es comment faire avancer les choses de c�t�, proc�der vers le bas.

2. Analyse fondamentale

Apr�s avoir obtenu l'ensemble de l'�chantillon, nous allons �tre simple analyse statistique.

Les trois suivants sont tr�s moyen simple et efficace:

Calculer les statistiques telles que la moyenne, �cart-type, et percentiles.

Dessin boxplot pour voir l'�tendue des donn�es de propagation

Dessiner un histogramme pour afficher la distribution des donn�es

Une simple analyse statistique r�alis�e par le code suivant, le premier fichier de donn�es results.csv de charge, et les calculs statistiques, et l'affichage de dessin.

Comme on peut le voir, la performance moyenne de l'algorithme est d'environ 60,3, �cart-type d'environ 9,8.

Supposer que les donn�es repr�sentent l'erreur quadratique moyenne comme �tant similaire � la valeur minimale, les r�sultats statistiques, la valeur maximale est de 99,5 et la valeur minimum est de 29,4.

Le tableau suivant montre le cas, le degr� de dispersion des donn�es, dans lequel les donn�es sont portion en forme de bo�te (environ 50% de l'�chantillon) (en haut � quartile inf�rieur) point milieu �chantillon repr�sente la valeur anormale, la ligne verte repr�sente la m�diane .

La figure montre que les r�sultats raisonnables dans la distribution de valeur autour.

La derni�re g�n�ration des donn�es d'histogramme, la figure montre une courbe en cloche de distribution normale (courbe en cloche), cela signifie que nous effectuons l'analyse des donn�es, en utilisant des outils d'analyse statistique standard.

La figure montre que les donn�es � un axe de sym�trie 60 sur presque pas de d�viation.

3. Impact du nombre de r�p�titions de l'analyse

Avant 1000 les donn�es g�n�r� de r�sultats. Plus probablement, il peut ne pas �tre suffisant pour l'�tude du probl�me.

Comment juger?

La premi�re id�e est de dessiner un graphique du nombre de r�p�titions entre le test et les r�sultats moyens de ces tests. Nous esp�rons que l'augmentation du nombre de r�p�titions, le r�sultat pourrait signifier une �curie bient�t. Apr�s trac�, il semble commencer les fluctuations du segment et � court et � long partie arri�re en douceur.

En utilisant le code suivant dessine la courbe.

Comme on peut le voir d'apr�s la figure, les 200 premi�res donn�es volatiles moyennes, apr�s 600 heures, la moyenne stable, courbe moins volatile.

Afin de mieux observer les courbes, il est amplifi�, seuls les 500 premiers fois les r�sultats des tests r�p�t�s.

Alors que la ligne se superpose aux r�sultats moyens de 1000, afin de trouver la relation entre l'�cart.

Orange figure 1000 est des r�sultats de test r�p�t� droite ligne moyenne.

En m�me temps, nous avons pu voir r�p�t�es 100 fois, les r�sultats sont plus proches de la moyenne, le nombre de r�p�titions atteint 400, le r�sultat est plus id�al, mais pas �vident.

Est-ce grand? Mais ne sera pas l� une meilleure fa�on de le faire?

4. Calculer l'erreur-type

Erreur type est utilis�e pour calculer la quantit� de l'�chantillon �cart moyen de la moyenne globale. Il est diff�rent et l'�cart-type �cart-type d�crit la variation moyenne de la valeur d'observation de l'�chantillon. Erreur type de la moyenne peut �tre �tal� selon la quantit� d'erreur globale estim�e ou l'erreur de la moyenne �chantillon.

erreur standard peut �tre calcul�e par la formule suivante:

standard_error = sample_standard_deviation / sqrt (nombre de r�p�titions)

� savoir l'�cart type divis� par l'erreur-type d'�chantillons en double est �gal au nombre d'entreprises.

Nous esp�rons que l'erreur-type augmente avec le nombre de tests augmente. Le code suivant, calculer l'erreur type de la moyenne pour chaque �chantillon correspondant au nombre de r�p�titions, les erreurs types et trac�e sur la Fig.

Apr�s avoir ex�cut� cette courbe de code trac�e avec l'erreur standard du nombre de r�p�titions.

Comme pr�vu, la r�p�tition du nombre croissant de tests, l'�cart-type diminue rapidement. Apr�s un �cart-type diminue dans une certaine mesure, stabilis�e, habituellement une valeur de 1 � 2 unit�s, appel�e une erreur acceptable.

des unit�s coh�rentes d'erreur standard et les unit�s de donn�es �chantillon.

Ajouter 0,5 et ordonn�e la ligne auxiliaire 1, pour nous aider � trouver une valeur d'erreur standard acceptable dans la figure ci-dessus. Code est la suivante:

Lei rappeler situation des utilisateurs, deux lignes auxiliaires figurent apparaissent en rouge, ce qui repr�sente l'erreur-type est �gal � 0,5 et 1.

La figure montre, si le test a �t� r�p�t� 100 fois �gal au nombre de fois, �cart-type inf�rieur � 1 commence, si le test de temps �quivalent � 300 � 350 fois, l'�cart type est inf�rieur � 0,5. Avec l'augmentation r�p�t�e du nombre d'essais, l'erreur-type tend � �tre stable, peu de changement. Encore une fois, rappelez-vous, l'erreur-type de l'�chantillon des mesures de d�viation moyenne la quantit� de la moyenne de la population.

Nous pouvons �galement utiliser l'erreur standard de la moyenne comme un intervalle de confiance. Par exemple, avec 95% de la moyenne de la population comme limites sup�rieure et inf�rieure de l'intervalle de confiance. Cette m�thode ne convient que pour l'examen du nombre de r�p�titions est sup�rieur � 20.

Intervalle de confiance est d�fini comme suit:

Exemple moyenne +/- (erreur standard * 1,96)

Le calcul des intervalles de confiance, et l'ajouter au nombre de fois la moyenne �chantillon correspondant d'exp�riences r�p�t�es sous forme de barres d'erreur. Voici le code de calcul.

Figure cr�er l'�chantillon courbe moyenne avec des intervalles de confiance.

Dans lequel les �missions de ligne rouge la moyenne globale (les d�parts didacticiel pour g�n�rer un �cart moyen et standard donn� de l'ensemble, la moyenne g�n�rale est connue), apr�s avoir r�p�t� 1000 fois ou plus, peut �tre remplac� par un �chantillon moyen de la population moyenne.

Les barres d'erreur enroul�s sur la figure la ligne moyenne. Et l'�chantillon moyen exag�r� ou surestim� la moyenne de la population, mais rel�vent de la moyenne globale de l'intervalle de confiance de 95%.

95% intervalle de confiance est effectu�e sens 100 replications, comprenant 95 fois la valeur moyenne globale vraie, aucun comprend en outre 5.

Comme on le voit sur la figure., Comme le nombre de r�p�titions augmente, en raison de l'erreur-type r�duite du goulet d'intervalle de confiance de 95% progressivement.

La figure sup�rieure agrandie, cette tendance est en particulier entre 20 et 200.

Ce code est g�n�r� par l'�chantillon barres moyenne et erreur avec un nombre variable de courbe d'essais. Ce chiffre peut mieux refl�ter l'�cart de l'�chantillon moyenne et la moyenne de la population.

Pour en savoir plus

En fait, � la fois la m�thode d'essai consiste � calculer l'aide d'un algorithme al�atoire et implique tr�s peu de r�f�rences statistiques.

Personnellement, je pense qu'en 1995, le livre de Cohen est la meilleure combinaison des deux:

M�thodes empiriques pour l'intelligence artificielle (m�thode empirique AI), Cohen (Cohen), 1995

Si vous �tes int�ress� je vous recommande vivement ce livre ce tutoriel.

De plus, il y a plusieurs articles sur Wikip�dia peut vous aider �:

erreur type

Intervalle de confiance

r�gle 68-95-99.7

Si vous avez une bonne autre information pertinente, nous pouvons communiquer avec tout le monde dans la section des commentaires. Merci.

r�sum�

Dans ce tutoriel, nous fournissons une r�p�tition de test de choix raisonnable de la m�thode, qui nous permet d'�valuer l'exactitude des algorithmes d'apprentissage machine al�atoires.

Voici plusieurs fa�ons de choisir le nombre de r�p�titions:

Simple et brut directement avec 30.100 ou 1000 fois.
Trac�e par rapport � la moyenne de l'�chantillon et le nombre de r�p�titions, et s�lectionn� en fonction du point d'inflexion.
Les erreurs types et transcrites par rapport au nombre de r�p�titions, et est choisi en fonction du seuil d'erreur.
Par rapport � l'�chantillon Trac�e intervalles de confiance et le nombre de r�p�titions, et s�lectionn� en fonction de la distribution d'erreur.

Route de la soie