th�se 2306 Les mots, lorsque l'apprentissage tout au long attendu 5 minute

Pour les mod�les d'apprentissage de la machine, le pire dans les deux cas, rien de plus que de construire des connaissances inutiles, de l'ensemble des donn�es de formation ou rien. Dans la th�orie de l'apprentissage machine, ces deux ph�nom�nes sont appel�s surajustement et moins en forme, est des solutions d'apprentissage en profondeur modernes dans deux grands d�fis.

Etude approfondie de surajustement que les gens ont cr�� l'illusion doit commencer algorithme d'inf�rence n'existe pas dans les ensembles de donn�es en mode g�n�r�s; underfitting est plus comme des difficult�s d'apprentissage, emp�cher les gens d'acqu�rir des connaissances pour accomplir une t�che donn�e.

Bien que surajustement est tr�s important, mais il est difficile de r�soudre ce probl�me, la profondeur de la technologie des applications d'apprentissage est souvent utilis� pour un algorithme pour �viter surajustement. Si vous aussi prendre en compte les personnes sujettes � surajustement, puis dans une �valuation subjective du mod�le d'apprentissage de la machine, ce probl�me deviendra plus grave. Pensez � combien de fois par semaine, vous devez �valuer les choses des st�r�otypes? Il est beaucoup.

Aujourd'hui, nous pr�senterons trois th�ories diff�rentes qui aident � comprendre le mod�le d'apprentissage machine en forme et sur probl�me de sous-montage.

Il ne fait aucun doute l'efficacit� de notre illusion ou de la fantaisie existe dans l'ensemble de la profondeur des donn�es de formation de l'algorithme d'apprentissage utilis�, ce qui entra�ne une situation plus chaotique. Dans l'�tude des algorithmes d'apprentissage en profondeur instinctivement tenir compte des donn�es, mais souvent oublier les autres �l�ments tout aussi importants: la connaissance.

Dans l'algorithme d'apprentissage en profondeur, les donn�es sont g�n�ralement exprim�es comme un enregistrement durable de l'une ou plusieurs bases de donn�es et connaissances g�n�ralement indiqu� � la r�gle logique peut �tre v�rifi�e dans les donn�es. mod�le d'apprentissage en profondeur utilis� pour en d�duire le m�me domaine peut �tre appliqu� � de nouvelles r�gles de collecte de donn�es. Malheureusement, pour la profondeur des apprenants, une puissante capacit� de calcul et les connaissances ne peuvent pas �tre construits directement produire surapprentissage.

Overfitting pauvres et les probl�mes de montage li�s � la capacit� des mod�les d'apprentissage de la machine � des exemples de formation initiale sur la base des connaissances de construction. Conceptuellement, underfitting et algorithmes d'apprentissage machine ne peut pas �tre d�duite � partir des donn�es de formation initiale efficace des connaissances. En revanche, plus ajust�es et les hypoth�ses cr�er des hypoth�ses trop g�n�rales ou abstraites mais irr�alistes sur le mod�le. En termes simples, le mod�le moins en forme est trop simple et trop souvent un mod�le d'ajustement de l'illusion (imaginez ce qui n'existe pas).

Mod�le Capacit�: mod�les d'apprentissage de la machine pour quantifier plus - en forme et moins en forme des principaux facteurs

Essayez de d�velopper une fa�on simple de comprendre l'algorithme d'apprentissage de la machine est trop en forme et moins en forme.

Une sc�ne d'apprentissage machine typique commence par une premi�re s�rie de donn�es utilis�es pour former et tester les performances de l'algorithme. Les statistiques indiquent que 80% de l'ensemble des donn�es utilis�es pour former le mod�le, les 20% restants ont �t� utilis�s comme test. Dans la phase de formation, les donn�es de formation de sortie de mod�le aura une certaine variation, commun�ment appel�e erreur de formation. De m�me, la d�viation produite au cours de la phase de test est appel� erreur de test. Ainsi, la capacit� de performance des mod�les d'apprentissage de la machine peut �tre r�alis�e selon deux choses fondamentales qui d�termine:

1. R�duire l'erreur de formation

2. r�duire l'�cart entre les erreurs de formation et erreur de test

Ces deux r�gles simples vous aideront � comprendre le plus ajust� et moins en forme. En gros, si un mod�le ne peut pas suivre les r�gles, pas l'erreur de l'ensemble de la formation � un niveau inf�rieur, underfitting se produit.

2 Si le mod�le ne peut pas suivre les r�gles, de sorte que l'�cart entre la formation et l'erreur d'essai et d'erreur est trop grande, surajustement se produit. Got it? Ces deux r�gles simples peuvent nous aider � quantifier les algorithmes d'apprentissage machine surajustement et le niveau underfitting.

Un autre praticiens de l'apprentissage de la machine d'aide concept important de traiter sous ajust� et surajustement est la capacit�. Conceptuellement, la capacit� est exprim�e des mod�les d'apprentissage de la machine peuvent �tre s�lectionn�s ensemble de fonctions pour la solution. Par exemple, la peut �tre un mod�le de r�gression lin�aire de la forme y = w * x + b 1 polyn�me de degr� que l'ensemble des capacit�s (ce qui signifie toutes les solutions possibles).

Ce concept est fortement corr�l�e � la capacit� des mod�les d'apprentissage de la machine. Techniquement, l'algorithme d'apprentissage machine a le mieux perform� lorsque l'entr�e est proportionnelle � la complexit� de l'ensemble des donn�es de formation et sa capacit� � son mandat. des mod�les d'apprentissage machine � faible capacit� � r�soudre des t�ches complexes est peu pratique, tend underfitting. Pendant ce temps, un mod�le de grande capacit� a tendance � surajustement. � cet �gard, la capacit� du mod�le repr�sente une mesure de la tendance des mauvais montage ou d'une mesure surajustement.

Aide � comprendre les trois mod�les d'apprentissage de la machine th�orique sur - forme et moins en forme

Le rasoir d'Occam

Le rasoir d'Occam est l'application de la pens�e philosophique dans l'apprentissage de la machine. Cette philosophie ancienne remonte aux ann�es entre 1287 et 1347, et philosophe Ptol�m�e et d'autres pertinents. La th�orie du rasoir d'Occam sugg�re que, en substance, si une hypoth�se concurrente pour expliquer les observations connues, devraient choisir l'hypoth�se la plus simple. De Sherlock Holmes � Monk, un d�tective de classe mondiale utilisent tous le principe du rasoir d'Occam, suivez la plus simple, hypoth�se la plus logique pour d�couvrir les myst�res complexes.

Le rasoir d'Occam est un des principes philosophiques sages � suivre dans la vie quotidienne, mais son application dans l'apprentissage machine au mieux que conduire � la controverse. D'un point de vue informatique, en raison de ressources algorithme mondial co�teux et notoire, l'hypoth�se est simple cours pr�f�r�. De plus, la simple hypoth�se est plus facile de promouvoir dans les calculs.

Cependant, le d�fi hypoth�tique super simple, est qu'ils sont souvent trop abstraite, pas de mod�liser des sc�narios complexes. Ainsi, un ensemble de formation de mod�le de dimension suffisamment grande et une taille appropri�es doivent �tre choisies hypoth�ses suffisamment complexes, afin de r�duire l'erreur de formation. Cela peut entra�ner une sous-raccord.

dimension VC

Le rasoir d'Occam est un bon principe simplifi�, mais ceux id�al abstrait est pas directement converti en mod�les d'apprentissage machine vivant dans le monde num�rique. algorithmes statistiques pour quantifier la th�orie statistique capacit� propos�e du mod�le et fondateur Vapnik Chervonekis (VC) a soulev� ce d�fi. dimension VC est la valeur maximale possible de m, il existe un ensemble de points de formation x m hypoth�ses diff�rentes, la machine d'apprentissage fonction objective peut marquer arbitrairement le point x m diff�rent.

dimension VC est l'une des pierres angulaires de l'apprentissage statistique, mais aussi de nombreux bases th�oriques int�ressantes. Par exemple, la dimension VC permet d'expliquer l'ensemble de la formation augmente � mesure que la taille de l'�cart entre l'erreur de g�n�ralisation du mod�le d'apprentissage de la machine et erreur de formation diminue, mais avec le mod�le de capacit� de croissance, de m�me que l'augmentation de l'�cart. En d'autres termes, le mod�le a beaucoup plus susceptibles de choisir un ensemble de formation d'hypoth�se � peu pr�s correcte, mais si les hypoth�ses sous-jacentes trop, et peut �ventuellement obtenir les hypoth�ses erron�es.

Pas libre Th�or�me d�jeuner

Il n'y a pas th�or�me de repas gratuit, en moyenne g�n�r� apr�s chaque algorithmes de classification sur un point non observ� pr�c�demment ont le m�me taux d'erreur dans la distribution de toutes les donn�es possibles. Beaucoup de gens sera pas th�or�mes de repas gratuit consid�r�s comme th�orie math�matique des inverseurs de pouss�e, les algorithmes d'apprentissage machine � la limite, nous obligeant � utiliser un ensemble de formation limit�e pour g�n�rer la moiti� du savoir absolu.

Par exemple, dans la logique, les r�gles g�n�rales inf�r�e d'un nombre limit� d'exemples est � illogique �. praticiens de l'apprentissage machine, il n'y a pas de repas gratuit th�or�mes assez prouv� aussi longtemps que observ� dans l'autre sens, il ne serait pas mieux que l'algorithme. En d'autres termes, le r�le du mod�le d'apprentissage de la machine n'est pas rare de trouver une fonction d'apprentissage, mais de trouver mieux adapter � assumer une sc�ne cible.

Surajustement et underfitting reste l'une des applications d'apprentissage de la machine, le plus s�rieux d�fi. dimension VC, et le principe de la th�orie du rasoir d'Occam est pas th�or�mes de repas gratuit pour l'analyse des solutions d'apprentissage de la machine gr�ce � la mise en place et la racine du probl�me de mauvais montage fournit une solide base th�orique. Capacit� � comprendre et mod�le Quantifier d'apprentissage de la machine est encore les �tapes de base pour comprendre ses tendances surajustement et underfitting.

pouces Message attention

Ensemble, nous partageons l'apprentissage et le d�veloppement de l'IA sec

Amnesty International salue l'attention de la pendaison toute la plate-forme de la classe m�diatique � lecture technique de base �

Route de la soie

Apprenez � conna�tre la Chine

La compr�hension de surajustement et moins en forme, ces trois th�ories ne doivent pas �tre contourn�es

Mod�le Capacit�: mod�les d'apprentissage de la machine pour quantifier plus - en forme et moins en forme des principaux facteurs

Aide � comprendre les trois mod�les d'apprentissage de la machine th�orique sur - forme et moins en forme