projet d'apprentissage machine doit passer par la souffrance et dix voir par vous-m�me pour passer quelques d�valis�?

Auteur | Richmond Alake

Traducteur | m�nisque

Produit | RPSC (ID: CSDNnews)

br�ve introduction

Avec le d�veloppement de l'apprentissage de la machine et la technologie elle-m�me, impliqu� dans la phase de projet et flux de travail est �galement en croissance.

soutenir GPU l'�mergence des appareils mobiles pour le workflow projet traditionnel d'apprentissage de la machine pr�sente une nouvelle �tape. L'�mergence d'une nouvelle �tape a cr�� un nouveau r�le et la position.

L'objectif de cet article:

Une analyse d�taill�e de chaque �tape du projet d'apprentissage de la machine.

Chaque �tape implique le r�le.

Le r�sultat final d�livr� apr�s la fin de chaque �tape.

Ce qui suit a commenc� � entrer du texte.

D�finition du probl�me

La d�finition du probl�me est la premi�re �tape du projet d'apprentissage vision par ordinateur / machine, l'objectif est de comprendre les besoins de probl�me � r�soudre par l'apprentissage de la machine.

Cette �tape n�cessite g�n�ralement une description du probl�me de pr�ciser les probl�mes � r�soudre sous forme de dossiers, et l'exp�rience personnelle dans diverses sc�nes d�crites en d�tail.

Cette phase a �galement besoin de saisir la solution id�ale du point de vue de ceux qui d�crivent le probl�me.

D�crivez le probl�me peut �tre un client, utilisateur ou coll�gues.

Le produit � ce stade est livr� des documents (word ou pdf), y compris (mais sans s'y limiter) les �l�ments suivants:

Probl�matique

La solution id�ale

Comprendre et mieux comprendre les questions

Exigences techniques

R�les connexes: IT Business Analyst

�tude

Cette �tape est la base pour les phases ult�rieures (planification et r�alisation des travaux de d�veloppement, etc.).

Cette �tape n�cessite l'exploration sous la forme de solutions, mais la recherche aussi la structure des donn�es, le format et les sources d'information.

La compr�hension du probl�me, la solution propos�e et la combinaison des donn�es disponibles qui peuvent nous aider � choisir un des mod�les d'apprentissage machine appropri�e, et, finalement, la solution id�ale.

A ce stade, nous devons �tudier et le mod�le d'algorithmes mat�riels et logiciels n�cessaires pour atteindre afin d'�conomiser beaucoup de temps � un stade ult�rieur.

La sc�ne est livrable documents (Word ou pdf), qui comprend l'�tude de ce qui suit:

structures et sources de donn�es

Sous la forme de solutions

R�seaux de Neurones / architecture mod�le

algorithme

Configuration mat�rielle

Configuration logicielle requise

Related posts: chercheurs d'apprentissage de la machine, les scientifiques de donn�es, chercheur AI.

agr�gation de donn�es / Mines / crawling

Les donn�es sont des applications d'apprentissage machine dynamique et vision par ordinateur. O� l'agr�gation des donn�es est une �tape critique, il peut jeter les bases d'efficacit� et la performance du mod�le.

Il d�finit les donn�es de polym�risation en solution de sortie.

Les donn�es est essentielle pour comprendre les donn�es provenant d'une source peut �tre v�rifi� et analys� � l'aide d'outils statistiques ou des m�thodes de visualisation.

V�rifiez les donn�es pour am�liorer l'int�grit� et la cr�dibilit� des donn�es fournies par une source pour confirmer les donn�es.

L'analyse des donn�es et des travaux d'exploration doivent �galement r�pondre aux exigences suivantes:

besoins de collecte de donn�es suffisamment diversifi�es pour faire en sorte que le pouvoir pr�dictif du mod�le peut �tre adapt� � diff�rentes situations.
Les donn�es recueillies n�cessit� de poursuivre la justice, afin d'assurer que le mod�le correctement r�sum�e dans le raisonnement.
Les donn�es collect�es doivent �tre ad�quates.

Une vari�t� d'outils pour recueillir des donn�es. Les sources de donn�es peuvent �tre API, XML, CSV ou Excel documents et d'autres formes. Dans certains cas, nous avons aussi besoin des donn�es de prises ou de sources en ligne grab. Avant d'explorer, consultez le site Web tiers exploration / politique mini�re.

livrables du fichier de cette phase est un dossier contenant les donn�es d'origine et le fichier d'annotation contient des sous-dossiers.

Related posts: les scientifiques de donn�es, les analystes de donn�es.

Pr�paration des donn�es / Pr�paration / activateur

Pr�traitement �tape est bas�e principalement sp�cifications d'entr�e de donn�es de mod�le. Rappelant la phase de recherche, pensez param�tres � nouveau entr�e et les exigences � l'architecture r�seau mod�le / neurones.

�tape de pr�traitement pour convertir les donn�es brutes en un format qui permet de mod�liser la formation avec succ�s.

pr�traiter les donn�es, y compris (mais sans s'y limiter) les �tapes suivantes:

reformatage des donn�es, comprenant le redimensionnement de l'image pour modifier les canaux de couleur, r�duction de bruit, la mise en valeur d'image
Nettoyage des donn�es
normalisation des donn�es

la mise en valeur des donn�es est une �tape pour am�liorer la diversit� des donn�es a �t� effectu�e. donn�es d'image am�lior�es peuvent prendre les formes suivantes:

L'angle de rotation de l'image d'un arbitraire
Zoom avant ou arri�re
image recadr�e
Retourner l'image (horizontale ou verticale)
soustraction moyenne

Le produit de stade de livraison est un dossier contenant �tiquet� � formation �, � test � et � v�rification � des sous-dossiers et sous-dossiers pour chaque fichier d'annotation.

Emplois connexes: Scientist donn�es

La mise en uvre du mod�le

En g�n�ral, on peut utiliser une vari�t� de mod�le tout fait de ressources en ligne fournies pour simplifier la mise en uvre du mod�le. La plupart des machines et l'apprentissage cadre d'apprentissage en profondeur (par exemple PyTorch ou tensorflow) fournit des mod�les pr�-form�s, ces mod�les peuvent �tre utilis�s pour acc�l�rer la phase de mise en uvre du mod�le.

Celles-ci ont �t� faites par un mod�le pr�-form� sur un ensemble de formation de donn�es puissantes, mais aussi pour atteindre la performance et de la structure de la nouvelle architecture de r�seau de neurones.

En g�n�ral, nous avons rarement besoin de repartir � z�ro mod�le de mise en uvre. Mod�le besoin de phase de mise en uvre pour effectuer les op�rations suivantes:

Supprimer la derni�re couche du r�seau de neurones, le mod�le est modifi� pour utiliser une t�che sp�cifique. Par exemple, pour supprimer la derni�re couche Resnet architecture de r�seau de neurones, au codeur - d�codeur en utilisant le r�seau de neurones a �t� form� dans le mod�le d'architecture.
Peaufinage mod�le de pr�-formation

L'�tape de livraison d'un mod�le de produit est pr�t � effectuer la formation.

Related posts: les scientifiques de donn�es, les ing�nieurs, l'apprentissage machine, ing�nieur de vision informatique, ing�nieurs PNL, ing�nieur AI.

formation

Au cours de la phase de formation, nous utiliserons les donn�es devant des donn�es sur le stade pr�vu pour former le mod�le. la formation du mod�le de mise en uvre comprend les donn�es agr�g�es au mod�le de formation, de cr�er un mod�le capable des t�ches sp�cialis�es.

Les formateurs doivent transmettre les donn�es de formation par lots au mod�le, puis sp�cifiez le nombre d'it�rations �poque. Dans les premiers stades de la formation, la performance et la pr�cision du mod�le peut �tre pas tr�s satisfaisant. Mais la mise en uvre continue des mod�les pr�dictifs, en comparant la valeur pr�dite avec la valeur attendue, et dans le mod�le de r�seau de neurones r�tropropagation peut �tre progressivement am�lior�e, afin de mieux accomplir leurs t�ches.

Avant le d�but de la formation, nous devons d�finir les param�tres et les param�tres super-r�seau pour contr�ler l'efficacit� de la phase de formation du mod�le.

param�tres Super: les valeurs d�finies avant le d�but de la formation du r�seau de neurones. Un r�sultat positif en initialisant contr�le l'apprentissage du r�seau de neurones. Ils auront une incidence sur l'algorithme d'apprentissage machine et la profondeur de l'apprentissage, mais pas affect� par l'algorithme. Leurs valeurs ne changeront pas dans le processus de formation. Les exemples incluent la valeur du param�tre super r�gularisation, le taux d'apprentissage, le nombre de couches et autres.

Param�tres r�seau: Il ne fera pas partie de l'initialisation manuelle du r�seau de neurones. Qui est une valeur � l'int�rieur du r�seau neuronal, directement command� par le r�seau neuronal. Un exemple de param�tres r�seau est � l'int�rieur des poids du r�seau de neurones.

Au cours de la formation, chaque processus de formation et des mesures record pour chaque �poque est tr�s important. En g�n�ral, nous devons recueillir les indicateurs sont comme suit:

Pr�cision de formation
V�rifier l'exactitude
perte de formation
v�rifier la perte

Afin d'organiser et de visualiser les indicateurs de la formation, nous pouvons utiliser Matplotlib et Tensorboard et d'autres outils de visualisation.

Nous pouvons visualiser les indicateurs de formation, d'identifier quelques pi�ges formation des mod�les d'apprentissage de la machine, comme la sous-montage et surajustement.

Underfitting: Lorsque les algorithmes d'apprentissage automatique ne peuvent pas apprendre le mode de jeu de donn�es, il se produira. Nous pouvons utiliser l'algorithme ou mod�le est plus adapt� � la t�che de r�soudre ce probl�me. Et pr�sente �galement des probl�mes pour l'algorithme de r�paration d� en adaptant davantage de donn�es de reconnaissance de caract�ristiques.
Overfitting: Cette question fait r�f�rence � l'algorithme de pr�diction nouveau mod�le, envisager le processus surentra�nement tendance observ�e. Cela peut entra�ner des algorithmes d'apprentissage machine ne peut pas les donn�es avec pr�cision r�sum�es pas vu avant. Si les donn�es de formation ne peuvent pas repr�senter avec pr�cision la distribution des donn�es de test, il peut se produire overfitting. Nous pouvons r�soudre le probl�me de surajustement en r�duisant le nombre de fonctionnalit�s dans les donn�es de formation, et de r�duire la complexit� du r�seau � travers une vari�t� de techniques.

Cette phase est de d�velopper un mod�le de bonne livraison des produits et des indicateurs de formation.

Related posts: les scientifiques de donn�es, les ing�nieurs, l'apprentissage machine, ing�nieur vision informatique, ing�nieurs PNL, ing�nieur AI

�valuer

A ce stade, vous avez un mod�le de formation, nous avons besoin d'�valuer la performance du mod�le.

Nous avons besoin d'utiliser des � donn�es de test � pour �valuer le mod�le. Au cours de la formation, et non pas les donn�es de test pr�sent�es au mod�le. Les donn�es d'essai doivent �tre repr�sentatives des exemples de cas r�els de donn�es.

Nous pouvons utiliser les strat�gies d'�valuation suivantes:

Matrice de confusion (matrice d'erreur): r�sultats fournissent le classement r�el et correspondance visuelle classificateur ou le nombre de non-concordance illustr�. Matrice de confusion est g�n�ralement exprim�e sous la forme d'une table en lignes repr�sentent les observations r�elles et les colonnes repr�sentent les r�sultats du classificateur d'inf�rence.
taux de pr�cision et de rappel: Ces deux sont les indicateurs de performance utilis�s pour �valuer les algorithmes de classification, syst�me de recherche visuelle. Pour �valuer le syst�me de recherche visuelle (bas� sur l'image de requ�te pour trouver des images similaires), par exemple, la pr�cision du nombre de r�sultats pertinents retourn�s peuvent r�fl�chir et des donn�es repr�sentatives de rappel du nombre de r�sultats pertinents retourn� dans les tarifs.

Le produit de stade de livraison est le document qui contient les r�sultats de la production d'�valuation et de la politique d'�valuation.

Related posts: les scientifiques de donn�es, les ing�nieurs, l'apprentissage machine, ing�nieur de vision informatique, ing�nieurs PNL, ing�nieur AI.

Et le r�glage des param�tres inf�r�e

processus d'ajustement des param�tres est optimis�e en modifiant les valeurs de super des param�tres du mod�le. Le but est d'am�liorer le mod�le d'ajustement des param�tres de performance, qui est li�e � l'am�lioration des r�sultats de l'�valuation.

Apr�s avoir r�gl� les param�tres en super et en choisissant une nouvelle valeur, le besoin de former et de re-�valu�.

Ce processus d'ajustement des param�tres se poursuit jusqu'� ce que le mod�le doit g�n�rer appropri�.

Inference est un mod�le de test r�el. Les travaux couverts comprennent des donn�es r�elles obtenues � partir de l'environnement appropri�. A ce stade, nous devons �tre confiants quant � la performance du mod�le.

Le produit de l'�tape de livraison est le mod�le am�lior�.

Related posts: les scientifiques de donn�es, les ing�nieurs, l'apprentissage machine, ing�nieur de vision informatique, ing�nieurs PNL, ing�nieur AI.

Les appareils mobiles pour la transformation du mod�le

Apr�s avoir cr�� un mod�le sonore, nous avons besoin de le mettre sur les appareils mobiles.

Lorsque nous avons besoin d'utiliser le mod�le pour le d�veloppement des dispositifs de bord (tels que les t�l�phones mobiles ou l'Internet des appareils choses), vous devez � la conversion du mod�le.

besoins de transformation du mod�le � �tre form�s dans les mod�les d'apprentissage GPU / CPU machine � l'environnement dans la version optimis�e et efficace. Mod�le simplifi� peut �tre stock� sur l'appareil, mais aussi capable de mani�re efficace et pr�cise inf�r�e.

Nous pouvons utiliser l'outil suivant pour convertir le mod�le � un appareil mobile:

ML de base: Ceci est Apple a publi� le cadre de la cr�ation d'un mod�le pour iOS. CoreML fournit une machine � des t�ches d'apprentissage commun (telles que l'identification et de d�tection) mod�les. Il est la version iOS de tensorflow Lite.
PyTorch Mobile: PyTorch est un cadre d'apprentissage de la machine populaire, et est largement utilis� dans la recherche sur l'apprentissage et de la machine. PyTorch mobile comparable � tensorflow Lite, car il peut convertir le mod�le de formation PyTorch pour la version mobile qui peut �tre utilis� sur les appareils iOS et Android. Cependant, PyTorch Mobile est encore � ses d�buts, est actuellement en essais publi�s.
Tensorflow Lite: utilisation du mod�le tensorflow existant, le convertir afin d'optimiser la version efficace format de fichier .tflite. mod�le simplifi� est tr�s faible, peut �tre stock� sur le dispositif, et peut �tre estim�e avec pr�cision.

Le produit de l'�tape de distribution est un mod�le d'apprentissage automatique est optimis� pour le dispositif.

Related posts: les scientifiques de donn�es, les ing�nieurs, l'apprentissage machine, ing�nieur de vision informatique, ing�nieurs PNL, ing�nieur AI.

mod�le de d�ploiement

Le d�ploiement final du mod�le form� est la derni�re �tape. Notre mod�le sera int�gr� dans une gamme plus large de l'�cosyst�me des applications ou des outils, ou tout simplement construire une interface Web interactive autour de notre mod�le est un d�ploiement de mod�le d'�tape importante.

Dans un environnement de production, cette phase a �galement besoin de suivre le mod�le d'�valuation du rendement. Est d'assurer une bonne performance mod�le, et est la cible tr�s appropri�.

Et mise � jour du recyclage mod�le est un mod�le pour la phase de d�ploiement du travail. mise � jour du mod�le assure que notre mod�le peut r�pondre � la cr�dibilit� et la fiabilit� de la mission.

Les produits de la phase comprennent:

Mod�le syst�me de surveillance des performances

Les fonctions interface utilisateur Web pour acc�der mod�le

le red�ploiement de mod�le de soutien du pipeline d'int�gration continue

Related posts: ing�nieur de donn�es, ing�nieurs, apprentissage machine, ing�nieur de vision informatique, ing�nieurs PNL, ing�nieur AI.

Lien original:

https://towardsdatascience.com/10-stages-of-a-machine-learning-project-in-2020-and-where-you-fit-cb73ad4726cb

Cet article est une traduction de l'article RPSC, s'il vous pla�t indiquer la source.

Route de la soie

Apprenez � conna�tre la Chine

projet d'apprentissage machine doit passer par la souffrance et dix voir par vous-m�me pour passer quelques d�valis�?