Choisissez quoi? la machine Python apprentissage des comp�tences pratiques

Lei Note du r�seau Feng: Cet article est une compilation du blog de la technologie de groupe de Lei Feng, le titre original de quelques hacks et astuces essentielles pour l'apprentissage machine avec Python, auteur Tirthajyoti Sarkar.

Traduction | Zhao Pengfei Noodlesslee finition | Jiang Fan

Nous ramassons quelques techniques de base pour la pratique de l'apprentissage de la machine avec Python.

Je suis un des �tudiants en sciences informatiques et de la technologie. J'apprends � l'entr�e de la machine / apprentissage en profondeur / AI?

Obtenir l'apprentissage de la machine est jamais une mati�re simple. En plus de maturit� MOOC, sur le r�seau, ainsi que de grandes quantit�s de ressources gratuites Voici quelques-unes utiles pour moi une fois les ressources:

Mise en route de quelques vid�os merveilleuses sur YouTube. Lisez quelques excellents manuels ou des articles. Par exemple, vous lisez � Les algorithmes finaux: l'intelligence artificielle et l'apprentissage de la machine comment remodeler le monde � faire? Et je peux vous garantir que vous serez profond�ment en amour avec ce livre magnifique page sur l'apprentissage de la machine.

Il faut d'abord distinguer clairement entre les termes connexes - apprentissage de la machine, l'intelligence artificielle, la profondeur de l'apprentissage, la science des donn�es, vision par ordinateur, la robotique. Lire ou �couter des experts conf�rences. Regarder Brandon Rohrer vid�o merveilleux, il �tait un des scientifiques de donn�es de force tr�s influents, ces vid�os sont claires sur la diff�rence entre les d�finitions et les concepts de donn�es scientifiques.

Bien conscients de leurs propres objectifs d'apprentissage veulent atteindre. Ensuite, apprendre des cours ou des cours Coursera de l'Universit� de Washington, il est un bon choix.

Regardez un excellent blog: KDnuggets, Mark Meloon blog, est sur les donn�es scientifiques, le blog de Brandon Rohrer, Open le blog AI, la plupart du temps de leurs recherches.

Si vous �tes passionn� de cours Mooc en ligne, vous jetez un oeil � la direction de cet article.

La chose la plus importante est de cultiver un sentiment. Joignez-vous � un bon forum social, �Cependant, pour r�sister � la tentation de se concentrer sur les contenus de titre et des nouvelles sensationnelles. Faites votre propre lecture, pour comprendre ce qu'il est, ce qu'il est pas, il est possible d'aller, quel genre de possibilit�s qu'elle aura. Puis asseyez-vous � penser � la fa�on dont l'apprentissage de la machine ou des principes scientifiques de donn�es � leur travail quotidien. Cr�er un mod�le simple de r�gression pour pr�dire le co�t d'un repas au d�jeuner, ou de t�l�charger des donn�es � partir de votre compagnie d'�lectricit� l�-bas et faire un tableau de s�ries chronologiques simple dans Excel pour trouver une loi de puissance. Une fois que vous �tes compl�tement accro � l'apprentissage de la machine, vous pouvez jeter un oeil � cette vid�o.

Pour l'apprentissage de la machine / AI, Python est un excellent langage?

Sauf si vous �tes un chercheur d'�tude purement th�orique Dr algorithmes complexes prouvent le contraire, vous utiliserez principalement les algorithmes d'apprentissage machine existante, et les appliquer pour r�soudre de nouveaux probl�mes. Cela exige que vous savez comment programmer.

Sur � le meilleur langage de donn�es scientifiques � Il y a beaucoup de controverse. Quand le d�bat chauff� quand arr�ter et de lire cet article perspicace sur vos id�es, jetez un oeil � vos options. Ou, jetez un oeil � l'article de KDnuggets. � l'heure actuelle, on croit g�n�ralement, du d�veloppement au d�ploiement et � la maintenance, Python peut aider les d�veloppeurs plus efficacement. Par rapport � Java, C et C ++, Python syntaxe plus facile et plus avanc�e. Il a une communaut� dynamique, la culture open source, des centaines de biblioth�que d'apprentissage machine de haute qualit�, ainsi que le plein soutien de g�ants de l'industrie (tels que: Google, Dropbox, Airbnb, etc.). Cet article se concentrera sur PythonIt appliqu�e aux comp�tences de base pertinentes dans l'apprentissage de la machine.

Nous devons comprendre et ma�triser la biblioth�que de base

Pour la pratique de l'apprentissage machine plus efficace, vous devez disposer d'une biblioth�que de base Python. Ces biblioth�ques sont bri�vement suit comme.

numpy

abr�viation num�rique Python, NumPy est l'utilisation de la biblioth�que Python de base pour le calcul scientifique et l'analyse des donn�es n�cessaires. Presque tous les outils avanc�s sont bas�s sur Numpy construit, comme Pandas et scikit-learn. Tensorflow utilis� comme �l�ment de base module de r�seau Numpy, sur cette base, l'objet et construit des t�ches d'apprentissage de la profondeur graphflow tenseur. De nombreuses op�rations sont mises en uvre NumPy C, ce qui en fait courir plus vite. les donn�es scientifiques modernes et les t�ches d'apprentissage machine, ceci est un avantage pr�cieux.

pandas

Ceci est une analyse de donn�es � usage g�n�ral Python aspects de calcul scientifique des plus biblioth�ques populaires. Pandas tableau Numpy construit sur la base, pr�servant ainsi le calcul des caract�ristiques de vitesse rapide, et fournit un certain nombre de Ing�nierie dans le domaine des donn�es fonctionnelles Y compris:

donn�es en lecture / �criture dans de nombreux formats diff�rents;
S�lectionn� sous-ensemble de donn�es;
grades Croix du calcul;
Trouvez et remplir les donn�es manquantes;
Les op�rations sont appliqu�es � un ensemble ind�pendant de donn�es;
R�assemble les donn�es sous des formes diff�rentes;
Fusion d'une pluralit� d'ensembles de donn�es;
fonctions de synchronisation avanc�es;
Visualisation par Matplotlib et Seaborn;

Matplotlib et Seaborn

la visualisation des donn�es et des donn�es articul�s est chaque scientifique des donn�es doit avoir les comp�tences de base, et ces comp�tences peuvent transmettre efficacement les informations obtenues � partir de l'analyse. Cette compr�hension et la ma�trise de l'apprentissage de la machine est tr�s important, ainsi que dans votre apprentissage de la machine de flux de travail (ML Pipeline) dans. Avant de d�cider d'un algorithme ML sp�cifique � l'application, vous devez d�finir l'analyse exploratoire des donn�es.

Matplotlib est le plus largement utilis� biblioth�que de visualisation en deux dimensions, qui a un tableau de commande et l'�blouissement d'interface, peut g�n�rer des graphiques de haute qualit� � partir des donn�es. Vous pouvez vous aider � d�marrer Matplotlib.

Seaborn est un autre grand terrain sur des axes biblioth�que de visualisation statistique. L'apprentissage automatique est une valeur praticiens de l'apprentissage. En base Matplotlib, Seaborn fournir API (avec la flexibilit� de style de dessin par d�faut et la couleur de choisir), pour les types de trac�s statistiques communes, il d�finit un simple fonctions de niveau �lev� pour la biblioth�que Pandas en toute transparence. Voici un tutoriel pour Seaborn d�butants.

Des exemples de parcelles Seaborn

Scikit-learn

Scikit-learn est le plus important programme d'apprentissage machine essentiel Python commun. Il prend en charge une vari�t� de classification, les algorithmes de r�gression et de regroupement, y compris soutien machines � vecteurs, des for�ts al�atoires, am�liorer le gradient, k-means et dbscan. Scikit-learn biblioth�que biblioth�que NumPy SciPy peut interagir avec l'op�ration. Il offre une gamme d'algorithmes supervis�s et non supervis�s interface coh�rente. biblioth�que scikit-learn est d�termin� � utiliser un certain degr� de robustesse et de soutenir la pratique de la production. Cela signifie une profonde pr�occupation tels que la facilit� d'utilisation, la qualit� du code, la collaboration, la documentation et les probl�mes de performance. Cela peut para�tre simple introduction � l'apprentissage du vocabulaire de la machine scikit-learn � l'aide. Voici un autre article, d�montre une m�thode simple � l'aide d'un pipeline d'apprentissage machine de scikit-learn. Voici un autre article illustre l'utilisation de scikit-learn textes simples m�thodes d'apprentissage de la machine.

Derri�re le spot lumineux scikit-learn

Pour une foule de d�butants d'apprentissage de la machine et des professionnels exp�riment�s, scikit-learn est tr�s facile � utiliser paquet. Cependant, m�me tr�s praticiens exp�riment�s ML peut ne pas �tre au courant de tous les lieux de lumineux derri�re ce paquet, ils peuvent am�liorer consid�rablement l'efficacit�. J'essaie de montrer la m�thode scikit-learn la / petite interface connue.

pipeline: Il peut �tre conditionn� en une pluralit� d'estimateurs. Traitement des donn�es en g�n�ral au cours d'une s�rie d'�tapes fixes, de sorte qu'il est utile, par exemple, la s�lection des fonctionnalit�s, la classification et la normalisation. Ici ont suivi le cours de compr�hension en profondeur.

Recherche Grille: param�tre Ultra n'est pas directement appris estimateurs param�tres. Ils sont pass�s au constructeur de la classe comme une estimation des param�tres scikit-learn dans. Recherche sur l'espace param�tre afin d'obtenir le meilleur score de validation crois�e sont les pratiques recommand�es et r�alisables. Tous les param�tres � estimer de cette fa�on peut �tre optimis� lors de la construction estimateurs.

V�rifier courbe: Chaque estimateur a ses avantages et ses inconv�nients. erreur de G�n�ralisation peut �tre bas�e sur l'�cart, et la d�composition de la variance du bruit. Il est l'�cart des estimateurs d'erreur moyenne de diff�rents ensembles de formation. Les estimateurs de la variance a dit qu'il devrait changer la fa�on dont la formation sensible. est un attribut de bruit des donn�es. Dessiner un hyper-param�tres individuels dans les scores des ensembles de formation et de validation afin de d�terminer certains param�tres d�passent le montant estim� est d� surajustement ou approche de montage est tr�s utile. Scikit-learn lieu de m�thode int�gr�e ici.

classification des donn�es cod�es � chaud: Ce sont des donn�es tr�s communs de pr�traitement caract�ristique de classement de t�ches pour convertir le binaire d'entr�e codage utilis� pour des t�ches de classification ou de pr�diction (par exemple: le nombre se r�f�re aux caract�ristiques textuelles dop�e et la r�gression logistique). Scikit-learn fournit un moyen puissant et simple � r�aliser le processus mentionn� ci-dessus. Pandas donn�es directement sur le ch�ssis ou le tableau fonctionnement Numpy, facilitant ainsi � l'utilisateur d'�crire de la carte sp�ciale de conversion / appliquer la fonction.

polynomiale de g�n�ration d'entit�: t�ches de mod�lisation de r�gression pour son nombre incalculable, pour augmenter la complexit� du mod�le de caract�ristique non lin�aire lorsque les donn�es d'entr�e est utile. Une fa�on simple et couramment utilis�e consiste � utiliser une fonction polynomiale, les fonctionnalit�s disponibles et plus termes d'interaction de commande. fonction scikit-learn pr�ts � l'emploi, les termes crois�s d'ordre sup�rieur peuvent �tre g�n�r�s en fonction d'un ensemble donn� de caract�ristiques et le polyn�me degr� le plus �lev� s�lectionn� par l'utilisateur.

Data Set Builder: Scikit-learn divers comprend g�n�rateur d'�chantillon al�atoire, pour la construction de la taille des ensemble de donn�es d'artificiel et de la complexit�. Il a la classification des fonctions, le regroupement, la r�gression, la matrice factorisation et une vari�t� de tests.

Pratiquer l'apprentissage machine interactive

En 2014, projet Jupyter IPython est n� du projet, et a �volu� rapidement pour soutenir tous les langages de programmation et de donn�es interactive calcul scientifique portable scientifique. Il ne fait aucun doute pour aider les scientifiques � des donn�es de test rapidement, cr�er des prototypes pour ses / ses id�es, les r�sultats montrent un impact �norme sur des aspects tels que la communaut� open source et ses pairs.

Cependant, uniquement lorsque l'utilisateur aux param�tres du mod�le de contr�le de mani�re interactive et voir imm�diatement l'effet au bon moment (ou presque), l'apprentissage et les donn�es de test ne deviennent vraiment les infiltrer. La plupart sont statiques Jupyter pr�sent�

Mais vous avez besoin de contr�ler plus vous voulez simplement glisser la souris plut�t que de changer le cycle de variable en �crivant pour. Comment faire? Vous pouvez utiliser des plug-ins ipython.

plug-in python est un �l�ment important qui a �t� r�fl�chie par le navigateur, le contr�le des canaux habituellement pr�sents, tels que les curseurs, des zones de texte, etc., en tant que frontal (HTML / JavaScript).

Dans cet article, je d�montrais l'aide d'un simple plug-in � des exercices d'ajustement de la courbe de base compl�te. Les articles suivants seront plus �tendus dans le domaine de la technologie et de l'apprentissage interactif.

cadre d'apprentissage de profondeur

Cet article d�crit les comp�tences importantes pour utiliser Python pour explorer le monde merveilleux de l'apprentissage de la machine. Mais il ne comprend pas, comme tensorflow, Keras ou PyTorch cadre d'apprentissage profond, parce que chacun d'entre eux n�cessite une discussion approfondie. Ici vous pouvez lire quelques grands articles sur le sujet ci-dessus, mais nous allons probablement consacr� � ces cadre magnifique plus tard.

7 grands articles sur tensorflow (Central science des donn�es)
Datacamp tutoriel sur les r�seaux de neurones et l'exemple Keras
AnalyticsVidhya tutoriel sur PyTorch

r�sum�

Tout le contenu de l'article ne peut pas couvrir le th�me de l'apprentissage machine (m�me une petite partie). Cependant, j'esp�re que cet article suscitera votre int�r�t, mais fournit �galement un �cosyst�me Python qui existent d�j� dans un certain cadre puissant de pointeurs clairs pour vous, assurez-vous de commencer votre parcours d'apprentissage machine.

site Blog https://heartbeat.fritz.ai/some-essential-hacks-and-tricks-for-machine-learning-with-python-5478bc6593f2

Lei Feng Lei Feng net net

Route de la soie

Apprenez � conna�tre la Chine

Choisissez quoi? la machine Python apprentissage des comp�tences pratiques