feuilles Tricheur à l'apprentissage de la machine pour résoudre des problèmes difficiles, tout va bien?

Le mot en texte intégral 1848, lorsque l'étude devrait croître de 6 minutes

Source: Pexels

Que vous soyez un débutant d'apprentissage machine ou programmeur intermédiaire, vous pouvez être confus cette question. Comment créer une feuille de triche? Que pouvez-vous apprendre de cet article?

Dans l'apprentissage de la machine, il n'y a pas de solution peut résoudre tous les problèmes. Étant donné que de nombreux types d'algorithmes, il est difficile de trouver l'algorithme droit de résoudre le problème.

Mais ne vous inquiétez pas, dans cet article, nous allons décrire comment utiliser une feuille de triche à la méthode Simplify d'apprentissage machine, vous pouvez utiliser cette antisèche sélectionner l'algorithme droite pour résoudre le problème.

Ce qui suit est une feuille de triche - vous devez savoir sur les techniques d'apprentissage machine.

Guide de Cheat Sheet

Les facteurs à considérer lors de la sélection algorithme

Il y a plusieurs facteurs qui auront une incidence sur votre choix. Certains problèmes sont plus spécifiques et nécessitent des solutions spécialisées. Par exemple, le système de recommandation peut être utilisé pour résoudre de tels problèmes. Alors que certains types de problèmes sont ouverts, mais ils ont besoin tâtonnement d'exclure. L'apprentissage supervisé, la classification et la régression pour résoudre le problème du programme de classe ouverte.

1. Qu'est-ce que vous voulez effectuer des opérations sur les données - classification, régression ou clusters?

2, Taille: dans le choix de l'algorithme, la taille de l'ensemble de données (quelle que soit la taille) est très important.

3, Qualité: votre ensemble de données a changé, que le solde du jeu de données.

4, la nature des données: si nous marquons les données? Comment l'entrée et la sortie modèle de représentation?

5, la disponibilité de temps: combien de temps vous devez dépenser pour construire et entraîner le modèle. Certains modèles peuvent être construits plus rapidement, mais la précision est moins certain.

6, la vitesse ou la précision: Pour le modèle peut être utilisé pour la production, vous pouvez avoir des exigences élevées en matière de précision, mais parfois un travail plus rapide de modèle de calcul assez rapide pour répondre à vos besoins.

Si vous souhaitez utiliser la feuille de triche, vous consultez l'étiquette sur le graphique pour sélectionner, puis déplace la flèche aux questions de réponse. Par exemple:

Si vous voulez réduire le nombre de dimensions et ne nécessite pas des sujets de modélisation, s'il vous plaît utiliser l'APC.

· Si vous voulez prédire la valeur d'une variable, et exige une grande précision, vous devriez essayer d'utiliser les « forêts aléatoires », arbre « réseau de neurones » ou « mise à niveau gradient ».

Si vous ne souhaitez pas effectuer des données de regroupement et marqueurs, vous pouvez utiliser K- le plus proche algorithme de regroupement voisin.

Choisir le bon algorithme

Il est à noter que les scientifiques de données, même expérimentés ne peuvent pas dire quel genre d'algorithme ne cherche pas à l'effet dans le cas d'autres algorithmes meilleurs. Tous les chemins mènent à Rome, il ne peut pas être la seule façon de résoudre le problème de la feuille de triche. La feuille de triche n'espère fournir l'algorithme de guidage qui peut être utilisé sur la base d'un facteur connu pour vous.

Type d'algorithme d'apprentissage automatique

Source: zhihu

1. apprentissage supervisé

algorithme d'apprentissage supervisé qui est sous la supervision directe de l'opération. Nous utilisons les données pour enseigner ou à la machine d'exercice, ce qui signifie que les données est marquée réponse correcte. Elle utilise un algorithme pour analyser les données de formation et les fonctions selon les mappages d'entrée et de sortie. Puis, à partir des données de formation peuvent être résumées en utilisant la fonction de sortie prédite à l'entrée inconnue. est essentiellement utilisé l'apprentissage supervisé deux types de problèmes.

· Catégorie: Dans le problème de classification, vous devez trouver la catégorie des données d'entrée. Par exemple, l'image est classée comme « chien » ou « chat ».

· Régression: Dans les problèmes de régression, la sortie est une valeur réelle. Essayez de prédire la valeur d'une variable en fonction de l'entrée.

2. apprentissage semi-supervisé

L'apprentissage supervisé nécessite des données qui ont été marquées, si personne ne travaille ailleurs sur des projets similaires, devra trouver ou générer ces données peuvent être difficiles. Dans le processus semi-supervisé, nous utiliserons certaines balises avec des données et des données non marquées.

Comme vous pouvez le voir, les données ne sont pas tout à fait marquer, ce qui est la raison pour laquelle on l'appelle l'apprentissage semi-supervisé. En utilisant les données d'étiquette conjointement avec les données non marquées peuvent améliorer la précision du modèle.

3. apprentissage non supervisé

apprentissage non supervisé appliqué aux données sans étiquette. La machine doit identifier sans motifs de données de cas de surveillance, similitudes et les différences, pour effectuer une réduction de clustering et dimensionnalité.

· Cluster: selon certains critères et similitude, les données sont regroupées en un ou plusieurs groupes. Par exemple, selon le comportement d'achat de leur groupe du client.

· Réduction de dimensionnalité: Certaines fonctions ou données de dimension ne peuvent pas être utilisés pour la formation du modèle. L'utilisation de certains algorithmes, nous pouvons éviter de considérer les dimensions et les caractéristiques non pertinentes. Ce processus est appelé réduction de dimensionnalité.

4. Apprentissage par renforcement

agent de renforcement apprentissage peut être optimisé en fonction de la rétroaction à partir de l'environnement. Lorsque la machine est de prendre les bonnes décisions et de punir leurs mauvaises décisions, leurs agents seront récompensés. L'étude n'a pas besoin de données Collect et nous avons dû nettoyer les données. Le système peut être autonome, tentative d'auto-amélioration dans le monde réel. Un programme informatique basé sur l'apprentissage des joueurs renforcement AlphaGO battre d'échecs les plus puissants du monde.

Notes de fin

Source: Pexels

problème d'apprentissage machine peut être résolu de plusieurs façons, vous pouvez choisir l'algorithme en fonction de divers facteurs tels que la précision, l'objectivité, la taille des données et de la nature des données. Vous pouvez également consulter une feuille de triche, et rapidement commencé à construire le modèle. Une fois résolu le problème et obtenir les résultats, vous pouvez explorer plus différents algorithmes pour identifier la meilleure méthode la plus appropriée pour le problème particulier.

pouces Message attention

Ensemble, nous partageons l'apprentissage et le développement de l'IA sec

Tels que réimprimer, s'il vous plaît laisser un message dans les coulisses, se conformer aux normes de réimpression

Aujourd'hui, le son de base | commandes moins nouvelles, des annulations de commandes et plus: Tesla Nordic licenciements massifs
Précédent
En 2020, le programmeur comment faire plus d'argent grâce?
Prochain
Mettez en uvre les meilleures pratiques JavaScript - faites attention pour éviter d'utiliser d'anciennes structures
L'opérateur virgule en JavaScript, un secret peu connu
250 millions de dollars américains du système de transport privé effectivement ressembler?
Aujourd'hui, le son de base | épidémies causées par la surcharge du réseau, le divertissement Internet de l'Europe à sacrifier
Vous devez savoir Python 5 conseils
Longsheng membres du parti du thé et du comté de bénévoles, aide augmentent les revenus des agriculteurs
« La danse de salon reine » Liu Zhen est mort, Fish Leong Janice publié lamenteront
frère néerlandais « Spider-Man » admet la maladie, mais a refusé de faire des tests nouvelle pneumonie couronne
saveur de soja, cellulose, regard au foyer de premier plan de Bohai industrielle stricte machine « à trois niveaux » d'abord pour assurer l'approvisionnement
Un point audio saison Shu Emploi : une fois évoqué l'idée d'abandonner, se sentir soudain si détendu
« Re-lier » re-mapping « Avatar » devrait attendre, ce que des morceaux classiques que vous devez un billet de cinéma?
Luxi: lié bien-off pour le « fournisseur d'électricité Express »