Le mot en texte intégral 1848, lorsque l'étude devrait croître de 6 minutes
Source: Pexels
Que vous soyez un débutant d'apprentissage machine ou programmeur intermédiaire, vous pouvez être confus cette question. Comment créer une feuille de triche? Que pouvez-vous apprendre de cet article?
Dans l'apprentissage de la machine, il n'y a pas de solution peut résoudre tous les problèmes. Étant donné que de nombreux types d'algorithmes, il est difficile de trouver l'algorithme droit de résoudre le problème.
Mais ne vous inquiétez pas, dans cet article, nous allons décrire comment utiliser une feuille de triche à la méthode Simplify d'apprentissage machine, vous pouvez utiliser cette antisèche sélectionner l'algorithme droite pour résoudre le problème.
Ce qui suit est une feuille de triche - vous devez savoir sur les techniques d'apprentissage machine.
Guide de Cheat Sheet
Les facteurs à considérer lors de la sélection algorithme
Il y a plusieurs facteurs qui auront une incidence sur votre choix. Certains problèmes sont plus spécifiques et nécessitent des solutions spécialisées. Par exemple, le système de recommandation peut être utilisé pour résoudre de tels problèmes. Alors que certains types de problèmes sont ouverts, mais ils ont besoin tâtonnement d'exclure. L'apprentissage supervisé, la classification et la régression pour résoudre le problème du programme de classe ouverte.
1. Qu'est-ce que vous voulez effectuer des opérations sur les données - classification, régression ou clusters?
2, Taille: dans le choix de l'algorithme, la taille de l'ensemble de données (quelle que soit la taille) est très important.
3, Qualité: votre ensemble de données a changé, que le solde du jeu de données.
4, la nature des données: si nous marquons les données? Comment l'entrée et la sortie modèle de représentation?
5, la disponibilité de temps: combien de temps vous devez dépenser pour construire et entraîner le modèle. Certains modèles peuvent être construits plus rapidement, mais la précision est moins certain.
6, la vitesse ou la précision: Pour le modèle peut être utilisé pour la production, vous pouvez avoir des exigences élevées en matière de précision, mais parfois un travail plus rapide de modèle de calcul assez rapide pour répondre à vos besoins.
Si vous souhaitez utiliser la feuille de triche, vous consultez l'étiquette sur le graphique pour sélectionner, puis déplace la flèche aux questions de réponse. Par exemple:
Si vous voulez réduire le nombre de dimensions et ne nécessite pas des sujets de modélisation, s'il vous plaît utiliser l'APC.
· Si vous voulez prédire la valeur d'une variable, et exige une grande précision, vous devriez essayer d'utiliser les « forêts aléatoires », arbre « réseau de neurones » ou « mise à niveau gradient ».
Si vous ne souhaitez pas effectuer des données de regroupement et marqueurs, vous pouvez utiliser K- le plus proche algorithme de regroupement voisin.
Choisir le bon algorithme
Il est à noter que les scientifiques de données, même expérimentés ne peuvent pas dire quel genre d'algorithme ne cherche pas à l'effet dans le cas d'autres algorithmes meilleurs. Tous les chemins mènent à Rome, il ne peut pas être la seule façon de résoudre le problème de la feuille de triche. La feuille de triche n'espère fournir l'algorithme de guidage qui peut être utilisé sur la base d'un facteur connu pour vous.
Type d'algorithme d'apprentissage automatique
Source: zhihu
1. apprentissage supervisé
algorithme d'apprentissage supervisé qui est sous la supervision directe de l'opération. Nous utilisons les données pour enseigner ou à la machine d'exercice, ce qui signifie que les données est marquée réponse correcte. Elle utilise un algorithme pour analyser les données de formation et les fonctions selon les mappages d'entrée et de sortie. Puis, à partir des données de formation peuvent être résumées en utilisant la fonction de sortie prédite à l'entrée inconnue. est essentiellement utilisé l'apprentissage supervisé deux types de problèmes.
· Catégorie: Dans le problème de classification, vous devez trouver la catégorie des données d'entrée. Par exemple, l'image est classée comme « chien » ou « chat ».
· Régression: Dans les problèmes de régression, la sortie est une valeur réelle. Essayez de prédire la valeur d'une variable en fonction de l'entrée.
2. apprentissage semi-supervisé
L'apprentissage supervisé nécessite des données qui ont été marquées, si personne ne travaille ailleurs sur des projets similaires, devra trouver ou générer ces données peuvent être difficiles. Dans le processus semi-supervisé, nous utiliserons certaines balises avec des données et des données non marquées.
Comme vous pouvez le voir, les données ne sont pas tout à fait marquer, ce qui est la raison pour laquelle on l'appelle l'apprentissage semi-supervisé. En utilisant les données d'étiquette conjointement avec les données non marquées peuvent améliorer la précision du modèle.
3. apprentissage non supervisé
apprentissage non supervisé appliqué aux données sans étiquette. La machine doit identifier sans motifs de données de cas de surveillance, similitudes et les différences, pour effectuer une réduction de clustering et dimensionnalité.
· Cluster: selon certains critères et similitude, les données sont regroupées en un ou plusieurs groupes. Par exemple, selon le comportement d'achat de leur groupe du client.
· Réduction de dimensionnalité: Certaines fonctions ou données de dimension ne peuvent pas être utilisés pour la formation du modèle. L'utilisation de certains algorithmes, nous pouvons éviter de considérer les dimensions et les caractéristiques non pertinentes. Ce processus est appelé réduction de dimensionnalité.
4. Apprentissage par renforcement
agent de renforcement apprentissage peut être optimisé en fonction de la rétroaction à partir de l'environnement. Lorsque la machine est de prendre les bonnes décisions et de punir leurs mauvaises décisions, leurs agents seront récompensés. L'étude n'a pas besoin de données Collect et nous avons dû nettoyer les données. Le système peut être autonome, tentative d'auto-amélioration dans le monde réel. Un programme informatique basé sur l'apprentissage des joueurs renforcement AlphaGO battre d'échecs les plus puissants du monde.
Notes de fin
Source: Pexels
problème d'apprentissage machine peut être résolu de plusieurs façons, vous pouvez choisir l'algorithme en fonction de divers facteurs tels que la précision, l'objectivité, la taille des données et de la nature des données. Vous pouvez également consulter une feuille de triche, et rapidement commencé à construire le modèle. Une fois résolu le problème et obtenir les résultats, vous pouvez explorer plus différents algorithmes pour identifier la meilleure méthode la plus appropriée pour le problème particulier.
pouces Message attention
Ensemble, nous partageons l'apprentissage et le développement de l'IA sec
Tels que réimprimer, s'il vous plaît laisser un message dans les coulisses, se conformer aux normes de réimpression