Le but d'écrire cet article, il existe un algorithme commun pour ML une compréhension sens de commun, pas de code, aucune dérivation théorique compliquée, est l'aspect graphique, de savoir ce que ces algorithmes sont, comment ils sont appliqués, des exemples de cette question de la catégorie .
Chaque algorithme peut trouver plusieurs vidéos, choisir de parler le plus intéressant de clarté, la facilité de la science.
Après le temps de faire des algorithmes simples pour analyser en profondeur.
Aujourd'hui est l'analyse syntaxique algorithme comme suit:
1. Arbre
Selon une classification de fonction, chaque nud poser une question, en déterminant si les données sont divisées en deux, puis continuer à poser des questions. Ces questions sont hors de l'étude à partir des données existantes, retapez les nouvelles données, le problème peut être basé sur cet arbre, divise les données aux feuilles appropriées.
2. Forêts Aléatoires
Vidéo: https: //www.youtube.com/watch v = loNcrMjYh64?les données sélectionnées au hasard dans les données de base, la composition de plusieurs sous-ensembles
Matrice S est la source de données, des morceaux de données avec une 1-N, A B C entité est, la dernière catégorie est un C
De manière aléatoire généré par la sous-matrice M S
Cette obtenir l'arbre de M M
Les nouvelles données dans l'arbre de M, le M pour donner les résultats de la classification, comptent le nombre pour voir quel genre de prédiction, il est cette catégorie à la suite de prédiction finale
3. La régression logistique
Vidéo: https: //www.youtube.com/watch v = gNhogKJ_q7U?Lorsque la probabilité de la cible de prédiction d'un tel, pour répondre à la gamme requise est supérieure ou égale à 0 et inférieur ou égal à 1, cette fois un modèle linéaire simple ne peut pas être fait, parce que dans le domaine n'est pas dans une certaine plage, la plage est au-delà la section prédéterminée.
Donc, dans ce cas besoin de façonner un tel modèle serait mieux
Alors, comment obtenez un tel modèle?
Ce modèle nécessite deux conditions est supérieur ou égal à 0, 1 ou moins
Le modèle peut être supérieure ou égale à sélectionner une valeur absolue de 0, la valeur du carré, où la fonction exponentielle, doit être supérieur à 0
Un diviseur de 1, les molécules sont eux-mêmes, plus le dénominateur est 1 lui-même, il doit être inférieur au 1.
Faites ce que la déformation, obtenir le modèle de régression logistique
Elle peut être obtenue en calculant les données de base correspondant au coefficient
Enfin obtenir les graphiques logistique
4. SVM (support vector machine)
Vidéo: https: //www.youtube.com/watch v = 1NxnPkZM9bc?Pour des catégories distinctes, veulent obtenir un super-avion, l'hyperplan optimal est maximisée à deux types de marge, la marge est plane super de son point le plus proche, comme indiqué ci-dessous, Z2 > Z1, hyperplan mieux si vert
Cette hyperplan représenté par une équation linéaire
distance de point calculé selon le plan de la figure formule
Donc obtenir la marge totale d'expression est la suivante, l'objectif est de maximiser la marge, il est nécessaire de minimiser le dénominateur
Ensuite, il devient un problème d'optimisation:
Pour le châtaignier, trois points, pour l'hyperplan optimal défini vecteur de pondération = (2,3) - (1,1)
vecteur de poids est obtenu (a ,. 2A), les deux points dans l'équation, en utilisant du (2,3) = une autre valeur 1, en remplaçant le (1,1) = une autre valeur -1, pour résoudre un et l'ordonnée à l'w0 valeur, et ainsi obtenu expression hyperplan.
Après une chercher, en remplaçant (2A un ,.) est obtenu vecteur de support
Un déficit commercial et substituant l'équation w0 est le support plan machine vecteur
5. Naive Bayes
Vidéo: https: //www.youtube.com/watch v = TpjPzKODuXo?Pour les applications en PNL
Pour un paragraphe de texte, retour à la classification des sentiments, l'attitude de ce texte est positif ou négatif
Pour résoudre ce problème, il vous suffit de regarder quelques-uns des mots
Ce texte sera par un certain nombre de mots et leur nombre ne représente que
question originale est: vous donner un mot, quelle catégorie tombe
Il devient un problème relativement simple facilement obtenu par des règles de Bayes
La question devient, la probabilité de ce type dans cette phrase apparaît à quel point, bien sûr, ne pas oublier les deux autres formules de probabilité
Châtaigne: la probabilité d'occurrence du mot amour dans le cas de positif 0,1, la probabilité dans le cas de négatif 0,001
6. K-voisin le plus proche (k voisins les plus proches)
Vidéo: https: //www.youtube.com/watch v = zHbxbb2ye3E?Administré nouvelles données, les points les plus proches de k dans quelle catégorie et plus, les données appartient à quelle catégorie.
Châtaignes: Distinguer entre un chat et un chien, griffes et son à travers deux longs pour déterminer si, cercle et triangle sont la classification connue, cette étoile représente quel type il
Lorsque 3 k =, ces trois lignes reliant le point est les trois derniers points, puis un peu plus rond, donc cette étoile fait partie d'un chat
7. K-means
Vidéo: https: //www.youtube.com/watch v = zHbxbb2ye3E?Voulez-vous un ensemble de données, divisé en trois catégories, de grande valeur rose, jaune faible valeur
Le plus amusant initialisé, il a choisi la plus simple 3,2,1 que la valeur initiale des différents types de
Le reste des données, chacun avec trois valeurs initiales pour calculer la distance, puis classés en catégories valeur initiale de l'emplacement le plus proche
Après le tri, calculer la moyenne de chaque classe, comme point central d'un nouveau cycle de
Après plusieurs tours, le groupe ne change pas, vous pouvez arrêter
8. Adaboost
Vidéo: https: //www.youtube.com/watch v = rz9dnmHmZsY?AdaBoost est l'une des méthodes de bosting. bosting est le nombre de résultats de la classification ne sont pas bonnes classificateur, pris ensemble, va obtenir un meilleur classificateur effet.
abaisser la figure, à gauche et à droite deux des arbres de décision, pour voir l'effet d'un seul très bon, mais les mêmes données en elle, considérer les deux résultats, il augmentera la crédibilité
châtaignes Adaboost, la reconnaissance de l'écriture manuscrite, sur les fonctions de la carte de dessin peut saisir beaucoup, par exemple, la direction du point de départ, le point de départ et le point final de la distance, etc.
temps de formation, va obtenir le poids de chaque fonction, par exemple, le début du 2 et 3 comme cette fonction pour classer le rôle de la petite, son poids sera plus petite
Et cet angle alpha sur une forte reconnaissance que le droit à présenter le poids sera plus grande, la prédiction finale est le résultat d'un examen complet de ces caractéristiques
9. Neural réseau
Vidéo: https: //www.youtube.com/watch v = CEv_0r5huTY & list = PLjJh1vlSEYgvGod9wWiydumYl8hOXixNu & index = 3?Les réseaux de neurones pour une chute possible dans au moins deux catégories d'entrée
NN neurones de plusieurs couches, et la composition des connexions entre eux, la première couche est une couche d'entrée, la dernière couche est la couche de sortie, la couche cachée et la couche de sortie a sa propre classificateur
est entrée dans le réseau d'entrée est activé, le score calculé est transmis à la couche suivante, suivi par l'activation de la couche nerf, le résultat final représente les noeuds de couche de sortie appartenant à différents types de fractions, pour donner un exemple du résultat de la classification de la classe la figure 1
La même entrée est transmis aux différents noeuds, la raison va obtenir des résultats différents parce que chaque noeud a différents poids et de polarisation, qui est propagation vers l'avant
10. Markov
Vidéo: https: //www.youtube.com/watch v = 56mGTszb_iM?Chaînes de Markov composées par l'état et les transitions
Châtaignier, qui, conformément à la parole du renard brun rapide saute sur le chien paresseux ", pour donner la chaîne de Markov, étapes - donner à chaque mot est mis dans un état, puis en calculant la probabilité de transition entre états
Cette probabilité est calculée à partir de la phrase, quand vous faites les statistiques avec de grandes quantités de texte, vous obtiendrez plus matrice de transition d'état, par exemple, peut être connecté à l'arrière du mot, et la probabilité correspondante
La vie, le résultat d'une méthode alternative d'entrée du clavier est le même principe, le modèle sera plus avancé
Source | Machine Learning Project X