Algorithme | interprétation graphique de l'algorithme d'apprentissage machine dix (avec lien vidéo)

Auteur | maître mathématiques Alice, un ancien analystes de coûts Intel, les analystes de données TRIAL Japon, PARTICIPEZ système de recommandation, prévision des ventes, l'analyse des coûts, calculer le nombre de projets tels que la publicité, l'intérêt pour l'apprentissage de la machine, l'apprentissage en profondeur, les données scientifiques, le traitement du langage naturel.

Le but d'écrire cet article, il existe un algorithme commun pour ML une compréhension sens de commun, pas de code, aucune dérivation théorique compliquée, est l'aspect graphique, de savoir ce que ces algorithmes sont, comment ils sont appliqués, des exemples de cette question de la catégorie .

Chaque algorithme peut trouver plusieurs vidéos, choisir de parler le plus intéressant de clarté, la facilité de la science.

Après le temps de faire des algorithmes simples pour analyser en profondeur.

Aujourd'hui est l'analyse syntaxique algorithme comme suit:

  • Arbre de décision
  • algorithme Random Forest
  • La régression logistique
  • SVM
  • Naive Bayes
  • K-algorithme le plus proche voisin de
  • algorithme K-means
  • algorithme Adaboost
  • Réseaux de neurones
  • Markov
  • 1. Arbre

    Selon une classification de fonction, chaque nud poser une question, en déterminant si les données sont divisées en deux, puis continuer à poser des questions. Ces questions sont hors de l'étude à partir des données existantes, retapez les nouvelles données, le problème peut être basé sur cet arbre, divise les données aux feuilles appropriées.

    2. Forêts Aléatoires

    Vidéo: https: //www.youtube.com/watch v = loNcrMjYh64?

    les données sélectionnées au hasard dans les données de base, la composition de plusieurs sous-ensembles

    Matrice S est la source de données, des morceaux de données avec une 1-N, A B C entité est, la dernière catégorie est un C

    De manière aléatoire généré par la sous-matrice M S

    Cette obtenir l'arbre de M M

    Les nouvelles données dans l'arbre de M, le M pour donner les résultats de la classification, comptent le nombre pour voir quel genre de prédiction, il est cette catégorie à la suite de prédiction finale

    3. La régression logistique

    Vidéo: https: //www.youtube.com/watch v = gNhogKJ_q7U?

    Lorsque la probabilité de la cible de prédiction d'un tel, pour répondre à la gamme requise est supérieure ou égale à 0 et inférieur ou égal à 1, cette fois un modèle linéaire simple ne peut pas être fait, parce que dans le domaine n'est pas dans une certaine plage, la plage est au-delà la section prédéterminée.

    Donc, dans ce cas besoin de façonner un tel modèle serait mieux

    Alors, comment obtenez un tel modèle?

    Ce modèle nécessite deux conditions est supérieur ou égal à 0, 1 ou moins

    Le modèle peut être supérieure ou égale à sélectionner une valeur absolue de 0, la valeur du carré, où la fonction exponentielle, doit être supérieur à 0

    Un diviseur de 1, les molécules sont eux-mêmes, plus le dénominateur est 1 lui-même, il doit être inférieur au 1.

    Faites ce que la déformation, obtenir le modèle de régression logistique

    Elle peut être obtenue en calculant les données de base correspondant au coefficient

    Enfin obtenir les graphiques logistique

    4. SVM (support vector machine)

    Vidéo: https: //www.youtube.com/watch v = 1NxnPkZM9bc?

    Pour des catégories distinctes, veulent obtenir un super-avion, l'hyperplan optimal est maximisée à deux types de marge, la marge est plane super de son point le plus proche, comme indiqué ci-dessous, Z2 > Z1, hyperplan mieux si vert

    Cette hyperplan représenté par une équation linéaire

    distance de point calculé selon le plan de la figure formule

    Donc obtenir la marge totale d'expression est la suivante, l'objectif est de maximiser la marge, il est nécessaire de minimiser le dénominateur

    Ensuite, il devient un problème d'optimisation:

    Pour le châtaignier, trois points, pour l'hyperplan optimal défini vecteur de pondération = (2,3) - (1,1)

    vecteur de poids est obtenu (a ,. 2A), les deux points dans l'équation, en utilisant du (2,3) = une autre valeur 1, en remplaçant le (1,1) = une autre valeur -1, pour résoudre un et l'ordonnée à l'w0 valeur, et ainsi obtenu expression hyperplan.

    Après une chercher, en remplaçant (2A un ,.) est obtenu vecteur de support

    Un déficit commercial et substituant l'équation w0 est le support plan machine vecteur

    5. Naive Bayes

    Vidéo: https: //www.youtube.com/watch v = TpjPzKODuXo?

    Pour les applications en PNL

    Pour un paragraphe de texte, retour à la classification des sentiments, l'attitude de ce texte est positif ou négatif

    Pour résoudre ce problème, il vous suffit de regarder quelques-uns des mots

    Ce texte sera par un certain nombre de mots et leur nombre ne représente que

    question originale est: vous donner un mot, quelle catégorie tombe

    Il devient un problème relativement simple facilement obtenu par des règles de Bayes

    La question devient, la probabilité de ce type dans cette phrase apparaît à quel point, bien sûr, ne pas oublier les deux autres formules de probabilité

    Châtaigne: la probabilité d'occurrence du mot amour dans le cas de positif 0,1, la probabilité dans le cas de négatif 0,001

    6. K-voisin le plus proche (k voisins les plus proches)

    Vidéo: https: //www.youtube.com/watch v = zHbxbb2ye3E?

    Administré nouvelles données, les points les plus proches de k dans quelle catégorie et plus, les données appartient à quelle catégorie.

    Châtaignes: Distinguer entre un chat et un chien, griffes et son à travers deux longs pour déterminer si, cercle et triangle sont la classification connue, cette étoile représente quel type il

    Lorsque 3 k =, ces trois lignes reliant le point est les trois derniers points, puis un peu plus rond, donc cette étoile fait partie d'un chat

    7. K-means

    Vidéo: https: //www.youtube.com/watch v = zHbxbb2ye3E?

    Voulez-vous un ensemble de données, divisé en trois catégories, de grande valeur rose, jaune faible valeur

    Le plus amusant initialisé, il a choisi la plus simple 3,2,1 que la valeur initiale des différents types de

    Le reste des données, chacun avec trois valeurs initiales pour calculer la distance, puis classés en catégories valeur initiale de l'emplacement le plus proche

    Après le tri, calculer la moyenne de chaque classe, comme point central d'un nouveau cycle de

    Après plusieurs tours, le groupe ne change pas, vous pouvez arrêter

    8. Adaboost

    Vidéo: https: //www.youtube.com/watch v = rz9dnmHmZsY?

    AdaBoost est l'une des méthodes de bosting. bosting est le nombre de résultats de la classification ne sont pas bonnes classificateur, pris ensemble, va obtenir un meilleur classificateur effet.

    abaisser la figure, à gauche et à droite deux des arbres de décision, pour voir l'effet d'un seul très bon, mais les mêmes données en elle, considérer les deux résultats, il augmentera la crédibilité

    châtaignes Adaboost, la reconnaissance de l'écriture manuscrite, sur les fonctions de la carte de dessin peut saisir beaucoup, par exemple, la direction du point de départ, le point de départ et le point final de la distance, etc.

    temps de formation, va obtenir le poids de chaque fonction, par exemple, le début du 2 et 3 comme cette fonction pour classer le rôle de la petite, son poids sera plus petite

    Et cet angle alpha sur une forte reconnaissance que le droit à présenter le poids sera plus grande, la prédiction finale est le résultat d'un examen complet de ces caractéristiques

    9. Neural réseau

    Vidéo: https: //www.youtube.com/watch v = CEv_0r5huTY & list = PLjJh1vlSEYgvGod9wWiydumYl8hOXixNu & index = 3?

    Les réseaux de neurones pour une chute possible dans au moins deux catégories d'entrée

    NN neurones de plusieurs couches, et la composition des connexions entre eux, la première couche est une couche d'entrée, la dernière couche est la couche de sortie, la couche cachée et la couche de sortie a sa propre classificateur

    est entrée dans le réseau d'entrée est activé, le score calculé est transmis à la couche suivante, suivi par l'activation de la couche nerf, le résultat final représente les noeuds de couche de sortie appartenant à différents types de fractions, pour donner un exemple du résultat de la classification de la classe la figure 1

    La même entrée est transmis aux différents noeuds, la raison va obtenir des résultats différents parce que chaque noeud a différents poids et de polarisation, qui est propagation vers l'avant

    10. Markov

    Vidéo: https: //www.youtube.com/watch v = 56mGTszb_iM?

    Chaînes de Markov composées par l'état et les transitions

    Châtaignier, qui, conformément à la parole du renard brun rapide saute sur le chien paresseux ", pour donner la chaîne de Markov, étapes - donner à chaque mot est mis dans un état, puis en calculant la probabilité de transition entre états

    Cette probabilité est calculée à partir de la phrase, quand vous faites les statistiques avec de grandes quantités de texte, vous obtiendrez plus matrice de transition d'état, par exemple, peut être connecté à l'arrière du mot, et la probabilité correspondante

    La vie, le résultat d'une méthode alternative d'entrée du clavier est le même principe, le modèle sera plus avancé

    Source | Machine Learning Project X

    Shu Li Qingzhao poésie talent comparable, pourquoi elle a été snobé?
    Précédent
    le plus terrifiant rouleau au monde des montagnes de cinq, dont chacun a peur de l'urine
    Prochain
    Les hommes ne se sentent pas à l'aise dans récupérons de lit, l'incarnation de « menteur amour » femme triche 68000 yuans!
    "Voler les voleurs", "voir-dire"? Rechercher
    Vous devez toujours sa lune de miel - célèbre station de lune de miel
    Yinuoqianjin dire est qu'un tel homme! La mort d'un ami, il a été 18 ans révolus pour prendre soin de deux enfants
    Ceux qui construisent « luxure » dans le monde, un film qui est facilement Postcards
    passé Rouge | Novembre sur l'industrie de l'aviation Chang Fei Société Histoire
    Bali nouveau jeu, photographies inédites Voyage possession, les Reds est votre prochain voyage
    Vue d'ensemble | sous-marine technologie sonar, acoustique typique d'eau peu profonde et de l'équipement
    Plusieurs Yen valeur de la police est si élevé, pourquoi serait ri tout le réseau
    Saison dégringolé au Japon, il y a une petite minorité Fam, festival de danse d'été qu'un plaisir de feu d'artifice
    Portez des pantoufles à conduire dans le centre-ville de Hangzhou, ont causé cinq morts et sept blessés au conducteur a mis en accusation
    stratège Ali Zeng Ming: Ma a combattu pendant 16 ans à suivre, je résume les quatre bane d'affaires!