« Les chevaux run-up du Nord » KDD 2017: Data Mining et apprentissage automatique dans l'analyse de sport

Papier et PPT: http: //www.pitt.edu/~kpele/kdd2017-tutorial.html

Il y a longtemps que je regardais un thème sportif du film « Moneyball », le nom anglais Moneyball. Le film raconte l'histoire de l'équipe de Brad Pitt, directeur général du département d'économie à l'Université de Yale et a obtenu un analyste de données pour les jeux de base-ball par l'exploration de données et l'analyse, la ligue rentable Taobao, les joueurs de l'équipe ont des compétences, alors le succès actes glorieux. Le film a démontré pleinement l'utilisation des données pour améliorer la valeur et l'importance de l'équipe, très impressionnant. Vous avez toujours voulu techniques qui servent à découvrir, et sur le KDD 2017 « Athlytics: Data Mining et d'apprentissage machine pour sport Analytics » Ce sujet est vraiment très approprié.

Cette conférence des KonstantinosPelechrinis (Université de Pittsburgh), EvangelosPapalexakis (Université de Californie, Riverside), Benjamin Alamar (ESPN) trois coopération, du monde universitaire + modèle de l'industrie pour assurer la pratique. Le sujet est encore toute gamme très d'enfants étude, formule plus mathématique, mais le problème est encore relativement peu profonde et les méthodes. Il peut y avoir deux raisons: 1 Avant que les gens ne paient pas suffisamment d'attention à ce domaine, la plupart comptent toujours sur l'expérience des scouts professionnels, 2 ce domaine est d'une grande valeur (prévoir l'autorité sportive 2021 à l'analyse des données de marché de 4,7 milliards. dollars des États-Unis) approche plus professionnelle et plus de valeur ne sont pas divulgués. Des méthodes spécifiques ne va pas les répéter, choisir trois intéressantes à partager, plus peut consulter les liens ppt.

(1) évaluer la force des joueurs: correction des indicateurs positifs et négatifs Plus-moins

Positive et les valeurs négatives est la principale mesure pour évaluer la force des joueurs, plus l'indice, les joueurs signifie plus de capacité. Dans un exemple -5 Anthony, Anthony temps de jeu est dans l'équipe a perdu 5 minutes. Cependant, l'indice ne considérer les avantages et les inconvénients de la présence des points joueurs différence, évidemment il y a beaucoup déraisonnables. Par exemple, la direction du tribunal, ne veut pas dire que tout le monde sur cette coopération réussie à apporter une contribution positive, pour le moins, même si tout le monde a eu une contribution positive, les contributions à faible capacité moindre ne se distingue guère par ces données .

Comment distinguer la contribution de chaque joueur est de gagner l'une des questions clés, le modèle de régression des chercheurs chaque tour au moyen d'un modèle linéaire, est le score de chaque tour, la variable indépendante (IV) sont tous les joueurs de la variable dépendante (DV) le résultat est que chaque joueur retourne à un poids, et ce poids représente une victoire pour les joueurs contribuent. Voici une des variables d'auto-conception intelligentes pour chaque tour, nous présentons les joueurs avec 1 ont indiqué la présence d'autres joueurs est représenté par -1, 0 représenté par d'autres joueurs, pour jouer un tel effet est le tour de la partition et notre présence les joueurs de corrélation positive corrélation négative et la présence d'autres joueurs, et non sans rapport avec la présence des joueurs. Après plusieurs tours modèle d'apprentissage, chaque joueur a un poids de leur propre, a déclaré que la plus grande contribution du joueur à la victoire, et parce que chaque tour, et nous considérons la présence d'autres joueurs là-bas, mais aussi à d'autres joueur d'impact automatiquement pris en compte.

La figure est la NBA 07-08 saison joueurs de Top5 de la tête et la queue, est très délicate, et la plupart des fans de la cognition est tout à fait cohérente.

(2) le résultat prévu du jeu: basé sur le PageRank Sportsnetrank

pagerank Sportsnetrank simplement basé sur l'idée de la modélisation du jeu entre l'équipe pour afficher le nud de l'équipe, le bord est entre le record d'équipe (points) Losing. La figure pagerank puis exécuté sur, peut être obtenu score d'évaluation de la force de chaque équipe, pr valeur plus grande, plus la force de l'équipe, le pourcentage de gain plus élevé. Le chiffre est basé sur la ligue NFL figure construit sur, plus le nud, l'équipe plus forte. Le côté plus rugueux, plus l'écart lorsque le jeu contre.

Prédire l'issue du jeu peut être simplement construit conformément aux poignées figure avant l'enregistrement, puis calculer la force actuelle de chaque équipe. Lorsque les deux équipes ont joué contre une forte résistance à l'équipe prévisionnelle pour la victoire. Une telle stratégie simple, vous pouvez obtenir de très bons résultats, selon les mots d'origine ont été atteints stat de l'art des niveaux de l'auteur.

Ce chiffre est le résultat de la ligue NFL prévisions et les résultats réels de la comparaison, nous pouvons voir très simple.

(3) l'efficacité des tactiques: Essayer d'identifier et d'évaluer

Pick and roll (défense) est la tactique la plus commune de la NBA est de marquer le moyen le plus efficace. Certains chercheurs et expériences afin d'établir un ensemble de routines pour identifier automatiquement choix commun et rouleau système de défense. Utiliser les données de suivi des joueurs SportVU et méthode supervisée d'apprentissage machine, un ensemble de classificateur d'apprentissage, quatre façons de résoudre les pick and roll défense: « Le chemin à travers (plus) », « sans passer par le (sous) », « double équipe ( trap) "" rotations (commutateur) ». signification particulière comme suit:

  • Pressé: balle du défenseur entre la bille et le couvercle, qui est poussé par le biais du couvercle de la partie supérieure;

  • By-pass: la balle entre le ballon et le défenseur ne couvre pas, qui est de la couverture de contourner ci-dessous;

  • Rotations: échange défenseur de balle et de dépistage des objets de défense défenseur;

  • Double-équipe: le défenseur de la balle et le défenseur de couverture qui attaquent la balle.

Les auteurs ont ensuite étiqueté manuellement un certain nombre d'échantillons de quatre types de formation et de construire en outre un classificateur pour trouver plus d'écrans. Les résultats de la reconnaissance finale sont comme suit: Tous les écrans 270,823, "push par" 146314, "by-pass" 69721, "prise de contrôle" 37336 "sandwich" 17451. Une analyse plus poussée de ceux-ci peuvent être quelques-unes des conclusions intéressantes suivantes:

  • Chaque saison, la distribution de quatre types d'écrans sont fondamentalement les mêmes, mais on peut noter que la proportion a légèrement augmenté « double équipe », ce qui indique que la capacité personnelle de marquer plus, double équipe de plus en plus?

  • b. Quelle combinaison ne pas appeler?

    Le tableau ci-dessous compare les différentes combinaisons de visage défendant les pick and roll points Perd chaque tour avec tous les joueurs et la moyenne des points par possession de leur partenaire respectif. - Chris Paul et Blake - Griffin est pressé par l'utilisation de l'effet est l'un des pires, avec une perte moyenne de 1,2 points. En outre Ibaka et Reggie - une combinaison de redéploiement pauvre Jackson, mais leur efficacité est très proche de la défense de pick and roll. [Digression, et dispose désormais d'une combinaison des deux paires ont été divisés, le gestionnaire ne se voit pas cette étude? ]

    Conclusion: Application de la grippe aviaire dans l'industrie du sport ne fait que commencer, il y a de nombreuses applications étonnantes sont déployées ou sur le point de commencer. Les étudiants intéressés peuvent rechercher des informations pertinentes sur leurs propres recherches d'apprentissage. Adresse Diapositives: http: //www.pitt.edu/~kpele/kdd2017-tutorial.html

    Cliquez ici pour lire le message original pour voir les détails, espérons que vous pouvez rejoindre ~

    Il a une nouvelle version de la carte culinaire S'il vous plaît vous connecter Chiang Mai
    Précédent
    La lecture triche | homme-manger agent immobilier: Lorsque ce moment, la maison et l'argent vous avez signé vous appartient pas!
    Prochain
    Je veux attendre une personne, regardant autour le reste de sa vie avec la plus belle neige du monde
    Ces histoires des gens ordinaires nous disent: La vie est plus difficile plus de chance!
    nuisances sonores mettant en danger la sécurité, les utilisateurs: en accordant une attention à la partie Dragster nationale
    « L'intelligence artificielle de jeu Pause DeepMind » AI maintenant regarder à deux minutes, vous pouvez créer des jeux vidéo
    Inde comment forte dépendance sur le pétrole brut iranien? À la suite de la pénurie d'argent, l'Inde ou tomber dans la « pénurie de pétrole »
    Cinq cas vous dire « auto-défense » ainsi défini
    169800 à partir! Élégant et économes en carburant, dont plusieurs joint-venture VUS pleine de personnalité!
    Paris Hong rue le soir Décembre 22, les Etats-Unis et partout
    Entendu une explosion, l'homme se précipita portant une trousse de premiers soins, sauvé sept personnes!
    Il a utilisé la méthode milliards de dollars en retour, vous aide
    Toyota possède standard de 10 voitures, les conducteurs âgés reconnaissent jusqu'à cinq, vous connaissez un peu?
    Ministère de la sécurité publique de souscription de catégorie A