document détaillé: grosses gouttes de données utilisateur pour prédire la destination, le taux exact de plus de 90% | KDD 2017

Lei Feng réseau par AI Technology Review: En 2017, vice-président de la recherche KDD en bit par bit Yejie Ping a l'équipe sur les points de modèle unique et prédire le papier d'optimisation de taxi de destination combinatoires « Un taxi de commande Modèle de répartition basé sur l'optimisation combinatoire » il est inclus. Lei Feng réseau procédera à une interprétation détaillée de cet article.

La lecture des documents

Par rapport à trouver la page que vous voulez dans un moteur de recherche, adapté à un bus vous portant à la destination du véhicule, il sera plus compliqué dans la grande marée dans la voiture. Parce que les pages peuvent continuer à montrer une journée complète, ou même un demi-mois, mais le véhicule se déplace à grande vitesse, la position relative du passager et le conducteur a été sur les changements en temps réel. Processus et appariée également extrêmement important dans une région donnée, les passagers il y a beaucoup de véhicules sont nombreux, les besoins du système à prendre en compte la demande globale de la situation dans la région, la fourniture, la vitesse de milliseconde calculée, la division la plus raisonnable unique en temps réel, Maximisez l'efficacité de l'expérience utilisateur de Voyage Voyage.

Cet article décrit l'utilisation des gouttes de taxi modèle d'optimisation combinatoire basé sur un seul sous Le modèle par rapport aux autres modèles de sous-seule, le taux global de chiffre d'affaires est amélioré. En outre, afin d'améliorer encore l'expérience utilisateur appelé voiture, et a également développé un peu Destination modèle de prédiction Quand l'utilisateur peut ouvrir le logiciel, 2 ms recommandé pour les utilisateurs de l'endroit où il est le plus susceptible de visiter. Cette fonction est maintenant le taux de précision prévu de plus de 90%.

1, un seul sous-optimisation du taux global de rotation

Au début, la distribution de logiciels de commande de taxi de taxi principalement axé sur l'algorithme de corrélation pour chaque commande et chaque chauffeur de taxi. Lorsqu'un passager lancer une seule demande, le système essaiera de correspondre à la distance prévue du conducteur le plus proche, en essayant de faire le plus rapidement possible de le recevoir. Mais les pilotes ont tendance cette fois ignorer si elle est plus approprié pour d'autres commandes.

Auparavant, l'industrie a proposé un nouveau NTuCab modèle basé sur une architecture multi-agents, son but est de réduire au minimum les temps d'attente passagers et la distance Jiejia. Ce modèle donne à chaque agent comme unité de calcul, il correspondra également les commandes de processus de calcul de N et les pilotes, mais une commande ne correspondra un chauffeur de taxi. Si un chauffeur de taxi de refuser l'ordre, le système sera transmis au pilote suivant.

Cependant, ces méthodes sont souvent programmées de temps assez long, le taux de réussite est faible. À cet égard, il tombe Voyage a proposé une nouvelle méthode d'optimisation combinatoire. Dans ce modèle, une commande sera diffusée à plusieurs chauffeurs de taxi, chauffeur de taxi lorsque plusieurs a reçu le même ordre, le premier à saisir une seule personne recevrait des ordres. Si l'ordre est sans réponse, puis entrez le tour suivant de semer seul, jusqu'à ce qu'il soit répondu à des chauffeurs de taxi ou de passagers annulés. L'objectif du modèle est de maximiser le taux de rotation des commandes, afin d'assurer que les conducteurs et les passagers voyagent expérience. Les données expérimentales montrent également qu'un taxi, dans ce modèle taux global de réussite plus élevé de 4% par rapport aux modèles similaires.

Dans les gouttes de modèle dans une amélioration majeure est l'utilisation du concept de « tout », qui sera considéré comme tout-beaucoup comme correspondant l'heure actuelle à attribuer à tous les pilotes et les groupes d'ordre. Afin d'optimiser l'objectif de taux de rotation, l'allocation globale par les conducteurs et les passagers, améliorer le taux de chiffre d'affaires global des passagers des commandes.

Telle est la forme mathématique du modèle:

Qui, max (E) est l'objectif de l'ensemble du modèle d'optimisation, à savoir le taux de rotation, les contraintes g (a) 0 comme un modèle qui doivent être remplies, voici quelques règles d'affaires possibles, comme un pilote ne peut être attribué un ordre à la fois etc, un modèle de la solution, à savoir comment répartir les commandes globales et pilote l'ensemble.

Supposons qu'il y ait ligne n de courant à distribuer, m un chauffeur de taxi à distribuer, alors le résultat de mise en correspondance d'un seul tenant avec le pilote de ligne de distribution à distribuer peut être définie comme une matrice de m * n * n a_m, dont les éléments a_ij les significations suivantes:

Lorsque le i représente l'indice ordre, j au nom du conducteur. Considérant en même temps chaque chauffeur de taxi ne peut diffuser un ordre, pour tout conducteur, qui est, pour chaque j, son au mieux une émission de l'ordre n, qui se manifeste dans la matrice, qui est, pour chaque un j est l'un, apparaît au mieux un « 1 », et le reste doit être tout « 0 » A savoir:

2, la logistique modèle de régression calcule la probabilité d'acceptation de conducteur

Bien que l'objectif et de résoudre le modèle est défini, mais où il y a aussi un facteur clé à prendre en compte la volonté du conducteur d'accepter l'ordre. Le conducteur de la probabilité d'accepter les ordres dépend souvent de nombreux facteurs, tels que la valeur de l'ordre, la distance Jiejia, angle de direction, direction de Voyage et ainsi de suite. Ces informations peuvent être codées dans un vecteur de caractéristique x_ij.

conducteurs Dj probabilité d'acceptation de l'ordre oi avec p_ij, sur le calcul de cette probabilité, l'auteur se fonde sur la méthode de calcul de la publicité estimée dans le modèle de régression logistique utilisant CTR à calculer.

L'analyse en utilisant les données dans le journal du train de régression logistique pour le conducteur d'accepter ou non à y, la fonction de vecteur restant x, le SIGMOD formé de la fonction y = 1 / (1 + exp (-w * x)) du vecteur de poids w. Le conducteur de la probabilité d'acceptation de commandes associés au modèle, la probabilité de rotation est le i-ième ordre:

Alors que l'ensemble du modèle d'optimisation de portefeuille qui est:

Les chercheurs ont mené un test AB à Pékin rigoureux, le modèle de modèle et l'utilisation généralisée des deux autres secteurs ont été comparés, le taux de rotation, la Jiejia moyenne, très longtemps de répondre à des commandes, des affaires et d'autres indicateurs clés taux d'annulation de l'évaluation de base . Les résultats expérimentaux montrent que le modèle a de meilleurs résultats de performance, le taux global de rotation des commandes a augmenté de 4%.

3, la prédiction de destination: Dans le cadre du cycle normal de calcul de probabilité

Dans le froid et l'hiver venteux, ce qui permet aux utilisateurs d'entrer un tremblement de destination, cette expérience n'est pas bon. Si avant que l'utilisateur peut passer des commandes, d'abord il a recommandé à l'utilisateur est le plus susceptible de Voyage souvent peut réduire de manière significative le logiciel d'exploitation de son temps.

plate-forme de bits basée sur de vastes quantités de données historiques, les chercheurs ont constaté, les gens se déplacent, il y a souvent une certaine loi, les utilisateurs ont souvent tendance à atteindre la même destination à la même époque, et la position de l'Ordre de l'analyse, mais aussi d'aider les utilisateurs recommandation précise destination en temps réel.

Sur la base de cette observation, les chercheurs ont utilisé la formule bayésienne pour établir le modèle de distribution de probabilité des objectifs de l'utilisateur:

Dans laquelle T représente l'heure actuelle, D désigne la date, (lat, lng) représentent la latitude et la longitude, {y1, y2, ..., yi, ..., yn} représente la possibilité d'une destination, X représente un temps de départ et la latitude et la longitude. La question qui reste est d'estimer la probabilité des distributions temps et lieu de départ (longitude et latitude):

L'analyse des données historiques a montré que la fréquence du temps de démarrage de l'utilisateur de destination histogrammes est souvent présentée comme une distribution normale, de sorte que les chercheurs ont utilisé des conditions normales pour l'heure de départ T distribution est estimé. Mais comment estimer la répartition des attentes et écart-type, qui devient un besoin de penser problème au sujet.

En tenant compte de la répartition du temps et la latitude et la longitude de cycles ayant, la moyenne et la variance peut être estimée à l'aide des méthodes conventionnelles. Ainsi, les chercheurs ont utilisé le cycle normal, la réalisation d'un modèle d'optimisation, par résolution, nous dérivons la moyenne et la variance attendue.

Un tel écoulement de l'algorithme entier devient: La première commande de l'historique de l'utilisateur, calcule séquentiellement la facturation en temps voulu et de la variance correspondant à chaque destination, puis calculer les données intermédiaires pour chaque destination sur la base du temps courant de probabilité; une troisième étape avec l'enveloppe probabilité bayésienne de chaque trame de destination calcul, pour finaliser la valeur de seuil, le calcul se rencontrent sur les résultats de moût est que les seuils de chercheurs:

Etape 1: Selon l'historique des commandes du client, la facturation estimation de la moyenne et la variance d'un temps de jeu de chaque destination;

Etape 2: L'heure actuelle est calculée pour chaque P de destination (T | X_i) et de la fréquence P (X_i);

Setp3: calculer la probabilité de chaque P de destination (X_i | T)

Etape 4: à déterminer le seuil de support s et le seuil de probabilité p, être le premier à atteindre le seuil de l'écran d'affichage.

Les données montrent que ce modèle expérimental de prédiction était significativement meilleure que le modèle de référence, le modèle avec précision estimée à 93%, plus élevé que le modèle de base 4 points de pourcentage.

Lei Feng réseau Note:

Adresse de l'article: http: //www.kdd.org/kdd2017/papers/view/a-taxi-order-dispatch-model-based-on-combinatorial-optimization

Yao Ming, une famille de trois fille âgée de 8 ans pour visiter Dubaï à des amis: le sujet de haut ses huit ans depuis longtemps j'avais 20 ans Hauteur
Précédent
OPPO se déplace fréquemment récentes ou nouvelle machine être alimentés par la puce Snapdragon 855
Prochain
accident garniture marbre lobby immeuble résidentiel a tué garçon de 8 ans a fracassé
Grain in Ear Training Camp 2018 Tencent ouvert grande leçon: l'intelligence artificielle permettant les changements de contenu
La version officielle de la « cellule de la mort » est maintenant disponible intégré en chinois simplifié
bande-annonce « jeu Brave » exposé « jeu Daguai » Dwayne Johnson a couru pour le président de briser l'auto
Ouvrir projecteur noix merveilleux avantages de la vie dans la vente Jingdong étoiles poly
Quand une puce d'intrus implanté dans le corps 9, « Terminator » venir?
Outre-mer Nouvelles du Matin | Oscar des meilleurs effets visuels annonce de liste, la première exposition unique feuille du festival du film de Berlin
Secret tremblement de formation d'entreprise: à la manipulation de la copie vidéo d'apprentissage, puis tirer la tête enseigner, alors la chirurgie
« Les gens voient le feu », a ajouté l'artiste Valve, ou participer au développement de jeux non publié
Domination « droit de Voyage » est non seulement le Trône de Fer, ainsi que des voûtes en fer
Midday Nouvelles Star | infortunée « comme Yi Chuan » finalement à la télévision: 25 Date de l'Est, l'après-midi du Jiangsu lancement de théâtre, orangistes est arrivé à Doha entrer le lendemain « Un
Code 020210210, jeu dans la classification statistique de l'industrie du sport, la joie et la douleur?