document d�taill�: grosses gouttes de donn�es utilisateur pour pr�dire la destination, le taux exact de plus de 90%

Lei Feng r�seau par AI Technology Review: En 2017, vice-pr�sident de la recherche KDD en bit par bit Yejie Ping a l'�quipe sur les points de mod�le unique et pr�dire le papier d'optimisation de taxi de destination combinatoires � Un taxi de commande Mod�le de r�partition bas� sur l'optimisation combinatoire � il est inclus. Lei Feng r�seau proc�dera � une interpr�tation d�taill�e de cet article.

La lecture des documents

Par rapport � trouver la page que vous voulez dans un moteur de recherche, adapt� � un bus vous portant � la destination du v�hicule, il sera plus compliqu� dans la grande mar�e dans la voiture. Parce que les pages peuvent continuer � montrer une journ�e compl�te, ou m�me un demi-mois, mais le v�hicule se d�place � grande vitesse, la position relative du passager et le conducteur a �t� sur les changements en temps r�el. Processus et appari�e �galement extr�mement important dans une r�gion donn�e, les passagers il y a beaucoup de v�hicules sont nombreux, les besoins du syst�me � prendre en compte la demande globale de la situation dans la r�gion, la fourniture, la vitesse de milliseconde calcul�e, la division la plus raisonnable unique en temps r�el, Maximisez l'efficacit� de l'exp�rience utilisateur de Voyage Voyage.

Cet article d�crit l'utilisation des gouttes de taxi mod�le d'optimisation combinatoire bas� sur un seul sous Le mod�le par rapport aux autres mod�les de sous-seule, le taux global de chiffre d'affaires est am�lior�. En outre, afin d'am�liorer encore l'exp�rience utilisateur appel� voiture, et a �galement d�velopp� un peu Destination mod�le de pr�diction Quand l'utilisateur peut ouvrir le logiciel, 2 ms recommand� pour les utilisateurs de l'endroit o� il est le plus susceptible de visiter. Cette fonction est maintenant le taux de pr�cision pr�vu de plus de 90%.

1, un seul sous-optimisation du taux global de rotation

Au d�but, la distribution de logiciels de commande de taxi de taxi principalement ax� sur l'algorithme de corr�lation pour chaque commande et chaque chauffeur de taxi. Lorsqu'un passager lancer une seule demande, le syst�me essaiera de correspondre � la distance pr�vue du conducteur le plus proche, en essayant de faire le plus rapidement possible de le recevoir. Mais les pilotes ont tendance cette fois ignorer si elle est plus appropri� pour d'autres commandes.

Auparavant, l'industrie a propos� un nouveau NTuCab mod�le bas� sur une architecture multi-agents, son but est de r�duire au minimum les temps d'attente passagers et la distance Jiejia. Ce mod�le donne � chaque agent comme unit� de calcul, il correspondra �galement les commandes de processus de calcul de N et les pilotes, mais une commande ne correspondra un chauffeur de taxi. Si un chauffeur de taxi de refuser l'ordre, le syst�me sera transmis au pilote suivant.

Cependant, ces m�thodes sont souvent programm�es de temps assez long, le taux de r�ussite est faible. � cet �gard, il tombe Voyage a propos� une nouvelle m�thode d'optimisation combinatoire. Dans ce mod�le, une commande sera diffus�e � plusieurs chauffeurs de taxi, chauffeur de taxi lorsque plusieurs a re�u le m�me ordre, le premier � saisir une seule personne recevrait des ordres. Si l'ordre est sans r�ponse, puis entrez le tour suivant de semer seul, jusqu'� ce qu'il soit r�pondu � des chauffeurs de taxi ou de passagers annul�s. L'objectif du mod�le est de maximiser le taux de rotation des commandes, afin d'assurer que les conducteurs et les passagers voyagent exp�rience. Les donn�es exp�rimentales montrent �galement qu'un taxi, dans ce mod�le taux global de r�ussite plus �lev� de 4% par rapport aux mod�les similaires.

Dans les gouttes de mod�le dans une am�lioration majeure est l'utilisation du concept de � tout �, qui sera consid�r� comme tout-beaucoup comme correspondant l'heure actuelle � attribuer � tous les pilotes et les groupes d'ordre. Afin d'optimiser l'objectif de taux de rotation, l'allocation globale par les conducteurs et les passagers, am�liorer le taux de chiffre d'affaires global des passagers des commandes.

Telle est la forme math�matique du mod�le:

Qui, max (E) est l'objectif de l'ensemble du mod�le d'optimisation, � savoir le taux de rotation, les contraintes g (a) 0 comme un mod�le qui doivent �tre remplies, voici quelques r�gles d'affaires possibles, comme un pilote ne peut �tre attribu� un ordre � la fois etc, un mod�le de la solution, � savoir comment r�partir les commandes globales et pilote l'ensemble.

Supposons qu'il y ait ligne n de courant � distribuer, m un chauffeur de taxi � distribuer, alors le r�sultat de mise en correspondance d'un seul tenant avec le pilote de ligne de distribution � distribuer peut �tre d�finie comme une matrice de m * n * n a_m, dont les �l�ments a_ij les significations suivantes:

Lorsque le i repr�sente l'indice ordre, j au nom du conducteur. Consid�rant en m�me temps chaque chauffeur de taxi ne peut diffuser un ordre, pour tout conducteur, qui est, pour chaque j, son au mieux une �mission de l'ordre n, qui se manifeste dans la matrice, qui est, pour chaque un j est l'un, appara�t au mieux un � 1 �, et le reste doit �tre tout � 0 � A savoir:

2, la logistique mod�le de r�gression calcule la probabilit� d'acceptation de conducteur

Bien que l'objectif et de r�soudre le mod�le est d�fini, mais o� il y a aussi un facteur cl� � prendre en compte la volont� du conducteur d'accepter l'ordre. Le conducteur de la probabilit� d'accepter les ordres d�pend souvent de nombreux facteurs, tels que la valeur de l'ordre, la distance Jiejia, angle de direction, direction de Voyage et ainsi de suite. Ces informations peuvent �tre cod�es dans un vecteur de caract�ristique x_ij.

conducteurs Dj probabilit� d'acceptation de l'ordre oi avec p_ij, sur le calcul de cette probabilit�, l'auteur se fonde sur la m�thode de calcul de la publicit� estim�e dans le mod�le de r�gression logistique utilisant CTR � calculer.

L'analyse en utilisant les donn�es dans le journal du train de r�gression logistique pour le conducteur d'accepter ou non � y, la fonction de vecteur restant x, le SIGMOD form� de la fonction y = 1 / (1 + exp (-w * x)) du vecteur de poids w. Le conducteur de la probabilit� d'acceptation de commandes associ�s au mod�le, la probabilit� de rotation est le i-i�me ordre:

Alors que l'ensemble du mod�le d'optimisation de portefeuille qui est:

Les chercheurs ont men� un test AB � P�kin rigoureux, le mod�le de mod�le et l'utilisation g�n�ralis�e des deux autres secteurs ont �t� compar�s, le taux de rotation, la Jiejia moyenne, tr�s longtemps de r�pondre � des commandes, des affaires et d'autres indicateurs cl�s taux d'annulation de l'�valuation de base . Les r�sultats exp�rimentaux montrent que le mod�le a de meilleurs r�sultats de performance, le taux global de rotation des commandes a augment� de 4%.

3, la pr�diction de destination: Dans le cadre du cycle normal de calcul de probabilit�

Dans le froid et l'hiver venteux, ce qui permet aux utilisateurs d'entrer un tremblement de destination, cette exp�rience n'est pas bon. Si avant que l'utilisateur peut passer des commandes, d'abord il a recommand� � l'utilisateur est le plus susceptible de Voyage souvent peut r�duire de mani�re significative le logiciel d'exploitation de son temps.

plate-forme de bits bas�e sur de vastes quantit�s de donn�es historiques, les chercheurs ont constat�, les gens se d�placent, il y a souvent une certaine loi, les utilisateurs ont souvent tendance � atteindre la m�me destination � la m�me �poque, et la position de l'Ordre de l'analyse, mais aussi d'aider les utilisateurs recommandation pr�cise destination en temps r�el.

Sur la base de cette observation, les chercheurs ont utilis� la formule bay�sienne pour �tablir le mod�le de distribution de probabilit� des objectifs de l'utilisateur:

Dans laquelle T repr�sente l'heure actuelle, D d�signe la date, (lat, lng) repr�sentent la latitude et la longitude, {y1, y2, ..., yi, ..., yn} repr�sente la possibilit� d'une destination, X repr�sente un temps de d�part et la latitude et la longitude. La question qui reste est d'estimer la probabilit� des distributions temps et lieu de d�part (longitude et latitude):

L'analyse des donn�es historiques a montr� que la fr�quence du temps de d�marrage de l'utilisateur de destination histogrammes est souvent pr�sent�e comme une distribution normale, de sorte que les chercheurs ont utilis� des conditions normales pour l'heure de d�part T distribution est estim�. Mais comment estimer la r�partition des attentes et �cart-type, qui devient un besoin de penser probl�me au sujet.

En tenant compte de la r�partition du temps et la latitude et la longitude de cycles ayant, la moyenne et la variance peut �tre estim�e � l'aide des m�thodes conventionnelles. Ainsi, les chercheurs ont utilis� le cycle normal, la r�alisation d'un mod�le d'optimisation, par r�solution, nous d�rivons la moyenne et la variance attendue.

Un tel �coulement de l'algorithme entier devient: La premi�re commande de l'historique de l'utilisateur, calcule s�quentiellement la facturation en temps voulu et de la variance correspondant � chaque destination, puis calculer les donn�es interm�diaires pour chaque destination sur la base du temps courant de probabilit�; une troisi�me �tape avec l'enveloppe probabilit� bay�sienne de chaque trame de destination calcul, pour finaliser la valeur de seuil, le calcul se rencontrent sur les r�sultats de mo�t est que les seuils de chercheurs:

Etape 1: Selon l'historique des commandes du client, la facturation estimation de la moyenne et la variance d'un temps de jeu de chaque destination;

Etape 2: L'heure actuelle est calcul�e pour chaque P de destination (T | X_i) et de la fr�quence P (X_i);

Setp3: calculer la probabilit� de chaque P de destination (X_i | T)

Etape 4: � d�terminer le seuil de support s et le seuil de probabilit� p, �tre le premier � atteindre le seuil de l'�cran d'affichage.

Les donn�es montrent que ce mod�le exp�rimental de pr�diction �tait significativement meilleure que le mod�le de r�f�rence, le mod�le avec pr�cision estim�e � 93%, plus �lev� que le mod�le de base 4 points de pourcentage.

Lei Feng r�seau Note:

Adresse de l'article: http: //www.kdd.org/kdd2017/papers/view/a-taxi-order-dispatch-model-based-on-combinatorial-optimization

Route de la soie

Apprenez � conna�tre la Chine

document d�taill�: grosses gouttes de donn�es utilisateur pour pr�dire la destination, le taux exact de plus de 90% | KDD 2017

La lecture des documents

1, un seul sous-optimisation du taux global de rotation

2, la logistique mod�le de r�gression calcule la probabilit� d'acceptation de conducteur

3, la pr�diction de destination: Dans le cadre du cycle normal de calcul de probabilit�